211service.com
Kaip kovoti su neapykanta internete
Duomenų mokslininkė Jennifer Chayes mano, kad galime naudoti skaičiavimo įrankius, kad pašalintume blogą elgesį internete.
2021 m. spalio 27 d

Christie There Klok
Dirbdama „Microsoft“ ir akademinėje bendruomenėje Jennifer Chayes stengėsi panaudoti duomenų mokslą ir kompiuteriją, kad dirbtinis intelektas būtų sąžiningesnis ir mažiau šališkas.
Nuo metimo iš mokyklos būdamas 15 metų iki tapimo Kalifornijos universiteto Berklyje duomenų mokslo dojenu, Chayesas turėjo gana didelį karjeros kelią. 1987 m. ji įstojo į UCLA kaip matematikos profesorė. Po dešimties metų „Microsoft“ paskatino ją įkurti savo tarpdisciplininę tyrimų teorijos grupę.
Ši istorija buvo mūsų 2021 m. lapkričio mėn. numerio dalis
- Žr. likusią numerio dalį
- Prenumeruoti
Būtent jos „Microsoft“ laboratorijoje Niujorke tyrėjai aptiko įmonės veido atpažinimo programinės įrangos šališkumą ir parodė, kad sistema baltus veidus klasifikavo tiksliau nei rudus ir juodus veidus. Dėl šios išvados bendrovė atsisakė pelningos sutarties su policijos departamentu ir pradėjo dirbti, kad pašalintų tokių algoritmų šališkumą. The FATE (Sąžiningumas, atskaitomybė, skaidrumas ir etika in AI) grupė buvo sukurtas laboratorijoje.
Anil Ananthaswamy Chayesas, dabartinis Kompiuterijos, duomenų mokslo ir visuomenės skyriaus asocijuotasis provostas ir Berklio informacijos mokyklos dekanas, paklausė, kaip duomenų mokslas keičia skaičiavimą ir kitas sritis.
Kl.: Kaip atrodė perėjimas iš akademinės bendruomenės į pramonę?
A: Tai buvo nemažas šokas. „Microsoft“ tyrimų viceprezidentas Danas Lingas man paskambino, norėdamas įtikinti eiti pokalbio. Kalbėjausi su juo apie 40 minučių. Ir aš galiausiai pasakiau: ar tikrai nori žinoti, kas mane neramina? „Microsoft“ yra paauglių berniukų krūva, ir aš nenoriu leisti savo gyvenimo su krūva paauglių berniukų.
K: Kaip jis į tai reagavo?
A: Jis pasakė: O, ne, mes nesame. Ateik ir susipažink. Lankydamasis ten sutikau keletą neįtikėtinų moterų ir sutikau fenomenaliai atvirų žmonių, kurie norėjo išbandyti dalykus, kad pakeistų pasaulį.
K: Kaip duomenų mokslas pakeitė skaičiavimą?
KAM: Kai gauname daugiau duomenų, kompiuterių mokslas pradėjo žiūrėti į išorę. Aš manau, kad duomenų mokslas yra kompiuterijos, statistikos, etikos ir srities ar disciplinos akcentas, nesvarbu, ar tai būtų biomedicina ir sveikata, klimatas ir tvarumas, ar žmonių gerovė ir socialinis teisingumas ir pan. Tai transformuoja skaičiavimus.
Klausimas: Ar skiriasi duomenų mokslininkų problemų sprendimas?
A: Atsiradus visiems šiems duomenims, turime galimybę mokytis iš duomenų, neturėdami teorijos, kodėl kažkas vyksta. Ypač šiame mašininio mokymosi ir gilaus mokymosi amžiuje tai leidžia daryti išvadas ir prognozuoti be pagrindinės teorijos.
K: Ar tai gali sukelti problemų?
KAM: Kai kurie mano, kad tai problema tais atvejais, kai turite, pavyzdžiui, biomedicininių duomenų. Duomenys labai tiksliai nuspėja, kas veiks ir kas neveiks, be pagrindinio biologinio mechanizmo.
Kl .: kokių nors pranašumų?
KAM: Daugeliu atvejų duomenys leido mums dabar padaryti tai, ką ekonomistas vadintų priešinga situacija, kai iš tikrųjų matote atsitiktinius duomenų pokyčius, leidžiančius daryti išvadas neatlikus eksperimentų. Tai neįtikėtinai naudinga.
Ar tikrai noriu išbandyti skirtingus išsilavinimus skirtingoms populiacijoms? Arba aš noriu pamatyti, [kad] tam tikru momentu buvo atsitiktinė variacija, kuri leis man padaryti tikrai gerą priežastinį ryšį, ir todėl galiu juo pagrįsti politiką?
Kl.: Ar matote duomenų naudojimo problemą, ypač didelėse įmonėse?
A: Yra daugybė problemų. Jį naudoja ne tik technologijų korporacijos. Jį naudoja draudimo bendrovės. Jį naudoja vyriausybės platformos, visuomenės sveikatos platformos ir švietimo platformos. Jei aiškiai nesuprantate, kokie paklaidai gali atsirasti tiek pačiuose duomenų rinkiniuose, tiek algoritmuose, greičiausiai padidinsite šališkumą.
Šie šališkumas atsiranda [kai] nėra daug duomenų. Ir tai taip pat gali būti koreliuojama su kitais veiksniais. Aš asmeniškai dirbau automatiškai interpretuodamas biografijas ir CV. Mums neleidžiama naudoti lyties ar rasės. Net jei nežiūriu į [šiuos] saugomus atributus, [duomenyse] yra daug dalykų, kurie atspindi lytį ar rasę. Jei lankėte tam tikras mokyklas, jei užaugote tam tikruose rajonuose, jei sportavote ir užsiėmėte tam tikra veikla, tai yra susiję [su lytimi ar rase].
Kl.: Ar algoritmai paima šiuos tarpinius serverius?
KAM: Jie tai sustiprina. Turite tai aiškiai suprasti ir aiškiai to neleisti rašydami algoritmą.
K: Kaip galime spręsti tokias problemas?
KAM: Yra visa ši FATE sritis: sąžiningumas, atskaitomybė, skaidrumas ir AI etika, kuri yra šių algoritmų kūrimas ir supratimas, kas jie yra. Tačiau dar daug ką turime padaryti.
Klausimas: O duomenų mokslas padeda?
A: Tai visiškai duomenų mokslas. Yra tinklo dalis, vadinama manosfera, iš kurios kyla daug neapykantos. Tai savotiškai sunku atsekti. Bet jei naudojate natūralios kalbos apdorojimą ir kitus įrankius, galite pamatyti, iš kur jis ateina. Taip pat galite pabandyti sukurti sąsajas, kurios leistų advokatų grupėms ir kitiems tai rasti ir padėti atsikratyti. Tai ne tik sąžiningumas. Tai paverčia lenteles apie tai, kaip šios platformos buvo uzurpuotos, siekiant padidinti šališkumą ir neapykantą, ir sakoma: naudosime kompiuterijos ir duomenų mokslo galią, kad nustatytų ir sumažintume neapykantą.