AI kalbos problema

Mašinos, kurios tikrai supranta kalbą, būtų nepaprastai naudingos. Bet mes nežinome, kaip juos sukurti. 2016 m. rugpjūčio 9 d





Maždaug įpusėjus ypač įtemptam „Go“ žaidimui, kuris vyko Seule, Pietų Korėjoje, tarp vieno geriausių visų laikų žaidėjų Lee Sedol ir „Google“ sukurto dirbtinio intelekto AlphaGo, AI programa padarė paslaptingą žingsnį, kuris parodė nerimą. pranašumą prieš savo žmogiškąjį priešininką.

37 žingsnyje AlphaGo pasirinko padėti juodą akmenį į, iš pradžių atrodytą, juokingą padėtį. Panašu, kad tikrai bus atsisakyta didelės teritorijos – naujoko klaida žaidime, kurio tikslas – valdyti erdvę ant lentos. Du televizijos komentatoriai svarstė, ar jie neteisingai suprato šį žingsnį, ar mašina kaip nors sugedo. Tiesą sakant, priešingai nei įprasta išmintis, 37 žingsnis leistų AlphaGo pastatyti didžiulį pamatą lentos centre. „Google“ programa iš tikrųjų laimėjo žaidimą tokiu žingsniu, kokio joks žmogus nebūtų sugalvojęs.

Apie meną

  • Viena iš priežasčių, kodėl kompiuteriams ir dirbtinio intelekto sistemoms taip sunku suprasti kalbą, yra ta, kad žodžiai dažnai turi reikšmes, pagrįstas kontekstu ir net raidžių bei žodžių išvaizda. Vaizduose, kurie pridedami prie šios istorijos, keli menininkai demonstruoja, kad naudoja įvairius vaizdinius užuominus, kad perteiktų reikšmes, kurios yra daug didesnės nei tikrosios raidės.



35 novatoriai iki 35 m

Ši istorija buvo mūsų 2016 m. rugsėjo mėnesio numerio dalis

  • Žr. likusią numerio dalį
  • Prenumeruoti

„AlphaGo“ pergalė ypač įspūdinga, nes į senovinį „Go“ žaidimą dažnai žiūrima kaip į intuityvaus intelekto išbandymą. Taisyklės gana paprastos. Du žaidėjai pakaitomis deda juodus arba baltus akmenis horizontalių ir vertikalių linijų sankirtoje ant lentos, bandydami apsupti priešininko figūras ir pašalinti jas iš žaidimo. Tačiau gerai žaisti yra neįtikėtinai sunku.

Nors šachmatų žaidėjai gali žiūrėti keliais ėjimais į priekį, „Go“ tai neįmanoma, jei žaidimas neišsiskleidė į nepaprastą sudėtingumą ir nėra klasikinių gambitų. Taip pat nėra aiškaus būdo įvertinti pranašumą, o net patyrusiam žaidėjui gali būti sunku tiksliai paaiškinti, kodėl jis padarė konkretų žingsnį. Dėl to neįmanoma parašyti paprasto taisyklių rinkinio, kurio turi laikytis eksperto lygio kompiuterinė programa.



AlphaGo apskritai nebuvo pasakyta, kaip žaisti Go. Vietoj to programa išanalizavo šimtus tūkstančių žaidimų ir žaidė milijonus rungtynių prieš save. Tarp kelių dirbtinio intelekto metodų buvo naudojamas vis populiaresnis metodas, žinomas kaip gilusis mokymasis, kuris apima matematinius skaičiavimus, įkvėptus labai laisvai, beje, tarpusavyje sujungti neuronų sluoksniai užsidega smegenyse, kai jos mokosi suprasti naują informaciją. Programa mokėsi per kelias valandas praktikos, palaipsniui ugdant intuityvų strategijos jausmą. Tai, kad tuomet pavyko įveikti vieną geriausių pasaulyje „Go“ žaidėjų, yra tikras įvykis mašininio intelekto ir dirbtinio intelekto srityje.

Lawrence'as Weineris
Į jūrą išmestas guminis kamuolys
1970/2014 m

Praėjus kelioms valandoms po 37 ėjimo, „AlphaGo“ laimėjo žaidimą ir pasiekė du žaidimus iki nieko geriausio iš penkių rungtyje. Po to Sedolas stovėjo prieš minią žurnalistų ir fotografų, mandagiai atsiprašydamas, kad nuvylė žmoniją. Aš visai nekalbus, pasakė jis, mirksėdamas per blykstės fotografijos audrą.



Stebėtina AlphaGo sėkmė rodo, kokią didelę pažangą dirbtinio intelekto srityje per pastaruosius kelerius metus buvo padaryta po dešimtmečius trukusio nusivylimo ir nesėkmių, dažnai apibūdinamų kaip AI žiema. Gilus mokymasis reiškia, kad mašinos vis dažniau gali išmokti patys atlikti sudėtingas užduotis, kurioms dar prieš porą metų buvo manoma, kad reikėjo unikalaus žmonių intelekto. Savarankiškai važiuojantys automobiliai jau yra numatoma galimybė. Netolimoje ateityje giluminiu mokymusi pagrįstos sistemos padės diagnozuoti ligas ir rekomenduoti gydymą.

Gilus mokymasis reiškia, kad mašinos vis dažniau gali išmokti patys atlikti sudėtingas užduotis, kurioms dar prieš porą metų buvo manoma, kad reikėjo unikalaus žmonių intelekto.

Vis dėlto, nepaisant šių įspūdingų pažangų, vienas esminis gebėjimas lieka sunkiai suprantamas: kalba. Tokios sistemos kaip „Siri“ ir „IBM Watson“ gali sekti paprastas sakytines arba įvestas komandas ir atsakyti į pagrindinius klausimus, tačiau jos negali palaikyti pokalbio ir iš tikrųjų nesupranta vartojamų žodžių. Kad dirbtinis intelektas būtų tikrai transformuojantis, tai turi pasikeisti.



Nors AlphaGo negali kalbėti, jame yra technologija, kuri gali padėti geriau suprasti kalbą. Tokiose įmonėse kaip „Google“, „Facebook“ ir „Amazon“, taip pat pirmaujančiose akademinėse AI laboratorijose mokslininkai bando pagaliau išspręsti šią, atrodytų, sunkiai įveikiamą problemą, naudodami kai kuriuos tuos pačius AI įrankius, įskaitant gilų mokymąsi, kurie yra atsakingi už AlphaGo sėkmę ir šiandieninis AI atgimimas. Ar jiems pasiseks, priklausys to, kas virs dirbtinio intelekto revoliucija, mastą ir pobūdį. Tai padės nustatyti, ar turime mašinų, su kuriomis galime lengvai bendrauti – mašinų, kurios tampa intymia mūsų kasdienio gyvenimo dalimi, ar dirbtinio intelekto sistemos išlieka paslaptingomis juodosiomis dėžėmis, net ir tada, kai tampa savarankiškesnės. Jokiu būdu negalite turėti į žmones panašios AI sistemos, kurioje nebūtų kalbos, sako Joshas Tenenbaumas, MIT kognityvinių mokslų ir skaičiavimo profesorius. Tai vienas akivaizdžiausių dalykų, išskiriančių žmogaus intelektą.

Galbūt tie patys metodai, leidžiantys AlphaGo užkariauti Go, pagaliau leis kompiuteriams įvaldyti kalbą, o galbūt reikės ir kažko kito. Tačiau nesupratus kalbos, AI poveikis bus kitoks. Žinoma, vis dar galime turėti nepaprastai galingą ir protingą programinę įrangą, tokią kaip AlphaGo. Tačiau mūsų santykiai su AI gali būti daug mažiau bendradarbiaujantys ir galbūt daug mažiau draugiški. Nuo pat pradžių nerimastingas klausimas buvo: „O kas, jei turėtumėte dalykų, kurie būtų protingi, kad būtų veiksmingi, bet nepanašūs į mus, neįsijausdami į tai, kas esame?“ – sako Terry Winograd, Stanfordo universiteto profesorius emeritas. Galite įsivaizduoti mašinas, kurios nėra pagrįstos žmogaus intelektu, kurios yra pagrįstos šiais dideliais duomenimis ir valdo pasaulį.

Mašinų šnabždesiai

Praėjus porai mėnesių po AlphaGo triumfo, nukeliavau į Silicio slėnį – naujausio dirbtinio intelekto bumo šerdį. Norėjau aplankyti tyrėjus, kurie daro nepaprastą pažangą praktikoje taikydami AI ir kurie dabar bando mašinoms geriau suprasti kalbą.

Pradėjau nuo Vinogrado, gyvenančio priemiestyje, esančiame pietiniame Stanfordo universiteto miestelio pakraštyje Palo Alte, netoli nuo Google, Facebook ir Apple būstinės. Garbanotais baltais plaukais ir vešliais ūsais jis atrodo kaip garbingo akademiko atstovas ir turi užkrečiantį entuziazmą.

1968 m. Winogradas dėjo vieną iš pirmųjų pastangų išmokyti mašiną kalbėti protingai. Matematikos vunderkindas, susižavėjęs kalbomis, atvyko į naująją MIT AI laboratoriją studijuoti daktaro laipsnio ir nusprendė sukurti programą, kuri leistų bendrauti su žmonėmis per tekstinį raginimą, naudojant kasdienę kalbą. Tuo metu tai neatrodė svetima ambicija. Neįtikėtini žingsniai buvo daromi dirbtinio intelekto srityje, o kiti MIT kūrė sudėtingas kompiuterinio matymo sistemas ir futuristines robotų rankas. Jis prisimena, kad jautėsi nežinomos, neribotos galimybės.

Džozefas Kosutas
Keturios spalvos Keturi žodžiai
1966 metai

Tačiau ne visi buvo įsitikinę, kad kalbą galima taip lengvai išmokti. Kai kurie kritikai, įskaitant įtakingą kalbininką ir MIT profesorių Noamą Chomsky, manė, kad dirbtinio intelekto tyrėjams bus sunku, kad mašinos suprastų, nes žmonių kalbos mechanika buvo taip menkai suprantama. Winogradas prisimena, kaip dalyvavo vakarėlyje, iš kurio Chomsky mokinys pasišalino, kai išgirdo jį sakant, kad dirba dirbtinio intelekto laboratorijoje.

Tačiau buvo priežasčių būti optimistams. Joseph Weizenbaum, Vokietijoje gimęs MIT profesorius, prieš porą metų sukūrė pačią pirmąją pokalbių roboto programą. Vadinamas ELIZA, jis buvo užprogramuotas veikti kaip animacinis psichoterapeutas, kartodamas pagrindines teiginio dalis arba užduodamas klausimus, skatinančius tolesnį pokalbį. Pavyzdžiui, jei pasakytumėte programai, kad pykstate ant savo mamos, ji pasakytų: „Kas dar ateina į galvą, kai galvojate apie savo mamą? Pigus triukas, bet pavyko stebėtinai gerai. Weizenbaumas buvo šokiruotas, kai kai kurie subjektai pradėjo išpažinti savo tamsiausias paslaptis jo mašinai.

Yra akivaizdi problema taikant gilųjį kalbos mokymąsi. Žodžiai yra savavališki simboliai, todėl jie iš esmės skiriasi nuo vaizdinių.

Winogradas norėjo sukurti kažką, kas, atrodo, tikrai supranta kalbą. Jis pradėjo mažindamas problemos apimtį. Jis sukūrė paprastą virtualią aplinką, blokų pasaulį, susidedantį iš saujos įsivaizduojamų objektų, sėdinčių ant įsivaizduojamo stalo. Tada jis sukūrė programą, kurį pavadino SHRDLU , kuris galėjo išanalizuoti visus daiktavardžius, veiksmažodžius ir paprastas gramatikos taisykles, kurių reikia norint nurodyti šį apleistą virtualų pasaulį. SHRDLU (nesąmoningas žodis, sudarytas iš antrojo klavišų stulpelio Linotype mašinoje) galėtų apibūdinti objektus, atsakyti į klausimus apie jų ryšius ir pakeisti blokų pasaulį, reaguodamas į įvestas komandas. Jis netgi turėjo savotišką atmintį, todėl jei lieptumėte pajudinti raudoną kūgį, o vėliau nurodytumėte kūgį, būtų manyta, kad turėjote omenyje raudoną, o ne kitos spalvos.

SHRDLU buvo laikomas ženklu, kad dirbtinio intelekto sritis daro didelę pažangą. Bet tai buvo tik iliuzija. Kai Winogradas bandė išplėsti programos blokų pasaulį, taisyklės, reikalingos atsižvelgti į būtinus žodžius ir gramatinį sudėtingumą, tapo nevaldomos. Vos po kelerių metų jis pasidavė ir galiausiai visiškai atsisakė dirbtinio intelekto, kad sutelktų dėmesį į kitas tyrimų sritis. Jis sako, kad apribojimai buvo daug artimesni, nei atrodė tuo metu.

Winogradas padarė išvadą, kad naudojant tuomet turimus įrankius mašinoms būtų neįmanoma suteikti tikro kalbos supratimo. Problema, kaip teigė Hubertas Dreyfusas, UC Berkeley filosofijos profesorius, 1972 m. Ko negali padaryti kompiuteriai , yra tai, kad daugeliui dalykų, kuriuos žmonės daro, reikia tam tikro instinktyvaus intelekto, kurio neįmanoma užfiksuoti griežtomis taisyklėmis. Būtent todėl prieš Sedol ir AlphaGo rungtynes ​​daugelis ekspertų abejojo, ar mašinos įvaldys Go.

Džonas Baldesaris
Grynas grožis
1966–68

Tačiau net tuo metu, kai Dreyfusas išsakė šį argumentą, keli tyrinėtojai iš tikrųjų kūrė metodą, kuris ilgainiui mašinoms suteiktų tokio intelekto. Semdamiesi įkvėpimo iš neurologijos, jie eksperimentavo su dirbtiniais neuroniniais tinklais – matematiškai imituotų neuronų sluoksniais, kurie gali būti išmokyti užsidegti reaguojant į tam tikras įvestis. Iš pradžių šios sistemos buvo skausmingai lėtos, o požiūris buvo atmestas kaip nepraktiškas logikai ir samprotavimui. Tačiau labai svarbu, kad neuroniniai tinklai galėtų išmokti daryti dalykus, kurių negalima užkoduoti ranka, o vėliau tai būtų naudinga atliekant paprastas užduotis, pavyzdžiui, atpažinti ranka rašytus simbolius – įgūdį, kuris dešimtajame dešimtmetyje buvo komercializuotas skaitant čekiuose esančius skaičius. Šalininkai teigė, kad neuroniniai tinklai galiausiai leis mašinoms padaryti daug, daug daugiau. Vieną dieną jie tvirtino, kad technologija netgi supras kalbą.

Per pastaruosius kelerius metus neuroniniai tinklai tapo daug sudėtingesni ir galingesni. Šis metodas buvo naudingas dėl pagrindinių matematinių patobulinimų ir, dar svarbiau, greitesnės kompiuterio aparatinės įrangos ir daugybės duomenų. Iki 2009 m. Toronto universiteto mokslininkai įrodė, kad daugiasluoksnis giluminio mokymosi tinklas gali rekordiškai tiksliai atpažinti kalbą. Ir tada 2012 m. ta pati grupė laimėjo mašininio matymo konkursą, naudodama gilaus mokymosi algoritmą, kuris buvo stebėtinai tikslus.

Giliai besimokantis neuroninis tinklas atpažįsta vaizduose esančius objektus naudodamas paprastą triuką. Imituojamų neuronų sluoksnis gauna įvestį vaizdo pavidalu, o kai kurie iš šių neuronų suveikia reaguodami į atskirų pikselių intensyvumą. Gautas signalas praeina per daug daugiau tarpusavyje sujungtų neuronų sluoksnių, kol pasiekia išvesties sluoksnį, kuris signalizuoja, kad objektas buvo matytas. Tinklo neuronų jautrumui reguliuoti, kad būtų gautas teisingas atsakas, naudojama matematinė technika, žinoma kaip atgalinis sklidimas. Būtent šis žingsnis suteikia sistemai galimybę mokytis. Skirtingi tinklo sluoksniai reaguos į tokias funkcijas kaip kraštai, spalvos ar tekstūra. Tokios sistemos dabar gali atpažinti objektus, gyvūnus ar veidus tokiu tikslumu, kuris konkuruoja su žmonėmis.

Yra akivaizdi problema taikant gilųjį kalbos mokymąsi. Žodžiai yra savavališki simboliai, todėl jie iš esmės skiriasi nuo vaizdinių. Pavyzdžiui, du žodžiai gali turėti panašią reikšmę, nors juose gali būti visiškai skirtingos raidės; ir tas pats žodis skirtinguose kontekstuose gali reikšti įvairius dalykus.

Devintajame dešimtmetyje mokslininkai sugalvojo protingą idėją, kaip kalbą paversti tokia problema, kurią gali išspręsti neuroninis tinklas. Jie parodė, kad žodžiai gali būti pavaizduoti kaip matematiniai vektoriai, leidžiantys apskaičiuoti susijusių žodžių panašumus. Pavyzdžiui, valtis ir vanduo yra arti vektorinės erdvės, nors atrodo labai skirtingai. Monrealio universiteto mokslininkai, vadovaujami Yoshua Bengio, ir kita „Google“ grupė pasinaudojo šia įžvalga kurdami tinklus, kuriuose kiekvienas sakinio žodis gali būti panaudotas sudėtingesniam vaizdui sukurti – tai Geoffrey Hintonas, profesorius Toronto universitetas ir garsus giliai besimokantis tyrėjas, ne visą darbo dieną dirbantis „Google“, vadina minties vektoriumi.

Naudojant du tokius tinklus, galima labai tiksliai išversti iš vienos kalbos į kitą. O derinant tokio tipo tinklą su sukurtu atpažinti objektus vaizduose, galima užburti stebėtinai tikėtinus antraštes.

Gyvenimo tikslas

Sėdėdamas konferencijų salėje šurmuliuojančios „Google“ būstinės Mauntin Vju mieste, Kalifornijoje, vienas iš bendrovės tyrėjų, padėjęs sukurti šį metodą, Quoc Le, svarsto mašinos, kuri galėtų palaikyti tinkamą pokalbį, idėją. Le's ambicijos kerta, kodėl kalbantys aparatai gali būti naudingi. Noriu būdo imituoti mintis mašinoje, sako jis. Ir jei norite imituoti mintis, turėtumėte turėti galimybę paklausti mašinos, apie ką ji galvoja.

Tauba Auerbach
Atsakymas / čia nebuvo II
2008 m

„Google“ jau moko savo kompiuterius kalbos pagrindų. Šių metų gegužę bendrovė paskelbė apie sistemą, pavadintą Parsey McParseface, kuri gali žiūrėti į sintaksę, atpažinti daiktavardžius, veiksmažodžius ir kitus teksto elementus. Nesunku suprasti, kokia vertinga įmonei galėtų būti geresnis kalbos supratimas. „Google“ paieškos algoritmas naudojamas tiesiog stebėti raktinius žodžius ir nuorodas tarp tinklalapių. Dabar, naudodama sistemą, pavadintą RankBrain, ji skaito tekstą puslapiuose, siekdama išsiaiškinti prasmę ir pasiekti geresnių rezultatų. Le nori tai padaryti daug toliau. Pritaikęs sistemą, kuri pasirodė naudinga verčiant ir vaizdų antraštėse, jis ir jo kolegos sukūrė išmanųjį atsakymą, kuris nuskaito „Gmail“ pranešimų turinį ir siūlo keletą galimų atsakymų. Jis taip pat sukūrė programą, kuri iš „Google“ IT palaikymo pokalbių žurnalų sužinojo, kaip atsakyti į paprastas technines užklausas.

Visai neseniai Le sukūrė programą, galinčią pateikti priimtinus atsakymus į atvirus klausimus; jis buvo išlavintas, maitinant dialogus iš 18 900 filmų. Kai kurie jo atsakymai atrodo siaubingai tikslūs. Pavyzdžiui, Le paklausė: koks yra gyvenimo tikslas? ir programa atsakė: Tarnauti didesniam gėriui. Tai buvo gana geras atsakymas, prisimena jis su plačia šypsena. Tikriausiai geriau nei būtų buvę mano.

Yra tik viena problema, kuri greitai paaiškėja pažvelgus į daugiau sistemos atsakymų. Kai Le paklausė: Kiek kojų turi katė? jo sistema atsakė: Keturi, manau. Tada jis pabandė: Kiek kojų turi šimtakojis? kuris sukėlė smalsų atsakymą: Aštuoni. Iš esmės „Le’s“ programa nesuvokia, apie ką kalbama. Ji supranta, kad tam tikri simbolių deriniai dera kartu, bet neįvertina realaus pasaulio. Jis nežino, kaip iš tikrųjų atrodo šimtalapis ir kaip jis juda. Tai vis dar tik intelekto iliuzija, be tokio sveiko proto, kurį žmonės laiko savaime suprantamu dalyku. Tokiu būdu giluminio mokymosi sistemos dažnai gali būti sudėtingos. Tas, kurį „Google“ sukūrė vaizdų antraštėms generuoti, padarytų keistų klaidų, pavyzdžiui, gatvės ženklą apibūdintų kaip šaldytuvą, pripildytą maisto.

Le paklausė: koks yra gyvenimo tikslas? ir programa atsakė: Tarnauti didesniam gėriui.

Dėl keisto atsitiktinumo Terry Winograd kaimynas Palo Alte yra tas, kuris gali padėti kompiuteriams geriau suprasti, ką žodžiai iš tikrųjų reiškia. Fei-Fei Li, Stanfordo dirbtinio intelekto laboratorijos direktorė, buvo motinystės atostogų, kai lankiausi, bet ji pakvietė mane į savo namus ir išdidžiai supažindino su savo nuostabiu trijų mėnesių kūdikiu Phoenix. Pažiūrėk, kaip ji į tave žiūri labiau nei į mane, pasakė Li, kai Finiksas spoksojo į mane. Taip yra todėl, kad esate naujokas; tai ankstyvas veido atpažinimas.

Didžiąją savo karjeros dalį Li praleido tyrinėdama mašininį mokymąsi ir kompiuterinę viziją. Prieš kelerius metus ji vadovavo pastangoms sukurti milijonų objektų vaizdų duomenų bazę, kiekvienas pažymėtas atitinkamu raktiniu žodžiu. Tačiau Li mano, kad mašinoms reikia dar sudėtingesnio supratimo apie tai, kas vyksta pasaulyje, ir šiais metais jos komanda išleido dar vieną vaizdų duomenų bazę, komentuotą daug išsamesnėmis detalėmis. Kiekvieną vaizdą žmogus pažymėjo dešimtimis aprašų: šuo važiuoja riedlente, Šuo pūkuotas, banguotas kailis, Kelias įtrūkęs ir pan. Tikimasi, kad mašininio mokymosi sistemos išmoks daugiau suprasti fizinį pasaulį. Smegenų kalbos dalis gauna daug informacijos, įskaitant ir regos sistemą, sako Li. Svarbi AI dalis bus šių sistemų integravimas.

Tai artimesnė vaikų mokymosi būdui, siejant žodžius su objektais, santykiais ir veiksmais. Tačiau analogija su žmogaus mokymusi tęsiasi tik iki šiol. Mažiems vaikams nereikia matyti riedlenčių šuns, kad galėtų jį įsivaizduoti ar žodžiu apibūdinti. Tiesą sakant, Li mano, kad šiandieninių mašinų mokymosi ir dirbtinio intelekto įrankių nepakaks, kad būtų sukurtas tikras AI. Ji sako, kad tai bus ne tik gilus mokymasis, kuriame gausu duomenų. Li mano, kad dirbtinio intelekto tyrėjai turės galvoti apie tokius dalykus kaip emocinis ir socialinis intelektas. Ji sako, kad mes [žmonės] baisiai mokame skaičiuoti su didžiuliais duomenimis, bet puikiai sugebame abstrakciją ir kūrybiškumą.

Niekas nežino, kaip suteikti mašinoms tų žmogiškųjų įgūdžių – jei tai net įmanoma. Ar tokiose savybėse yra kažkas išskirtinai žmogiško, dėl ko jos nepasiekia AI?

Kognityviniai mokslininkai, tokie kaip MIT Tenenbaum, teigia, kad šiandieniniuose neuroniniuose tinkluose trūksta svarbių proto komponentų, kad ir kokie dideli tie tinklai būtų. Žmonės turi galimybę labai greitai mokytis iš santykinai nedidelio duomenų kiekio ir turi integruotą galimybę labai efektyviai modeliuoti pasaulį 3-D formatu. Kalba remiasi kitais gebėjimais, kurie tikriausiai yra paprastesni, kurie atsiranda mažiems kūdikiams, kol jie dar neturi kalbos: vizualiai suvokti pasaulį, veikti mūsų motorines sistemas, suprasti pasaulio fiziką ar kitų agentų tikslus, sako Tenenbaumas.

Jei jis teisus, bus sunku iš naujo sukurti kalbos supratimą mašinose ir AI sistemose, nebandant imituoti žmogaus mokymosi, psichikos modelio kūrimo ir psichologijos.

Pasiaiškinkite

Nojaus Gudmano biuras Stenfordo psichologijos skyriuje yra beveik plikas, išskyrus keletą abstrakčių paveikslų, atremtų į vieną sieną, ir kelis apaugusius augalus. Kai atvykau, Goodmanas rašė nešiojamuoju kompiuteriu basomis kojomis ant stalo. Pasivaikščiojome po saulės nubalintą miestelį išgerti ledinės kavos. Kalba yra ypatinga tuo, kad ji remiasi daugybe žinių apie kalbą, bet taip pat remiasi daugybe sveiko proto žinių apie pasaulį, o šios dvi labai subtiliai dera, aiškino jis.

Goodmanas ir jo mokiniai sukūrė programavimo kalbą, vadinamą Webppl, kuri gali būti naudojama kompiuteriams suteikti tam tikrą tikimybinį sveiką protą, o tai pokalbyje yra gana naudinga. Viena eksperimentinė versija gali suprasti kalambūrą, o kita gali susidoroti su hiperbole. Jeigu bus pasakyta, kad kai kuriems žmonėms staliuko restorane teko laukti amžinai, tai automatiškai nuspręs, kad tiesioginė prasmė yra neįtikima, ir greičiausiai jie tiesiog ilgai sėdėjo ir susierzino. Sistema toli gražu nėra tikrai protinga, tačiau ji parodo, kaip nauji metodai gali padėti sukurti AI programas, kurios kalba gyviau.

Tuo pačiu metu Goodmano pavyzdys taip pat rodo, kaip sunku bus išmokyti mašinas kalbos. Suprasti kontekstinę amžinybės prasmę yra toks dalykas, kurio AI sistemos turės išmokti, tačiau tai gana paprastas ir elementarus pasiekimas.

Noriu būdo imituoti mintis mašinoje, sako jis. Ir jei norite imituoti mintis, turėtumėte turėti galimybę paklausti mašinos, apie ką ji galvoja.

Vis dėlto, nepaisant problemos sudėtingumo ir sudėtingumo, stulbinanti sėkmė, kurią pasiekė mokslininkai, naudodamiesi gilaus mokymosi metodais atpažindami vaizdus ir tobulėdami žaidimuose, tokiuose kaip „Go“, bent jau suteikia vilties, kad galime būti ir ant kalbos proveržio slenksčio. . Jei taip, tie pažanga ateis pačiu laiku. Jei dirbtinis intelektas bus visur naudojamas įrankis, kurį žmonės naudoja siekdami tobulinti savo intelektą ir pasitikėjimą, kad perimtų užduotis sklandžiai bendradarbiaujant, kalba bus labai svarbi. Tai bus ypač aktualu, nes AI sistemos vis dažniau naudoja gilų mokymąsi ir kitus metodus, kad iš esmės programuotų save.

Apskritai, gilaus mokymosi sistemos kelia baimę, sako Johnas Leonardas, MIT profesorius, tyrinėjantis automatinį vairavimą. Tačiau, kita vertus, jų pasirodymą tikrai sunku suprasti.

„Toyota“, tyrinėjanti įvairias savarankiško vairavimo technologijas, MIT inicijavo mokslinių tyrimų projektą, kuriam vadovauja dirbtinio intelekto ir programavimo kalbos ekspertas Geraldas Sussmanas, siekdamas sukurti automatizuotas vairavimo sistemas, galinčias paaiškinti, kodėl jie ėmėsi konkretaus veiksmo. Ir akivaizdus būdas savarankiškai vairuojančiam automobiliui tai padaryti būtų kalbėjimas. Kurti sistemas, kurios žino, ką žino, yra tikrai sudėtinga problema, sako Leonardas, vadovaujantis kitam Toyota remiamam projektui MIT. Bet taip, idealiu atveju jie pateiktų ne tik atsakymą, bet ir paaiškinimą.

Praėjus kelioms savaitėms po grįžimo iš Kalifornijos, pamačiau Davidą Silverį, Google DeepMind tyrėją, sukūrusį AlphaGo, skaitė pranešimą apie rungtynes ​​su Sedol akademinėje konferencijoje Niujorke. Silveris paaiškino, kad kai programa sugalvojo savo žudiką per antrąjį žaidimą, jo komanda buvo taip pat nustebusi, kaip ir visi kiti. Viskas, ką jie galėjo matyti, buvo AlphaGo numatyta laimėjimo tikimybė, kuri mažai pasikeitė net po 37 ėjimo. Tik po kelių dienų, po kruopščios analizės, Google komanda padarė atradimą: suvirškinusi ankstesnius žaidimus, programa apskaičiavo tikimybę Žmogus žaidėjas atlieka tą patį ėjimą vienu iš 10 000. Praktiniai žaidimai taip pat parodė, kad žaidimas suteikė neįprastai stiprų pozicinį pranašumą.

Taigi tam tikra prasme mašina žinojo, kad Sedolas bus visiškai užmerktas.

Silveris teigė, kad „Google“ svarsto keletą technologijų komercializavimo galimybių, įskaitant tam tikrą intelektualų asistentą ir sveikatos priežiūros įrankį. Vėliau paklausiau jo apie tai, kaip svarbu bendrauti su tokių sistemų AI. Tai įdomus klausimas, pasakė jis po pauzės. Kai kurioms programoms tai gali būti svarbu. Kaip ir sveikatos priežiūros srityje, gali būti svarbu žinoti, kodėl priimamas sprendimas.

Iš tiesų, dirbtinio intelekto sistemoms tampant vis sudėtingesnėmis ir sudėtingesnėmis, sunku įsivaizduoti, kaip su jomis bendradarbiausime be kalbos – negalėdami jų paklausti: Kodėl? Negana to, galimybė be vargo bendrauti su kompiuteriais padarytų juos be galo naudingesnius ir jaustųsi tiesiog stebuklingai. Juk kalba yra mūsų galingiausias būdas suvokti pasaulį ir su juo bendrauti. Atėjo laikas mūsų mašinoms
pasivijo.

Willas Knightas yra AI ir robotikos vyresnysis redaktorius MIT technologijų apžvalga . Jo filmas „Žmonių robotai“ pasirodė gegužės-birželio mėn.

paslėpti