211service.com
Smalsumas gali būti gyvybiškai svarbus tikrai protingam AI

Ponas. tech
Kompiuterinis algoritmas, aprūpintas dirbtinio smalsumo forma, gali išmokti išspręsti sudėtingas problemas net tada, kai iš karto nėra aišku, kokie veiksmai gali padėti pasiekti šį tikslą.
Kalifornijos universiteto Berklio tyrėjai sukūrė vidinio smalsumo modelį, kad jų mokymosi algoritmas veiktų net tada, kai nėra stipraus grįžtamojo ryšio signalo. Šios komandos sukurtas smalsumo modelis rodo, kad AI programinė įranga, valdanti virtualų agentą vaizdo žaidime, siekia maksimaliai suprasti jo aplinką ir ypač jai įtakos turinčius aplinkos aspektus. Anksčiau buvo stengiamasi paskatinti dirbtinio intelekto agentus smalsumą, tačiau jie veikė supaprastintu būdu.
Ši gudrybė gali padėti išspręsti šiuolaikinių galingiausių mašininio mokymosi metodų trūkumą ir parodyti būdus, kaip mašinas geriau spręsti realaus pasaulio problemas.
Apdovanojimai realiame pasaulyje yra labai menki, sako Pulkit Agrawal , UC Berkeley doktorantas, kuris kartu su kolegomis atliko tyrimą. Kūdikiai atlieka visus šiuos atsitiktinius eksperimentus, ir jūs galite tai galvoti kaip apie savotišką smalsumą. Jie mokosi tam tikrų įgūdžių.
Dėl kelių galingų mašininio mokymosi metodų pastaraisiais metais mašinos tapo išmanesnės. Be to, metodas, žinomas kaip sustiprinimo mokymasis, leido mašinoms atlikti dalykus, kuriuos būtų sunku apibrėžti kode. Stiprinamasis mokymasis apima teigiamo atlygio naudojimą nukreipiant algoritmo elgesį siekiant konkretaus tikslo (žr. 10 Breakthrough Technologies 2017: Stiprinamasis mokymasis).
Pastiprinimo mokymasis buvo pagrindinė dalis AlphaGo , programa, kurią sukūrė DeepMind , žaisti abstraktų ir sudėtingą stalo žaidimą Eik su neįtikėtinais įgūdžiais. Ši technika dabar tiriama kaip būdas įtaisyti kitus įgūdžius, kurių gali būti neįmanoma užkoduoti rankiniu būdu. Pavyzdžiui, tai gali padėti roboto rankai pačiam išsiaiškinti, kaip atlikti norimą darbą.
Tačiau stiprinamasis mokymasis turi savo apribojimų. Agrawal pažymi, kad norint išmokti užduotį, dažnai reikia daug treniruotis, o procesas gali būti sudėtingas, jei reikiamų atsiliepimų nėra iš karto. Pavyzdžiui, šis metodas netinka kompiuteriniams žaidimams, kuriuose tam tikro elgesio pranašumai nėra akivaizdūs. Štai kur smalsumas galėtų padėti.
Tyrėjai išbandė šį metodą, kartu su mokymusi sustiprinti, naudodami du paprastus vaizdo žaidimus: Mario Bros., klasikinį platformos žaidimą, ir VizDoom, pagrindinį 3D šaudyklės pavadinimą.
Abiejuose žaidimuose panaudojus dirbtinį smalsumą mokymosi procesas tapo efektyvesnis. Pavyzdžiui, 3-D žaidime agentas, užuot praleidęs per daug laiko atsitrenkdamas į sienas, judėjo aplink savo aplinką, mokydamasis greičiau naršyti. Net ir be jokio kito atlygio agentas stebėtinai gerai sugebėjo naršyti abiejuose žaidimuose. Mario Bros. jis išmoko išvengti nužudymo, nes tai sumažino jo gebėjimą tyrinėti aplinką ir sužinoti apie ją.
KAM popierius aprašantis tyrimą bus paskelbtas pagrindinėje AI konferencija vėliau Šiais metais.
Dirbtinis smalsumas jau kurį laiką buvo aktyvi tyrimų sritis. Pierre'as-Yvesas Oudeyeris , tyrimų direktorius Prancūzijos kompiuterių mokslo ir automatikos tyrimų institutas , per pastaruosius kelerius metus buvo pradininkas kuriant kompiuterines programas ir robotus, kurie demonstruoja paprastas smalsumo formas.
Šiuo metu labai įdomu tai, kad šios idėjos, kurias tiek pagrindiniai AI, tiek neuromokslų tyrinėtojai laikė „egzotiškomis“, dabar tampa pagrindine AI ir neurologijos tema, sako Oudeyeris.
Darbas gali turėti realios praktinės naudos. UC Berkeley komanda nori išbandyti tai su robotais, kurie naudoja sustiprinimo mokymąsi, kad išsiaiškintų, kaip elgtis, pavyzdžiui, sugriebti nepatogius objektus. Agrawal sako, kad robotai gali sugaišti daug laiko atlikdami atsitiktinius gestus. Jis sako, kad turėdamas įgimtą smalsumą, toks robotas turėtų greičiau tyrinėti aplinką ir eksperimentuoti su šalia esančiais objektais.
Brendeno ežeras Niujorko universiteto mokslininkas, kuriantis žmogaus pažintinių gebėjimų skaičiavimo modelius, teigia, kad darbas atrodo daug žadantis. Panašių savybių mašinų kūrimas yra svarbus žingsnis kuriant mašinas, kurios mokosi ir mąsto kaip žmonės, sakė jis el. Labai įspūdinga, kad naudodamas tik smalsumo skatinamą mokymąsi agentas gali išmokti naršyti Mario lygiu. Agentas net nežiūri į žaidimo rezultatą.
Tuo pačiu metu, sako Lake, naujosios programos rodomas smalsumas iš tikrųjų labai skiriasi nuo, tarkime, vaiko. Žmonės linkę rodyti daug gilesnį susidomėjimą savo pasauliu, sako jis.
Tai labai egocentriška smalsumo forma, sako Lake. Agentui rūpi tik jo aplinkos ypatybės, susijusios su jo paties veiksmais. Žmonės yra smalsesni plačiau. Žmonės nori sužinoti apie pasaulį mažiau tiesiogiai su jų pačių veiksmais susijusiais būdais.