„Facebook“ kuria programinę įrangą, atitinkančią veidus beveik taip pat, kaip ir jūs

Paklaustas, ar dviejose nepažįstamose veidų nuotraukose pavaizduotas tas pats asmuo, žmogus 97,53 proc. Nauja „Facebook“ tyrėjų sukurta programinė įranga gali surinkti 97,25 proc. to paties iššūkio, neatsižvelgiant į apšvietimo pokyčius ir nuo to, ar nuotraukoje esantis asmuo yra tiesiai prieš kamerą.





Tai reikšmingas pažanga, palyginti su ankstesne veido derinimo programine įranga, ir ji parodo naujo požiūrio į dirbtinį intelektą, žinomo kaip gilus mokymasis, dėl kurio „Facebook“ ir jo konkurentai daug lažinėjosi per pastaruosius metus, galią (žr. „Deep Learning“). Ši AI sritis apima programinę įrangą, kuri naudoja modeliuojamų neuronų tinklus, kad išmoktų atpažinti modelius dideliame duomenų kiekyje.

Paprastai tokio pagerėjimo nematote, sako Yaniv Taigman, „Facebook“ AI komandos narys, praėjusiais metais sukurta tyrimų grupė, siekusi ištirti, kaip gilus mokymasis gali padėti įmonei (žr. „Facebook“ pristato išplėstines AI pastangas). Mes glaudžiai žiūrime į žmogaus veiklą, sako Taigmanas apie naują programinę įrangą. Jis pažymi, kad klaidų lygis sumažėjo daugiau nei ketvirtadaliu, palyginti su ankstesne programine įranga, kuri gali atlikti tą pačią užduotį.



Galvos pasukimas: „DeepFace“ naudoja 3D modelį, kad virtualiai pasuktų veidus taip, kad jie būtų nukreipti į fotoaparatą. Vaizdas (a) rodo originalų vaizdą, o (g) - galutinę, pataisytą versiją.



Naujoji „Facebook“ programinė įranga, žinoma kaip „DeepFace“, atlieka tai, ką mokslininkai vadina veido patikrinimu (ji atpažįsta, kad dviejuose vaizduose rodomas tas pats veidas), o ne veido atpažinimą (veido pavadinimo suteikimas). Tačiau kai kurie pagrindiniai metodai gali būti pritaikyti šiai problemai, sako Taigmanas, ir todėl gali pagerinti Facebook tikslumą siūlant, ką vartotojai turėtų pažymėti naujai įkeltoje nuotraukoje.

Tačiau „DeepFace“ kol kas išlieka tik tyrimų projektu. Facebook išleido mokslinį darbą apie projektą praėjusią savaitę, o mokslininkai pristatys darbą IEEE konferencija apie kompiuterinį regėjimą ir modelių atpažinimą birželį. Mes skelbiame savo rezultatus, kad gautume atsiliepimų iš mokslinių tyrimų bendruomenės, sako Taigman, kuris sukūrė DeepFace kartu su Facebook kolegomis Ming Yang ir Marc'Aurelio Ranzato bei Tel Avivo universiteto profesoriumi Lioru Wolfu.

„DeepFace“ apdoroja veidų vaizdus dviem etapais. Pirmiausia jis pakoreguoja veido kampą taip, kad nuotraukoje esantis asmuo būtų nukreiptas į priekį, naudojant vidutinio į priekį žvelgiančio veido 3D modelį. Tada vyksta gilus mokymasis, nes imituojamas neuroninis tinklas sukuria skaitmeninį perorientuoto veido aprašymą. Jei „DeepFace“ pateikia pakankamai panašius aprašymus iš dviejų skirtingų vaizdų, jis nusprendžia, kad jie turi rodyti tą patį veidą.



Galutinės programinės įrangos veikimas buvo išbandytas pagal a standartinis duomenų rinkinys kuriuos mokslininkai naudoja lygindami veido apdorojimo programinę įrangą, kuri taip pat buvo naudojama norint įvertinti, kaip žmonėms sekasi derinti veidus.

Neerajus Kumaras , Vašingtono universiteto mokslininkas, dirbęs veido patikrinimo ir atpažinimo srityje, teigia, kad „Facebook“ rezultatai rodo, kad suradus pakankamai duomenų, kad būtų galima įvesti į didelį neuroninį tinklą, galima žymiai patobulinti mašininio mokymosi programinę įrangą. Galiu lažintis, kad daug naudos čia suteikia tai, ką paprastai suteikia gilus mokymasis: galimybė panaudoti didžiulius išorinių duomenų kiekius daug didesnio pajėgumo mokymosi modelyje, sako jis.

Giluminio mokymosi „DeepFace“ dalis susideda iš devynių paprastų imituojamų neuronų sluoksnių, tarp kurių yra daugiau nei 120 milijonų jungčių. Norėdami apmokyti šį tinklą, „Facebook“ tyrėjai panaudojo nedidelę duomenų dalį iš savo įmonės vartotojų vaizdų – keturis milijonus veidų nuotraukų, priklausančių beveik 4000 žmonių. Kadangi jie turi prieigą prie daugybės šios formos duomenų, jie gali sėkmingai parengti didelės talpos modelį, sako Kumaras.

paslėpti