Programinė įranga verčia jūsų balsą į kitą kalbą

„Microsoft“ mokslininkai sukūrė programinę įrangą, kuri gali išmokti jūsų balso skambesį ir naudoti ją kalbant, kurios jūs nemokate. Sistema galėtų būti naudojama kalbos mokymo programinei įrangai padaryti asmeniškesnę arba įrankius keliautojams.





Antradienį „Microsoft“ Redmondo mieste, Vašingtone, surengtoje demonstracijoje „Microsoft“ mokslininkas Frankas Soongas parodė, kaip jo programinė įranga gali perskaityti tekstą ispanų kalba, naudodama savo viršininko Ricko Rashido, vadovaujančio „Microsoft“ tyrimų pastangoms, balsu. Antroje demonstracijoje Soongas panaudojo savo programinę įrangą, kad suteiktų Craig Mundie, „Microsoft“ vyriausiajam tyrimų ir strategijos pareigūnui, mokėti kalbėti mandarinų kalba.

Išgirskite Ricko Rashido balsą jo gimtąja kalba ir išverstą į keletą kitų kalbų:

Anglų kalba: klausykite klipo, kuriame Rickas Rashidas kalba įprastai.



Ispanų kalba: klausykite ispanų kalba.

Italų kalba: klausykite italų kalba.

Mandarinų kalba: klausykite jo mandarinų kalba.



Anglų kalba sintetinė Mundie balso versija pasveikino auditoriją „Microsoft Research“ surengtoje atvirų durų dienoje ir baigė: „Naudodamas šią sistemą dabar galiu kalbėti mandarinų kalba“. Frazė buvo pakartota kinų mandarinų kalba, vis dar atpažįstamu Mundie balsu.

Galėsime atlikti keletą scenarijų programų, sakė Soongas, kuris sukūrė sistemą su kolegomis iš „Microsoft Research Asia“, antrosios pagal dydį bendrovės tyrimų laboratorijos Pekine, Kinijoje.

Vienakalbiam kalbėtojui, keliaujančiam į užsienio šalį, atliksime kalbos atpažinimą, po to vertimą, o po to – galutinį tekstą ir išvesime kalbą kita kalba, bet vis tiek savo balsu, sakė Soongas.



Naujoji technika taip pat galėtų būti naudojama siekiant padėti mokiniams mokytis kalbos, sakė Soongas. Užsienio frazių pavyzdžių pateikimas savo balsu gali būti padrąsinamas arba lengviau mėgdžiojamas. Soongas taip pat parodė, kaip jo naujoji sistema galėtų patobulinti navigacinių nuorodų telefono programėlę, leidžiančią sintetiniu anglų kalbos balsu sklandžiai perskaityti tekstą, užrašytą ant Kinijos kelio ženklų, perduodant instrukcijas apie maršrutą Pekine.

Sistemai reikia maždaug valandos mokymo, kad būtų sukurtas modelis, galintis perskaityti bet kokį tekstą asmens balsu. Šis modelis konvertuojamas į galintį perskaityti tekstą kita kalba, lyginant jį su pradiniu teksto į kalbą modeliu, skirtu tikslinei kalbai. Atskiri garsai, naudojami pirmojo modelio žodžiams kurti naudojant žmogaus balsą jo gimtąja kalba, yra kruopščiai koreguojami, kad naujasis teksto į kalbą modelis galėtų išgirsti frazes antrąja kalba.

Soong sako, kad šis metodas gali konvertuoti iš bet kurios 26 kalbų poros, įskaitant mandarinų kinų, ispanų ir italų kalbas.



Asmens balso išsaugojimas sintezuojant kalbą kita kalba vartotoją tikriausiai nuramintų ir su vertimo programine įranga susijusi sąveika taptų prasmingesnė, sakoma pranešime. Šrikantas Narajananas , Pietų Kalifornijos universiteto Los Andžele profesorius, vadovauja tyrimų grupei, kuri dirba su kalbų vertimo sistemomis tokiose situacijose kaip gydytojo ir paciento konsultacijos.

Jis sako, kad žodis yra tik dalis to, ką žmogus sako, o norint iš tikrųjų perteikti visą informaciją žmogaus kalboje, vertimo sistemos turės sugebėti išsaugoti balsus ir dar daugiau. Balso išsaugojimas, intonacijos išsaugojimas yra svarbūs dalykai, ir šis projektas tai aiškiai žino, sako Narayananas. Mūsų sistemos turi užfiksuoti išraišką, kurią žmogus bando perteikti, kas jis yra ir kaip tai sako.

Jo tyrimų grupė tiria, kaip tokios savybės kaip kirčiavimas, intonacija ir žmonių naudojimo pauzės ar dvejonės daro įtaką vertimo žodžiu veiksmingumui ir suvokiamai kokybei. Mes klausiame, ar galite sukurti sistemas, kurios galėtų tarpininkauti tarp žmonių ir tiesiog pakeisti žodžius, sako jis. Manau, kad šis [Microsoft tyrimas] yra dalis to, kaip tai įvyksta.

paslėpti