NAPREDAK U VEŠTAČKOM GOVORU: Guglova mašina priča kao čovek

Kompanija „Gugl“ otkrila je svoj novi sistem za prebacivanje teksta u govor koji će omogućiti veštačkoj inteligenciji da govori onako kako to rade ljudi.

Alatka nazvana Takotron 2 uvežbana je na primerima ljudskog dijaloga kako bi njen govor bio što realističniji.

Druga generacija

– Takotron 2 je skoro nemoguće razlikovati od ljudskog govora. Reč je o drugoj generaciji tehnologije prebacivanja teksta u govor, a sposobna je da različito čita reči koje se isto pišu a u zavisnosti od konteksta – saopštio je „Gugl“.

Kako se navodi, tehnologija ima dve duboke veštačke nervne mreže. Prva prevodi tekst u spektogram u pdf formatu, što je vizuelni način predstavljanja audio-frekvencija. Taj spektogram se onda ubacuje u Vejv net, sistem iz laboratorije Dip majnd, koja čita tabelu i stvara audio-elemente.

Primeri govora predstavljeni su na internetu i svako ih može poslušati.

Problemi s rečima

– Naš sistem govora zvuči odlično, ali postoji još teškoća na koje nailazimo i koje moramo prevazići. Neke teške reči i dalje umeju da naprave problem i dovode do stvaranja čudnog zvuka – navode tvorci sistema u saopštenju.

Sistem je napravljen tako da govori ženskim glasom. U slučaju da se glas promeni i izabere drugi ženski ili neki muški glas, sistem je potrebno trenirati iz početka.


Kurir