Googles nieuwe vertaalmethode kan spraak direct vertalen

Translatotron
Google introduceert zijn end-to-end-model Translatotron als een nieuwe methode die spraak direct kan vertalen in een andere taal. We kennen natuurlijk allemaal Google Translate, de app die ook tekst kan vertalen en uitspreken. Toch zit tussenbeide een groot verschil. Google Translate zet namelijk spraak om in tekst. Die tekst wordt vervolgens vertaald en via spraak overgebracht. Translatotron laat de stap met tekst achterwege.
Google heeft Translatotron in onderstaand schema op vereenvoudigde wijze weergegeven. Translatotron is gebaseerd op een neuraal netwerk dat spectogrammen als input gebruikt om vervolgens in een spectrogram om te zetten met de taal waarnaar het vertaald moet worden.
Speaker encoder
Doordat de Translatotron-methode geen tekst gebruikt, kan spraak dus direct vertaald worden. Hier komt nog een interessant voordeel bij: het stemgeluid van de spreker wordt overgenomen. Zo lijkt het dus net alsof je zelf in de vreemde taal spreekt terwijl je die helemaal niet kent. Hiervoor wordt de speaker encoder ingezet die, zoals Google aangeeft, soortgelijke kenmerken in de vertaalde spraak meeneemt.
Natuurlijk zal Google nog veel sleutelen aan het Translatotron-model voordat het echt geschikt is om bijvoorbeeld in Google Translate te verwerken. Ben je nu benieuwd naar een aantal voorbeelden van deze Translatotron? Dan kun je er een aantal hier beluisteren.
Plaats reactie
0 reacties
Je bekijkt nu de reacties waarvoor je een notificatie hebt ontvangen, wil je alle reacties bij dit artikel zien, klik dan op onderstaande knop.
Bekijk alle reacties