Představte si, že mluvíte plynně španělsky, aniž byste kdy absolvovali jedinou lekci. V budoucnu by to mohla být realita. Nebudete si kvůli tomu muset strkat do ucha Babylónskou rybku jako ve Stopařově průvodci, postačí software. Ten od Googlu. Skupina jeho výzkumníků pracuje na novém programu Translatotron, který k překladu hlasu mezi dvěma jazyky přistupuje novým způsobem.
Dosavadní systémy pracují tak, že nejprve převedou původní řeč na text, následně text přeloží a pak onen překlad hlasovým syntezátorem opět převedou do zvukové podoby. Jde o tři fáze, kde nezávisle na sobě vznikají různé typy chyb, které se pak násobí. Translatotron ale překládá hlas bez onoho prostředního stupně, v průběhu nikdy nedojde k převodu na text.
Magie spočívá ve strojovém učení, které je přímo vytrénováno na porovnávání zvukových párů. Google novinku vyvíjel na překladu mezi angličtinou a španělštinou. Jedna věta je namluvena španělsky, druhá s přesným překladem anglicky. Program porovnává spektografy obou záznamů a hledá, které fonémy odpovídají kterým.
TIP: Adobe chystá „Photoshop pro zvuk“. Nový nástroj upraví, co lidé na nahrávce říkají
Po tréninku je program schopný překládat libovolné věty, navíc s několika výhodami, které stávající systémy neumí. Cílový překlad si zachovává tempo původního řečníka, nesnaží se převádět nepřeložitelné výrazy (typicky jména) a hlavně jde zachovat i původní barva hlasu. Překlad zní, jako byste jej v cizím jazyce namluvili sami.
Ukázka Translatotronu
Původní záznam ve španělštině
[audio wav="https://www.cnews.cz/wp-content/uploads/2019/05/google-translatotron-1.wav"][/audio]
Referenční překlad do angličtiny
[audio wav="https://www.cnews.cz/wp-content/uploads/2019/05/google-translatotron-2.wav"][/audio]
Překlad do angličtiny s využitím původního hlasu
[audio wav="https://www.cnews.cz/wp-content/uploads/2019/05/google-translatotron-3.wav"][/audio]
Další ukázky jsou na GitHubu.
Výzkum je zatím v plenkách. Současná verze Translatotronu dělá chyby v překladu, gramatice a ani ten cílový hlas nemusí vždy odpovídat zdrojovému. Je to ale teprve první software svého druhu, který se o něco takového pokouší a Google se mu chce nadále věnovat.
TIP: Google zlepšil překladač. Už i offline bude vytvářet lidsky znějící věty
Google (ale i Microsoft) už vyvíjí systémy pro překlad hlasu v reálném čase, takže je možné telefonovat s člověkem, jehož jazyk neumíte. Tyto služby ale využívají umělý hlas a spoléhají se na onen třístupňový překlad s přepisem na text. I ten se ale dá stále zlepšovat, poslední aktualizace Google Překladače z roku 2017 byl velký posun směrem vpřed.
Zdroj: Google