Názor k článku Sony chystá displej s hmatovou odezvou a tlakovým senzorem od anonym - Dobrý den, hlásím se dobrovolně za autory systému...

  • 14. 6. 2010 9:02

    anonymní

    Dobrý den, hlásím se dobrovolně za autory systému (té rozpoznávací části).

    Rozpoznávání řeči (převod řeči na text) je velmi komplikovaná věc, a přiznejme si, že i sám člověk má někdy problémy 100% porozumět mateřskému jazyku, natož například jazyku cizímu. Jen pro příklad, tento systém byl trénován asi na 200h spontánní řeči. To není tak moc, když si uvědomíme jak dlouho se trénuje náš mozek. A pokud jste se učili cizí jazyk, asi tušíte, kolik je třeba "naposlouchat dat", aby vaše úspěšnost byla alespoň 75%. Tím nechci obhajovat chybovost, jen dát pár informací pro zamyšlení. Dále, tento systém je primárně trénován na běžnou konverzační řeč. Pokud čteme novinové zprávy nebo jiná nespontánní data, úspěšnost jde dolů.

    Tím se dostávám k další věci, kterou jsou slova mimo slovník. Nyní je v systému pro češtinu cca 1 milion slov. Na www.PrepisReci.cz uvádíme, že se jedná pouze o slovník obecné spisovné a hovorové češtiny bez názvů firem, ale tedy např. i bez příjmení, odborných výrazů apod. V češtině se lze bez problému dostat k 3-4 milionům slov. Pokud řeknete slovo, které není ve slovníku, bude nutně rozpoznáno jako něco co ve slovníku je (a tedy špatně). Systém je však možné trénovat např. na různé obory (doplňovat názvy, odborné výrazy apod.).

    Každopádně děkujeme autorovi za komentář a otestování systému. S pozdravem Radim Kudla