Google pomůže s překladem článků Wikipedie

15. 7. 2010

Sdílet

 Autor: Redakce

Největší webové encyklopedie se potýká s nedostatkem záznamů v méně rozvinutých zemích. Aby se Wikipedia mohla stát studnicí poznání i v těchto oblastech, je potřeba doplnit chybějící hesla a dokončit pahýly. Čínština, arabština a hindština prý trpí nejvíce. Ještě před dvěma lety měl poslední zmiňovaný jazyk jen 21 000 článků s 3,4 milionem slov. Naproti tomu angličtina se pyšnila 2,5 milionem článků a 1,3 miliardou slov.

Relativní počet článků (mimo pahýly) na Wikipedii, zdroj: Google

V tuto chvíli má přes miliardu článku pouze angličtina a němčina, zhruba 30 000 záznamů chybí francouzštině. Čeština má 168 000 článků (17. místo), slovenština 116 000 (29. místo). Kompletní žebříček najdete zde.

Situaci se snaží změnit Google. Anglický jazyk s nejvíce hesly i uživateli se má stát referenčním zdrojem pro země na chvostu žebříčku. Společnost z Mountain View dává dohromady „nejohroženější“ záznamy. Ty vybírá podle nejčastějších dotazů ve vyhledávači a pomocí Google Trends. Tím zajistí, aby se překládaly důležité informace a ne pouze ty, které mají omezenou životnost. Třeba článek o nové hudební hvězdě z MTV je méně důležitý než záznam Shakespearovi.

Google nástroje pro překladatele

bitcoin_skoleni

Překlad probíhá automaticky pomocí Google Translate, případně za asistence lidského lingvisty. Ti mohou využít nástroje pro překladatele, kterým lze ve dvou oknech snadnou strojový překlad opravit. Podporuje přitom přímý import z Wikipedie. Během dvou let už takto zpracovali asi 16 milionů slov.

Zdroj: Google Translate blog