Aš v budoutsnu napýšete nějakí texty Google se postará aby byli po jazikové stránkce v pořadku. Firma již od loňského roku trénuje neuronové sítě k tomu, aby dokázaly opravovat pravopisné i gramatické chyby. Nová technologie je od února dostupná v Google Dokumentech, během září se dostane také do Gmailu (nejprve k placeným účtům G Suite). Formálně to bude vypadat jako v MS Office. Špatný pravopis (typicky překlepy) bude podtržen červenou vlnovkou, gramatika (čárky ve větě, špatné skloňování, i/y u shody předmětu s přísudkem atd.) pak modrou. Když na podtržené slovo nebo spojení kliknete, Google doporučí opravu. Zatím se ale moc netěšte, protože funkce bude nejprve dostupná v angličtině. Strojovému učení by ale v budoucnu neměl dělat problém adaptovat se na nový jazyk. Technologie je stejná, Google bude muset softwaru předložit k vytrénování spoustu bezchybných textů, na základě nichž si automat odvodí pravidla.
Jak to bylo u Microsoftu?
Opravovat pravopis je „hračka“, slova se srovnávají se slovníkem. Gramatika má ale tolik různých pravidel a výjimek, že s nimi často bojují i jazykovědci. Microsoft zavedl kontrolu české gramatiky v létě 2005 (tehdy pro Office 2003). Vývoj trval dlouhých pět let a měl jej na starosti Ústav pro jazyk český Akademie věd ČR ve spolupráci s odborníky z Univerzity Karlovy.
„Vývoj Kontroly české gramatiky ukázal, jak lze úspěšně a užitečně aplikovat výsledky dlouhodobého vyhledávacího výzkumu v oblasti naší mateřštiny. V průběhu práce na speciální podkladové jazykovědné teorii jsme si také rozšířili zcela novým směrem naše znalosti o české syntaxi,“ uvedl Karel Oliva, tehdejší ředitel Ústavu pro jazyk český AV ČR.
Google volí opačný přístup. Sice také spolupracuje s jazykovědci, ale ti především kontrolují, jestli jsou automaticky vygenerovaná pravidla správná.
Zdroj: Google