V roce 1997 si to počítač IBM Deep Blue rozdal s šachovým velmistrem Garrim Kasparovem… a vyhrál. O 14 let později čeká IBM další velká bitva, ovšem na mnohem těžším poli – bude muset porozumět slovům ve známé hře Jeopardy! (u nás jako Riskuj). Superpočítač Watson se na to připravoval čtyři roky, v lednu už dokázal v testovacích kolech porazit ty největší borce, ale finální bitva přijde 14. února. Pokud to ještě doteď nikdo nevnímal, možná nastane ten den, kdy počítač prokáže, že je chytřejší než člověk.
IBM Watson, chytřejší než člověk, zdroj: IBM
Watson běží na deseti serverech IBM Power 750, dohromady 2880 procesorových jader architektury Power7 a 15 TB operační paměti svázaných linuxovým systémem. Celkový výkon odpovídá 80 teraflops. Lidé z IBM uvádějí, že v paměti je zhruba 200 milionů stránek informací, představte si tedy milion knih. Watson není připojen k síti, jedná se o samostatnou databázi informací.
Abychom byli přesní, Watson je onen distribuovaný systém, který všechny servery řídí, ale obecně budeme mluvit o Watsonu jako počítači. Pokud je vám název povědomý, patří zakladateli IBM Thomasi J. Watsonovi. Systém staví na projektu DeepQA, který se zabývá zpracováním otázek v přirozeném jazyce, Watson se konkrétně specializuje na hru Jeopardy.
Rozdíl oproti Deep Blue je značný. Šachy jsou jedna disciplína s jasně danými pravidly a omezeními. Počítač vyhrává díky pokročilé matematice, když dokáže odhadnout více tahů dopředu. Watson musí porozumět slovům, zpracovává informace přijaté jazykem. Musí si poradit se zkratkami a slangem. Takže nejdříve slyší/čte, pak informace převede do vlastního formátu, zpracuje a odpoví.
Dnešní fulltextové vyhledávače jako Google nebo Bing jsou proti tomu hloupé. Dotazy musíte zadávat heslovitě pomocí klíčových slov a výsledkem je stejně jen list odkazů, kde odpověď možná najdete, možná ne.
To, o čem se bavíme v případě Watsonu, je sémantické vyhledávání. Místo dotazu „finále MS hokej 2010“ napíšete „Kdo vyhrál loňské finále hokejového mistrovství světa?“. Takto pracuje Watson. I když zatím zřejmě přijímá pouze textové dotazy a neanalyzuje hlas moderátora. Ale sám oplývá hlasovým syntetizátorem, dokáže odpovídat jako člověk.
Tomuto formátu má nejblíže vyhledávač Wolfram|Alpha, který je postaven na silném enginu Mathematica. Místo odkazů zobrazí přímou odpověď a dokáže zpracovat i jednodušší lidsky psané otázky.
Wolfram|Alpha umí odpovídat na lidsky psané dotazy
Watson by se mohl stát základem budoucích vyhledávačů. Představte si, že mobilu řeknete svůj dotaz a on za chvíli odpoví. Jako první se ale zřejmě uchytí ve zdravotnictví a dalších průmyslových oblastech, kde je potřeba rychlé rozhodnutí. Představte si třeba technickou podporu na telefonu.
Na tomto videu IBM ukazuje, jak se inteligence Watsonu zlepšovala, dnes už dovede odpovědět správně ve více než 90 % případů a stačí mu na to pouze tři vteřiny. V začátcích projektu to trvalo dvě hodiny a přesnost byla na 30 %. Viz Engadget.
Jeopardy! a soutěžící
Soutěž kdysi běžela i u nás na Nově, starší ročníky si ji určitě pamatují. Soutěžící si volili otázky z určitých oborů a za ně získávali/ztráceli body. Ten kdo jich měl na konci nejvíce, vyhrál tutéž sumu v korunách. V Americe je nesmírně populární, vždy už také běží od roku 1964 a vyhrála 28 cen Emmy (vůbec nejvíce ze všech soutěžních pořadů).
Jeopardy! znáte v Česku jako Riskuj, zdroj: IBM
Proti Watsonu se postaví dva nejúspěšnější soutěžící z Ameriky. Brad Rutter vyhrál úplně nejvyšší částku v historii, celkem 3 255 102 dolarů, Ken Jennings zase vyhrál 74× v řadě a celkem 2,5 milionu.
Vítěz únorové soutěže si odnese milion dolarů, druhý 300 000 dolarů a třetí 200 000 dolarů. Rutter a Jennings věnují půlku na charitu, IBM by věnovalo celou částku.
Testovací kolo proti šampionům
Minulý týden proběhlo zkušební kolo, kde proti sobě nastoupili Watson, Jennings a Rutter. Watson vyhrál, dobře se to vyjímá v médiích, IBM má obrovskou reklamu. Avšak tak jednoduché to nebylo. Když se na krátký záznam podíváte, Watson byl zřejmě jen rychlejší. Na soutěžících bylo vidět, že vědí a hlásí se, ale Watson mačkal „tlačítko“ dříve. Každopádně odpověděl vždy správně (zobrazil i další možné odpovědi s jejich procentuální pravděpodobností.)
Kdyby někdo namítal, že počítač má výhodu ve větší paměti, rychlejších reakcích a absenci zapomínání, má samozřejmě pravdu. Ale o tom to je. Chceme vytvořit stroj, který nebude trpět našimi problémy, bude se umět včas rozhodnout, nezapomene, vybere alternativní odpovědi a hlavně bude objektivní a bez citu. Logika bude v případě lékařských diagnóz klíčová. Není jisté, jestli se lékaři spolehnout pouze na moudrá slova Watsonu (který se také může mýlit), ale budou mít výchozí bod. A jednodušší bude ověřit jeho teorii než pracně vymýšlet novou vlastní.
Dokud nebude mít přístup k armádním systémům (zdravím, Skynete), můžeme zůstat v klidu. Nebo ne?
Na soutěži mě překvapila jedna věc (kupodivu se jí v našich médiích zřejmě nikdo nevěnoval). Jeopardy! je přece jen dost odlišná od našeho Riskuj. U nás bylo zvykem odpovídat na otázku. Třeba jen jednoslovně. Otázka: „Kdo byl prvním československým prezidentem?“ Odpověď: „T. G. Masaryk.“
V Jeopady se na odpověď tážete. Tedy přesně naopak. Hledáte otázku na odpověď, kterou vám řekne moderátor. Například. Otázka: „Německý pilot, který je nejúspěšnějším jezdcem v historii Formule 1.“ Odpověď: „Kdo je Michael Schumacher?“
Vyvrcholení soutěže přijde 14. února, to se teprve v řádné soutěži ukáže, jestli je schopnější počítač, nebo člověk. Já věřím IBM. Co vy?
Zdroj: IBM