Hlavní navigace

„Kočka ležící na gauči.“ Google pozná a popíše, co se nachází na fotce

18. 11. 2014

Sdílet

 Autor: Redakce

Obrázek vydá za tisíc slov, říká se. Také je pravdou, že tyto disciplíny současné počítače ještě nezvládají. Počítačové vidění i práce s přirozeným jazykem jsou dva odlišné a velmi složité obory. A Google je teď spojil do jednoho.

Tým vědců z jeho laboratoře pracuje na programu, který pozná, co se nachází na fotografii, a pak to přirozeným jazykem stručně popíše. Bude se to hodit ve vyhledávači, který denně zpracovává miliony fotek. Velkou roli tato technologie bude hrát při pomoci lidem se zrakovým postižením.

Neuronová síť Googlu rozpozná objekty na fotce a také je popíše
Neuronová síť Googlu rozpozná objekty na fotce a také je popíše 

Google i Microsoft se teď předhánějí v tom, kdo je s vývojem neuronových sítí dále. Google má už takřka dokonalý OCR nástroj pro rozpoznávání znaků. Vizuální vyhledávač Microsoftu zase dokáže rozpoznávat objekty na fotografiích a navíc je i kategorizovat. Dokonce pozná, o jaké plemeno psa se jedná.

Nový projekt Googlu jde ještě dál. Firma jej otestovala na několika databázích veřejně přístupných obrázků čítajících tisíce fotografií. Nejdříve analyzuje fotografie, zachytí barvy a hrany, porovná je s už naučenými tvary a pak je v jedné větě popíše.

 

Dosavadní systémy řekly, že je na fotce slon, protože viděly jeho charakteristický tvar. (A i to je těžká disciplína.) Systém Googlu ale řekne, že vidí stádo slonů, kteří se pohybují po vyschlé zemi. Počítač analyzuje více slonů, kousky trávy, ale jinak hnědou zem.

Systémy se však pořád učí, proto nefungují stoprocentně. Firma ukázala několik výsledků, které roztřídila podle toho, jestli byl výsledek správný, s malými nebo velkými chybami či úplně špatný.

bitcoin_skoleni

Neuronová síť Googlu rozpozná objekty na fotce a také je popíše

Zdroj: Google