Tým vědců z jeho laboratoře pracuje na programu, který pozná, co se nachází na fotografii, a pak to přirozeným jazykem stručně popíše. Bude se to hodit ve vyhledávači, který denně zpracovává miliony fotek. Velkou roli tato technologie bude hrát při pomoci lidem se zrakovým postižením.
Neuronová síť Googlu rozpozná objekty na fotce a také je popíše
Google i Microsoft se teď předhánějí v tom, kdo je s vývojem neuronových sítí dále. Google má už takřka dokonalý OCR nástroj pro rozpoznávání znaků. Vizuální vyhledávač Microsoftu zase dokáže rozpoznávat objekty na fotografiích a navíc je i kategorizovat. Dokonce pozná, o jaké plemeno psa se jedná.
Nový projekt Googlu jde ještě dál. Firma jej otestovala na několika databázích veřejně přístupných obrázků čítajících tisíce fotografií. Nejdříve analyzuje fotografie, zachytí barvy a hrany, porovná je s už naučenými tvary a pak je v jedné větě popíše.
Dosavadní systémy řekly, že je na fotce slon, protože viděly jeho charakteristický tvar. (A i to je těžká disciplína.) Systém Googlu ale řekne, že vidí stádo slonů, kteří se pohybují po vyschlé zemi. Počítač analyzuje více slonů, kousky trávy, ale jinak hnědou zem.
Systémy se však pořád učí, proto nefungují stoprocentně. Firma ukázala několik výsledků, které roztřídila podle toho, jestli byl výsledek správný, s malými nebo velkými chybami či úplně špatný.
Zdroj: Google