S převodem obrázku na text pomocí OCR jste se už určitě setkali. Je to zdlouhavá a nepohodlná procedura, potřebujete k tomu zvláštní software nebo webovou aplikaci, jež pomocí metod počítačového vidění dokáže v obrázcích hledat známé znaky a překládat je do upravitelné podoby. Tvůrci projektu Napthal však vymysleli až revolučně jednoduchý převod.
Do prohlížeče Chrome si nainstalujete doplněk, který bude obrázky na webu analyzovat bezpracně. V místě, kde vidí text, ukáže běžný editační kurzor a dovolí vám text zkopírovat. A to není všechno, text umí i přepsat v novém písmu, přeložit do jiného jazyka, případně jej z obrázku úplně vymazat. Poradí si i s otočeným textem nebo perspektivně deformovaným.
Nejlépe to funguje s předvybranými obrázky z oficiálního webu. Tam si můžete vyzkoušet překlad, kopírování a dokonce i mazání textu tak, že se prázdná místa sama (nerušivě) vyplní. Naptha si zatím neporadí s češtinou a pochopitelně jí vadí i složitější podklady. Já jsem zkusil předhodit jinak dobře čitelný text z procesoru AMD Athlon 5350 (viz obrázek výše), který před nedávnem testoval Mirek.
Každý jiný OCR engine si s tím musí poradit bez chyb, ale Naptha jej převedla jako {a Ftlb AD535OJANGGHM nA 1GUN PCAb51AGOZrJ. Název je úplně mimo, ale část modelového označení sedí. Pomocí editoru jsem se pokusil text z čipu vymazat, ale i to se podařilo jen napůl.
Je to zatím jen demo, nemůžeme čekat zázraky. Úžasné je, že něco takového vůbec funguje v reálném čase. Základy jsou položeny, autoři už musí pouze vylepšovat egine OCR. V budoucnu budeme díky tomu moci jednoduše kopírovat text ze starých digitalizovaných novin, matrik či jiných dokumentů.
Ne že by to nešlo už dnes, jenže to byste museli obrázek uložit, načíst v aplikaci jako Abbyy Finereader, exportovat do editovatelného dokumentu a pak text využít na jiném místě. PS: Na mobilech už přirozený převod textu funguje minimálně čtyři roky.
via The Verge