Google bitvu o nejlepší umělou inteligenci nevzdává a po téměř roční odmlce od posledního Gemini 1.5 představil nejnovější verzi Gemini 2.0. Ve hře je především vylepšená multimodalita, tedy práce s textem, obrázky i zvukem. Nová verze se rovněž více zaměřuje na tzv. AI agenty, pomocníky specializované pro konkrétní úkony.
Lepší, chytřejší a efektivnější
Nové Gemini 2.0 je tabulkově nejvýkonnějším a nejschopnějším modelem, který Google kdy vyvinul. Oproti předchůdci nabízí větší či menší vylepšení prakticky ve všech ohledech, a lze jej tedy označit jako skutečně plně funkční multimodální model. Nyní už dokáže nativně generovat obrázky nebo zvukové stopy a naopak nahraným obrázkům lépe porozumí a chápe prostorové vztahy mezi objekty.
Gemini 2.0 je dostupný jako experimentální model pro vývojáře prostřednictvím API v Google AI Studio a Vertex AI, pro širokou veřejnost je aktuálně dostupná pouze mírně odlehčená verze Flash. Plné verze bychom se měli dočkat v lednu příštího roku, nedočkavci si Gemini 2.0 Flash mohou vyzkoušet už nyní ve webovém rozhraní (do mobilní aplikace dorazí později).
AI agenti pro všechno
Společně s Gemini 2.0 Flash přicházejí také agentní funkce, které je možné chápat jako systémy schopné samostatně plánovat, multimodálně uvažovat a porozumět dlouhým souvislostem na základě instrukcí uživatele. Praktické využití demonstruje Google na pár vlaštovkových projektech Deep Research, projekt Astra, Project Mariner nebo AI asistent Jules.
Deep Research dostupný v Gemini Advanced je nástroj schopný procházet web, vyhledávat v něm a analyzovat přijatá data na základě zadání uživatele. Projekt Astra, který Google testuje od jara, jsme už mohli vidět dříve. Jedná se o agentního vizuálního asistenta, který dokáže rozpoznávat objekty okolo vás a následně s vámi komunikovat, navigovat vás nebo vám říci, kde se ve vašem okolí nachází daná věc. S příchodem Gemini 2.0 je Astra chytřejší, dokáže mluvit ve více jazycích, dostala přístup k vyhledávači, Lens a Mapám.
Dalším neméně zajímavou agentní funkcí je Project Mariner. Jedná se o výzkumný prototyp ve formě rozšíření do prohlížeče Chrome, jehož úkolem je automatizace komplexnějších úkolů, například vyhledávání informací a jejich sumarizace nebo vyplňování formulářů. Všechny experimentální funkce společnost vyvíjí s důrazem na bezpečnost. Například Project Mariner dokáže pracovat pouze s aktivní záložkou prohlížeče a jakékoliv citlivější akce musí uživatel potvrdit.
zdroj: Google