Google nezůstává pozadu a vydává Gemini 2.0. Mohutná vylepšení doplňují AI agenti

Sdílet

 Autor: Google
Mezi hlavní novinky patří nativní podpora generování obrázků, práce se zvukem a AI agenti.

Google bitvu o nejlepší umělou inteligenci nevzdává a po téměř roční odmlce od posledního Gemini 1.5 představil nejnovější verzi Gemini 2.0. Ve hře je především vylepšená multimodalita, tedy práce s textem, obrázky i zvukem. Nová verze se rovněž více zaměřuje na tzv. AI agenty, pomocníky specializované pro konkrétní úkony.

Lepší, chytřejší a efektivnější

Nové Gemini 2.0 je tabulkově nejvýkonnějším a nejschopnějším modelem, který Google kdy vyvinul. Oproti předchůdci nabízí větší či menší vylepšení prakticky ve všech ohledech, a lze jej tedy označit jako skutečně plně funkční multimodální model. Nyní už dokáže nativně generovat obrázky nebo zvukové stopy a naopak nahraným obrázkům lépe porozumí a chápe prostorové vztahy mezi objekty.

Gemini 2.0 je chytřejší a lepší ve všech ohledech

Gemini 2.0 je chytřejší a lepší ve všech ohledech

Autor: Google

Gemini 2.0 je dostupný jako experimentální model pro vývojáře prostřednictvím API v Google AI Studio a Vertex AI, pro širokou veřejnost je aktuálně dostupná pouze mírně odlehčená verze Flash. Plné verze bychom se měli dočkat v lednu příštího roku, nedočkavci si Gemini 2.0 Flash mohou vyzkoušet už nyní ve webovém rozhraní (do mobilní aplikace dorazí později).

AI agenti pro všechno

Společně s Gemini 2.0 Flash přicházejí také agentní funkce, které je možné chápat jako systémy schopné samostatně plánovat, multimodálně uvažovat a porozumět dlouhým souvislostem na základě instrukcí uživatele. Praktické využití demonstruje Google na pár vlaštovkových projektech Deep Research, projekt Astra, Project Mariner nebo AI asistent Jules.

Zdroj: YouTube.com

Deep Research dostupný v Gemini Advanced je nástroj schopný procházet web, vyhledávat v něm a analyzovat přijatá data na základě zadání uživatele. Projekt Astra, který Google testuje od jara, jsme už mohli vidět dříve. Jedná se o agentního vizuálního asistenta, který dokáže rozpoznávat objekty okolo vás a následně s vámi komunikovat, navigovat vás nebo vám říci, kde se ve vašem okolí nachází daná věc. S příchodem Gemini 2.0 je Astra chytřejší, dokáže mluvit ve více jazycích, dostala přístup k vyhledávači, Lens a Mapám.

bitcoin školení listopad 24

Dalším neméně zajímavou agentní funkcí je Project Mariner. Jedná se o výzkumný prototyp ve formě rozšíření do prohlížeče Chrome, jehož úkolem je automatizace komplexnějších úkolů, například vyhledávání informací a jejich sumarizace nebo vyplňování formulářů. Všechny experimentální funkce společnost vyvíjí s důrazem na bezpečnost. Například Project Mariner dokáže pracovat pouze s aktivní záložkou prohlížeče a jakékoliv citlivější akce musí uživatel potvrdit.

zdroj: Google

Umělá inteligence přepíše pravidla trhu práce v Česku. Změny se mají dotknout až 40 % pracovních míst Přečtěte si také:

Umělá inteligence přepíše pravidla trhu práce v Česku. Změny se mají dotknout až 40 % pracovních míst