Nový univerzální AI agent SIMA 2 od Google DeepMind

Google DeepMind nedávno odhalil nového univerzálního AI agenta SIMA 2, který je schopen jednat v 3D virtuálním prostředí jako člověk. Tento vývoj představuje významný krok vpřed ve výzkumu umělé obecné inteligence (AGI). SIMA 2 se vyvinul z předchozí verze, která byla zaměřena na splnění základních pokynů, do inteligentního systému schopného interagovat s lidmi, posuzovat cíle a zlepšovat se sám.

Na veřejnosti byl agent SIMA 2 představen 13. října, přičemž se počítá s tím, že bude zveřejněno podrobné technické zpráva. Minulé verze, známá jako Scalable Instructable Multiworld Agent, byla zaměřena na hraní her. Rozšířená verze integruje model ‚Gemini‘ jako klíčový motor, což znamená, že SIMA 2 překonává pouhé plnění příkazů a nyní rozumí prostředí a vytváří si vlastní plány chování.

SIMA 2 nyní využívá „AI uvnitř AI“ strukturu v kombinaci s vývojovým světem ‚Genie 3‘, což zvyšuje realismus AI. CEO Demis Hassabis poznamenal, že integrování SIMA do světa modelu Genie 3 umožňuje jednomu AI fungovat v „mysli“ jiného AI.

Podle Hassabise je rozhodnutí velkých jazykových modelů (LLM) možné simulovat ve skutečném světě prostřednictvím modelu světa, což znamená, že rozhodnutí LLM jsou předána SIMA 2 a ověřena ve virtuálním prostředí (digitální dvojčata) vytvořeném tímto modelem, což přispívá k úpravě odpovědí LLM pro skutečný svět.

Hassabis dále dodal: „Vytváříme školící data, která umožňují systému pochopit fyzický svět tím, že používáme realistické prostředí a tradiční 3D herní enginy. Proto jsme ohlásili, že SIMA 2 a Genie 3 představují pokrok směrem k AGI.”

SIMA 2 funguje na základě ‚Gemini 2.5 Flashlight‘ a je schopna popsat okolní prostředí v přirozeném jazyce a rozhodnout se pro další akce. DeepMind zdůrazňuje, že se agent vyvinul ze schopnosti hrát hry na úroveň, kde chápou, co se děje, a rozumně interpretují požadavky uživatelů.

Například, když dostane pokyn „jdi k domu barvy zralého rajčete“, SIMA 2 provede logický proces a najde červený dům. Pokud je zadán pokyn s emotikonem sekery a dřeva, autonomně najde dřevo a seká jej.

Další důležitou vlastností SIMA 2 je jeho schopnost samostatného učení. Expanze z více než 600 jazykových technik chování z předchozí verze mu umožňuje flexibilně reagovat i v nových herních prostředích, na které nebyl školen. Například schopnost převést zkušenost z „těžby“ v jedné hře na „sklizeň“ v jiné hře odráží blízkost jeho výkonu k lidské úrovni generalizace.

Přestože SIMA 2 na začátku vyžaduje lidské demonstrace k získání dovedností, postupně se dokáže učit a vyvíjet i bez dalšího lidského vstupu. Při testování nových úkolů generovaných pomocí Gemini modelu a hodnocení výsledků pomocí alternativních odměnových modelů se SIMA 2 nechává ovlivnit těmito zkušenostmi a opakuje proces pokusu a omylu, aby zvýšil svůj výkon.

DeepMind tvrdí, že SIMA 2, schopný učit se, odvozovat a spolupracovat v různých herních prostředích, nastavuje základy pro klíčové technologické komponenty potřebné k implementaci AI v robotech a skutečném fyzickém světě. Schopnosti jako pohyb, používání nástrojů a provádění kooperativních úkolů budou nezbytnými prvky pro vývoj budoucích AI asistentů.

Navíc, nedávno inovativní laboratoř World Labs pod vedením profesorky Fei-Fei Li představila první komerčně dostupný světový model ‚Marvel‘, což vzbudilo velkou pozornost. Spojení světových modelů a agentů, jakoby bylo pro překonání limitů velkých jazykových modelů, je klíčové pro pokrok v AI technologiích.

Please follow and like us: