Novinky v oblasti umělé inteligence: Google představuje Gemini 3

Google dál rozvíjí své ambice v oblasti umělé inteligence s novým modelem Gemini 3, který je dosud nejvýkonnějším, a jeho cílem je přinést daleko víc než jen chytřejší odpovědi v chatu. Oznámení nového modelu přišlo spolu s rozsáhlým nasazením v oblasti vyhledávání, aplikace Gemini a vývojářských nástrojích, což znamená vůbec největší skok Google od začátku éry Gemini před téměř dvěma lety.

Podle vlastního výzkumu a interního testování Google je Gemini 3 navržen tak, aby lépe rozumělo hlubšímu kontextu, uvažovalo s větší nuancí a zvládalo složitější úkoly s menším množstvím instrukcí. Ředitel společnosti Sundar Pichai tvrdí, že tento model přibližuje Google „blíže k AGI“, díky kombinaci lepšího multimodálního porozumění, silnějších agentních schopností a výraznému zlepšení čisté výpočetní síly.

Výkon Gemini 3 Pro

Uprostřed uvedení nového produktu je Gemini 3 Pro, který je nyní v předběžném provozu a překonává Gemini 2.5 Pro ve všech hlavních měřítkách. V současnosti vévodí žebříčku LM Arena s Elo skóre 1501 a vykazuje pozoruhodné výsledky, například 37.5% na testu „Poslední zkouška lidstva“, interním nástroji Googlu pro testování logického myšlení; 91.9% na GPQA Diamond; a nový špičkový výkon 23.4% na MathArena Apex benchmarku.

Nové možnosti s režimem Deep Think

Nový režim Deep Think posouvá tyto schopnosti ještě dále. V raných hodnoceních od Googlu Deep Think dosahuje ještě vyšších skóre, včetně 93.8% na GPQA Diamond a průlomových 45.1% na ARC-AGI-2 (včetně provádění kódu). Google uvádí, že chce Deep Think pozdržet z obavy o bezpečnost, než jej zpřístupní předplatitelům Gemini Ultra.

Praktické využití a pomoc pro vývojáře

Gemini 3 neslouží pouze pro interakce v chatu. Je navržen tak, aby pomáhal uživatelům učit se, stavět a plánovat praktickým způsobem, přičemž využívá až 1 milion tokenů v kontextovém okně a pokročilé multimodální zpracování. To zahrnuje převod ručně psaných rodinných receptů do digitální kuchařky, analýzu dlouhých akademických videí a generování interaktivního studijního materiálu nebo dokonce posuzování herního záznamu k vytvoření tréninkových plánů.

Pro vývojáře přichází Gemini 3 v Google AI Studio, Vertex AI, Gemini CLI a novém Google Antigravity, což je vývojové prostředí zaměřené na agenty, kde Gemini může plánovat, provádět a ověřovat vícestupňové úkoly programování. Interní benchmarky Googlu ukazují na výrazné skoky ve výkonu agentů, včetně vedoucích skóre na WebDev Arena (1487 Elo), Terminal-Bench 2.0 (54.2%) a SWE-bench Verified (76.2%).

Novinky ve vyhledávání

Gemini 3 také začíná svůj rollout ve vyhledávání prostřednictvím AI režimu, kde Google využívá model k vytvoření dynamických vizuálních rozložení, simulací a kontextově bohatších odpovědí na požádání.

Google zdůrazňuje, že vše je založeno na vlastním testování. Společnost říká, že Gemini 3 je jejím dosud nejvíce rigorózním modelem, s menšími tendencemi k podlézání, silnějšími obranami proti útokům a rozšířeným externím auditem, včetně hodnocení od různých organizací.

Gemini 3 je nyní k dispozici v aplikaci Gemini a napříč vývojářskými nástroji Googlu, přičemž se očekává, že v příštích týdnech dorazí další modely a funkce, včetně režimu Deep Think.

Please follow and like us: