Novinky v oblasti umělé inteligence: Google představuje Gemini 3
Google dál rozvíjí své ambice v oblasti umělé inteligence s novým modelem Gemini 3, který je dosud nejvýkonnějším, a jeho cílem je přinést daleko víc než jen chytřejší odpovědi v chatu. Oznámení nového modelu přišlo spolu s rozsáhlým nasazením v oblasti vyhledávání, aplikace Gemini a vývojářských nástrojích, což znamená vůbec největší skok Google od začátku éry Gemini před téměř dvěma lety.
Podle vlastního výzkumu a interního testování Google je Gemini 3 navržen tak, aby lépe rozumělo hlubšímu kontextu, uvažovalo s větší nuancí a zvládalo složitější úkoly s menším množstvím instrukcí. Ředitel společnosti Sundar Pichai tvrdí, že tento model přibližuje Google „blíže k AGI“, díky kombinaci lepšího multimodálního porozumění, silnějších agentních schopností a výraznému zlepšení čisté výpočetní síly.
Výkon Gemini 3 Pro
Uprostřed uvedení nového produktu je Gemini 3 Pro, který je nyní v předběžném provozu a překonává Gemini 2.5 Pro ve všech hlavních měřítkách. V současnosti vévodí žebříčku LM Arena s Elo skóre 1501 a vykazuje pozoruhodné výsledky, například 37.5% na testu „Poslední zkouška lidstva“, interním nástroji Googlu pro testování logického myšlení; 91.9% na GPQA Diamond; a nový špičkový výkon 23.4% na MathArena Apex benchmarku.
Nové možnosti s režimem Deep Think
Nový režim Deep Think posouvá tyto schopnosti ještě dále. V raných hodnoceních od Googlu Deep Think dosahuje ještě vyšších skóre, včetně 93.8% na GPQA Diamond a průlomových 45.1% na ARC-AGI-2 (včetně provádění kódu). Google uvádí, že chce Deep Think pozdržet z obavy o bezpečnost, než jej zpřístupní předplatitelům Gemini Ultra.
Praktické využití a pomoc pro vývojáře
Gemini 3 neslouží pouze pro interakce v chatu. Je navržen tak, aby pomáhal uživatelům učit se, stavět a plánovat praktickým způsobem, přičemž využívá až 1 milion tokenů v kontextovém okně a pokročilé multimodální zpracování. To zahrnuje převod ručně psaných rodinných receptů do digitální kuchařky, analýzu dlouhých akademických videí a generování interaktivního studijního materiálu nebo dokonce posuzování herního záznamu k vytvoření tréninkových plánů.
Pro vývojáře přichází Gemini 3 v Google AI Studio, Vertex AI, Gemini CLI a novém Google Antigravity, což je vývojové prostředí zaměřené na agenty, kde Gemini může plánovat, provádět a ověřovat vícestupňové úkoly programování. Interní benchmarky Googlu ukazují na výrazné skoky ve výkonu agentů, včetně vedoucích skóre na WebDev Arena (1487 Elo), Terminal-Bench 2.0 (54.2%) a SWE-bench Verified (76.2%).
Novinky ve vyhledávání
Gemini 3 také začíná svůj rollout ve vyhledávání prostřednictvím AI režimu, kde Google využívá model k vytvoření dynamických vizuálních rozložení, simulací a kontextově bohatších odpovědí na požádání.
Google zdůrazňuje, že vše je založeno na vlastním testování. Společnost říká, že Gemini 3 je jejím dosud nejvíce rigorózním modelem, s menšími tendencemi k podlézání, silnějšími obranami proti útokům a rozšířeným externím auditem, včetně hodnocení od různých organizací.
Gemini 3 je nyní k dispozici v aplikaci Gemini a napříč vývojářskými nástroji Googlu, přičemž se očekává, že v příštích týdnech dorazí další modely a funkce, včetně režimu Deep Think.

