Co opravdu dokáže Gemini 3 Pro

Co opravdu dokáže Gemini 3 Pro

Nový model umělé inteligence od Googlu, Gemini 3 Pro, je působivě schopný. Může lépe plánovat myšlenkové postupy, zpracovávat videa v reálném čase a vytvářet vizuální prezentace formou infografik.

V oblasti AI vyvolal Google s Gemini 3 Pro minulý týden mezinárodní senzaci. V důležitých benchmarkových testech, jako je LM Arena, se toto model okamžitě umístilo na prvním místě, stejně jako v „Poslední zkoušce lidstva“, která je považována za nejtěžší akademickou zkoušku s přibližně 2500 extrémně náročnými otázkami z matematiky, humanitních a společenských věd.

Vizuální prezentace místo textových bloků

Daleko od vědeckých řešení problémů se v uplynulých dnech nadšenci předháněli v příkladech obzvlášť chytrých a především esteticky ztvárněných řešení z oblasti AI. Paradigma pouhých textových odpovědí se mění.

Zakladatel Shopify, Tobias Lütke, naplnil AI transcript starší řeči pro zaměstnance a AI vytvořila působivý plakát o firemní filozofii. Generální ředitel Googlu Sundar Pichai transformoval anekdotu o hamburgerovém emoji do schématu o správném umístění plátku sýra. Další uživatel ozdobil fotografie ikonických památek světa, od Eiffellovy věže po Sochu svobody, technickými diagramy a daty, jak by se mohla objevit v brožuře.

Režim „Myšlení“ v praxi

Ti, kteří si chtějí vyzkoušet podobné na gemini.google.com, mohou použít následující prompt pro vytvoření učebního posteru o nedávných objevech na Marsu. Je důležité zvolit režim „Myšlení“ v pravém dolním rohu stránky Gemini. Ačkoli to trvá déle, poskytuje lepší výsledky.

Výsledkem byly dvě roboty Perseverance a Curiosity zobrazené v kresbách na Marsu a jejich objev zvláštního kamene a důkazů o podzemní vodě. Tento poster ovšem nevznikl bezchybně: v prvním návrhu se objevila formulace „Jediný Mars Orbiter“. Po upozornění Gemini přiznalo, že to byla nesmyslná fráze, generovaná AI halucinací.

Od 2D návrhu k 3D zobrazení

Architekti a stavebníci mohou díky Gemini nyní převádět dvourozměrné plány do 3D zobrazení. I když to neumožňuje výstup s milimetrovou přesností, jako je tomu v profesionálních CAD programech, pro první dojem to stačí.

Pro zpracování videí může Gemini analyzovat streamy v reálném čase. Dosud AI zpracovávala titulky a přepisy. Nyní „vidí“ a „slyší“ model video přímo, podobně jako člověk, ale na základě datových tokenů. Video je rozloženo na sekvenci obrazů a převedeno do jazyka modelu. Zvuková stopa je oddělena na lidský hlas a okolní zvuky, což modelu umožňuje chápání dotazů jako „Jak se mění výraz obličeje u této věty?“

Hluboká integrace do Googlovského ekosystému

Google integroval Gemini 3 Pro na různých místech svého ekosystému. Kromě gemini.google.com je AI dostupná také na notebooklm.google.com, což nabízí rozšířené funkce pro vytváření prezentačních snímků, infografik, video přehledů a zvukových shrnutí. K tomu se používají vlastní nahrané nebo odkazované zdroje. Kromě toho je Gemini 3 Pro využitelný v klasickém Google vyhledávání v AI režimu, který však vyžaduje placené předplatné.

Nové možnosti generování obrazů s Nano Banana Pro

Google také představil novou verzi své obrazové AI Nano Banana. Může generovat diagram dvojvrstvé neuronové sítě ve stylu britského ilustrátora Stephena Biestyho. AI také pomáhá při skládání různých obrázků do nové kompozice. U veřejných osobností je však Gemini více zdrženlivé, protože mnoho renomovaných figur má generaci obrázků zakázanou.

Vylepšena byla také produkce textu v obrazech, a to i v češtině. V plakátech lze nyní vytvářet podrobnější texty s širšími možnostmi štětců, písem a kaligrafie.

Deep Thinking: „Skok v porozumění“

Tvůrci Googlu sami považují za překvapivé, jak se jejich AI během pouhých dvou let vyvinula z modelu, který dokázal pouze číst texty a obrázky, na technologii, která dokáže „číst mezi řádky“. Režim Deep Thinking posouvá hranice AI ještě dále a nabízí skok v závěrečných a multimodálních funkcích porozumění.

Google posiluje vedoucí postavení na komparačních portálech

Celkově se zdá, že Google se svou AI Gemini 3 Pro a obrazovou AI Nano Banana Pro dosáhl velkého úspěchu. V porovnání s Open AI a jeho nejnovější verzí GPT-5.1 vyniká Gemini obzvlášť grafickým zpracováním témat. Již s předchozím modelem Gemini 2.5 Pro měl Google půl roku vedoucí postavení u uživatelů na komparačním portálu LM Arena. S Gemini 3 Pro Google dále rozšiřuje svůj náskok.

Please follow and like us:

Doporučené články