Test modelu Nano Banana Pro v praxi: Jaké pokroky dělá Google v oblasti infografik
V rámci spuštění řady Gemini-3 aktualizuje Google také svou obrazovou umělou inteligenci Nano Banana. Model Nano Banana Pro (Gemini 3 Pro Image) byl optimalizován v oblastech deduktivního myšlení a znalostí faktů. Cílem je umožnit mu vytvářet lepší infografiky.
Infografiky jsou pro generativní AI systémy stále problematickou oblastí. Příklady, které se stávají virálními, často vypadají ohromně. Výsledky v každodenním životě bývají však většinou spíše rozpačité až banalizované, nebo obsahují závažné chyby.
To, co Google prezentuje ve svém blogovém příspěvku, je impozantní. Ať už se jedná o pozadí o pokojové rostlině, nebo o recept. Jak se však tohle všechno přenáší do každodenní praxe?
Test v praxi: Naplní Nano Banana Pro, co Google slibuje?
U receptů lze postup opakovat. Pokud se například zeptáte na klasický recept na cookies, Gemini vytvoří výsledek, který je obecně použitelný a vizuálně atraktivně ukazuje přípravu. Mírně nejasné však zůstává míchání s moukou. Dále chybí důležitá informace, že se cookies mají péct na horní/spodní ohřev. Jako náhrada za recept tato infografika rozhodně nefunguje, ale plní svůj účel jako vizuální průvodce.
Při anglickém příkazu je výsledek lepší než při německém. V němčině například v prvním pokusu chyběl seznam ingrediencí, který byl generován až na vyžádání. Přesto generuje Nano Banana Pro výsledek, který se ukazuje být lepší než to, co vytváří ChatGPT.
Poznámka: To byly první výsledky, které modely vygenerovaly. S trpělivostí a dalšími vstupy lze výsledky ještě vylepšit.
Modely selhávají u architektury Snapdragon-3
U složitějších příkladů se však ukazují hranice. Úkolem je vizuálně prezentovat novou architekturu Snapdragon X2 Elite. Základem této úlohy je tabulka z odpovídající zprávy. Příkaz zní: „Vytvoř infografiku o nové architektuře Snapdragon na základě této tabulky.“
Co z toho Nano Banana Pro vytváří, je vizuálně alespoň přitažlivé. Protože AI model nesprávně interpretuje spojení řádků v oblasti SKU, objevují se chyby. Například model přisuzuje X2E 88 100 pouze 12 jader, přestože jich má 18. Podobný problém existuje také u GPU.
Tento problém se neprojevuje jen u Nano Banana Pro. Ani ChatGPT nezvládá správně interpretovat rozdíly mezi SKU Snapdragon X2 Elite.
Pokroky v mnoha oblastech
Obrazové AI již nyní pokročily i v oblastech, které jsou v běžném životě skutečně užitečné. Navíc Google slibuje další pokroky, jako jsou ostřejší texty v obrázcích, plynulejší převod obrazových stylů a kombinace více obrázků do jednoho.
Google se také zaměřuje na profesionální produkci. S vylepšeným místním zpracováním lze nyní vybrat, upravit a změnit část obrázku. Také je možné přizpůsobit úhly kamery, zaostření, barevnou korekci a osvětlení scény – například přechod ze dne na noc nebo vytvoření bokeh efektu.
Obrázky mohou být generovány v různých poměrech stran, přičemž rozlišení dosahuje až na úroveň 4K, což je podle Google vhodné dokonce pro tisk.
Dostupnost: Nano Banana Pro lze využít prostřednictvím aplikace Gemini
Google distribuuje nový model Nano Banana Pro globálně prostřednictvím Gemini. Pro jeho použití je nutné v aplikaci vybrat možnost „Vytvořit obrázky“ a zvolit „Thinking“ model. Uživatelé bezplatné verze Gemini dostávají omezené volné kvóty. Jakmile je vyčerpají, přepnou se zpět na původní model Nano Banana. Předplatitelé Google AI Plus, Pro a Ultra dostávají vyšší kvóty.
AI režim v hledání s Nano Banana Pro je v USA dostupný pro předplatitele Google AI Pro a Ultra. Pro NotebookLM je Nano Banana Pro dostupný globálně pro předplatitele.
Generování obrazů v Google Ads je také přecházeno na model Nano Banana Pro. Vývojáři mohou model získávat prostřednictvím API v Google Cloud službách.

