Test modelu Nano Banana Pro v praxi: Jaké pokroky dělá Google v oblasti infografik

V rámci spuštění řady Gemini-3 aktualizuje Google také svou obrazovou umělou inteligenci Nano Banana. Model Nano Banana Pro (Gemini 3 Pro Image) byl optimalizován v oblastech deduktivního myšlení a znalostí faktů. Cílem je umožnit mu vytvářet lepší infografiky.

Infografiky jsou pro generativní AI systémy stále problematickou oblastí. Příklady, které se stávají virálními, často vypadají ohromně. Výsledky v každodenním životě bývají však většinou spíše rozpačité až banalizované, nebo obsahují závažné chyby.

To, co Google prezentuje ve svém blogovém příspěvku, je impozantní. Ať už se jedná o pozadí o pokojové rostlině, nebo o recept. Jak se však tohle všechno přenáší do každodenní praxe?

Test v praxi: Naplní Nano Banana Pro, co Google slibuje?

U receptů lze postup opakovat. Pokud se například zeptáte na klasický recept na cookies, Gemini vytvoří výsledek, který je obecně použitelný a vizuálně atraktivně ukazuje přípravu. Mírně nejasné však zůstává míchání s moukou. Dále chybí důležitá informace, že se cookies mají péct na horní/spodní ohřev. Jako náhrada za recept tato infografika rozhodně nefunguje, ale plní svůj účel jako vizuální průvodce.

Při anglickém příkazu je výsledek lepší než při německém. V němčině například v prvním pokusu chyběl seznam ingrediencí, který byl generován až na vyžádání. Přesto generuje Nano Banana Pro výsledek, který se ukazuje být lepší než to, co vytváří ChatGPT.

Poznámka: To byly první výsledky, které modely vygenerovaly. S trpělivostí a dalšími vstupy lze výsledky ještě vylepšit.

Modely selhávají u architektury Snapdragon-3

U složitějších příkladů se však ukazují hranice. Úkolem je vizuálně prezentovat novou architekturu Snapdragon X2 Elite. Základem této úlohy je tabulka z odpovídající zprávy. Příkaz zní: „Vytvoř infografiku o nové architektuře Snapdragon na základě této tabulky.“

Co z toho Nano Banana Pro vytváří, je vizuálně alespoň přitažlivé. Protože AI model nesprávně interpretuje spojení řádků v oblasti SKU, objevují se chyby. Například model přisuzuje X2E 88 100 pouze 12 jader, přestože jich má 18. Podobný problém existuje také u GPU.

Tento problém se neprojevuje jen u Nano Banana Pro. Ani ChatGPT nezvládá správně interpretovat rozdíly mezi SKU Snapdragon X2 Elite.

Pokroky v mnoha oblastech

Obrazové AI již nyní pokročily i v oblastech, které jsou v běžném životě skutečně užitečné. Navíc Google slibuje další pokroky, jako jsou ostřejší texty v obrázcích, plynulejší převod obrazových stylů a kombinace více obrázků do jednoho.

Google se také zaměřuje na profesionální produkci. S vylepšeným místním zpracováním lze nyní vybrat, upravit a změnit část obrázku. Také je možné přizpůsobit úhly kamery, zaostření, barevnou korekci a osvětlení scény – například přechod ze dne na noc nebo vytvoření bokeh efektu.

Obrázky mohou být generovány v různých poměrech stran, přičemž rozlišení dosahuje až na úroveň 4K, což je podle Google vhodné dokonce pro tisk.

Dostupnost: Nano Banana Pro lze využít prostřednictvím aplikace Gemini

Google distribuuje nový model Nano Banana Pro globálně prostřednictvím Gemini. Pro jeho použití je nutné v aplikaci vybrat možnost „Vytvořit obrázky“ a zvolit „Thinking“ model. Uživatelé bezplatné verze Gemini dostávají omezené volné kvóty. Jakmile je vyčerpají, přepnou se zpět na původní model Nano Banana. Předplatitelé Google AI Plus, Pro a Ultra dostávají vyšší kvóty.

AI režim v hledání s Nano Banana Pro je v USA dostupný pro předplatitele Google AI Pro a Ultra. Pro NotebookLM je Nano Banana Pro dostupný globálně pro předplatitele.

Generování obrazů v Google Ads je také přecházeno na model Nano Banana Pro. Vývojáři mohou model získávat prostřednictvím API v Google Cloud službách.

Please follow and like us: