Nagy kihívó érkezett a képgenerálók piacára

Nagy kihívó érkezett a képgenerálók piacára

A szöveges feladatok elvégzésére képes LLM-ek elterjedését követően a képgeneráló AI-modellek is nagy figyelmet kaptak mind a technológiai vállalatok, mind a felhasználók részéről. Az elmúlt évek során a képgenerálásra használható mesterséges intelligencia-alkalmazások látványos fejlődést mutattak. Az első olyan modell, amely széles körben ismertté vált, a Midjourney, 2022 óta elérhető, és ennek elterjedését követően számos kisebb gyártó, mint az Ideogram vagy a Stable Diffusion, szintén sikereket értek el a képi AI-megoldások terén.

Bár a korábbi modellek gyakran vétettek hibákat a képgenerálás során, a technológia folyamatosan fejlődik. Nagy AI-fejlesztő cégek, mint az Elon Musk által vezetett xAI, a Google és az OpenAI, piacra dobták saját képgeneráló alkalmazásaikat, gyakran chatbotok felületére integrálva.

Az OpenAI az idei évben különösen nagy visszhangot keltett a képgeneráló megoldásával, amikor a közösségi médiában elárasztották a hagyományos fotók AI segítségével módosított japán anime stílusú változatai. A trend annyira népszerű lett, hogy a ChatGPT heti felhasználói száma rekordmagasra ugrott.

Az elmúlt hetekben a Google képgeneráló modellje, a Nano Banana, kapott nagyobb figyelmet. A szeptemberben debütáló képgenerátor november végétől ingyenesen elérhetővé vált az új nagy nyelvi modelljével, a Gemini 3-mal együtt.

Az új verzió nemcsak élethűbb képek generálására képes, hanem komplexebb infografikák elkészítésére és a képre helyezett szövegeket is pontosabban generálja, amely az eddigi generátorok gyenge pontjának számított.

Éles verseny a képgenerátorok között

A Google új modellje jelentős érdeklődést generált a képi AI-megoldások terén. A Nano Banana iránti érdeklődést összevetettük az OpenAI videós platformjával, a Sorával. A Sora jelentős visszhangot kapott, de az alkalmazás iránti kezdeti magas érdeklődés azóta csökkent, míg a Nano Banana iránti érdeklődés folyamatosan nőtt a Pro verzió megjelenésekor.

Ha az elmúlt héten vizsgáljuk az internetes érdeklődést, megállapítható, hogy a keresések szintje hasonló volt a két modell között. A globális adatok alapján látszik, hogy az Egyesült Államokban és Ázsia egyes államaiban a Sora dominál, míg Európában a Nano Banana váltott ki nagyobb érdeklődést.

A képi AI-megoldások közül több is figyelmet kapott az utóbbi években. Az évek óta elérhető képgenerálók, mint a Midjourney és az Ideogram, kisebb érdeklődést kaptak a Google-ben, mint a frissebb modellek, például a Nano Banana és a Sora.

Ha a múlt két évtizedének tendenciáit nézzük, a Midjourney keltette a legnagyobb érdeklődést 2022-es megjelenésekor. Azóta azonban a különböző gyártók új képi AI-megoldásaival sokkal nagyobb visszhangot kaptak, mint a korábban egyeduralkodónak számító Midjourney.

Please follow and like us:

Doporučené články