Black Forest Labs uvádí model obrázků Flux 2 s funkcí více odkazů

Black Forest Labs uvádí model obrázků Flux 2 s funkcí více odkazů

Stručně a jasně

  • Black Forest Labs představuje novou modelovou rodinu Flux 2 pro generování obrázků, která vytváří vysoce kvalitní obrázky až do čtyř megapixelů.
  • Uživatelé mohou přidat až deset referenčních obrázků pro konzistentní postavy, produkty nebo styly; zlepšena byla také prezentace textu.
  • Rodina Flux 2 nabízí čtyři varianty: vrcholný model, verzi pro vývojáře, model s otevřenými váhami a brzy přicházející efektivní model s otevřeným zdrojovým kódem.

Nové možnosti generování obrázků

Black Forest Labs představuje Flux 2, novou rodinu modelů pro generování obrázků. Tyto modely podporují vysoce kvalitní obrázky až do čtyř megapixelů a dokážou zpracovávat několik referenčních obrázků najednou. Využívají hybridní architekturu se spojením modelu pro rozpoznávání textu a obrázků.

Rodina modelů zahrnuje varianty pro různé účely, od čistých řešení API až po otevřené váhy pro vývojáře. Jednou z hlavních novinek je „podpora více referencí“, která umožňuje uživatelům zadávat až deset referenčních obrázků najednou, aby byla zajištěna konzistence postav, produktů nebo stylů. Model Flux 2 rovněž podporuje generaci a úpravu obrázků s rozlišením až do čtyř megapixelů.

Vylepšená prezentace textu

Byla také revidována prezentace textu: složitá typografie, infografiky a mockupy uživatelského rozhraní by nyní měly být spolehlivě generovány. Black Forest Labs slibuje zlepšené plnění pokynů, zejména u strukturovaných instrukcí a kompozičních omezení.

Hybridní architektura s Mistral-Vision-Language modelem

Technicky se Flux 2 opírá o kombinaci dvou komponent: jazykově-obrázkového modelu, který rozumí textu a obrázkům, a druhé části modelu, která zajišťuje logickou strukturu obrázku a správnost detailů, jako jsou tvary nebo materiály. Kromě toho existuje speciální kódovací modul obrázků, který pomáhá efektivně ukládat a obnovovat obrázky v vysoké kvalitě. Tyto komponenty spolupracují, aby model Flux 2 mohl generovat nové obrázky a upravovat již existující.

Čtyři varianty modelu pro různé uživatele

Rodina Flux 2 se dělí na čtyři hlavní modely, které se vyvažují mezi výkonem a možnostmi kontroly:

  • Flux 2 [pro]: Vrcholný model by měl nabízet kvalitu obrázků na úrovni nejlepších uzavřených modelů. Je dostupný prostřednictvím BFL Playground a BFL API.
  • Flux 2 [flex]: Tato varianta se zaměřuje na vývojáře, kteří chtějí mít kontrolu nad parametry, jako je počet kroků a měřítko vedení, aby vyvážili rychlost a kvalitu. Také tento model je dostupný přes Playground a API.
  • Flux 2 [dev]: Model s otevřenými váhami o velikosti 32 miliard parametrů. Kombinuje syntézu textu a obrázků a úpravu obrázků v jednom checkpointu. Váhy jsou k dispozici na platformě Hugging Face. Pro lokální spuštění na grafických kartách pro spotřebitele, jako jsou série GeForce RTX, existuje optimalizovaná implementace.
  • Flux 2 [malý]: Ještě nepředstavený model, který by měl být otevřeným zdrojem pod licencí Apache 2.0. Měl by být efektivnější než srovnatelné modely.

Přiznávám, není snadné objevit se týden po pravděpodobně nejvýznamnějším modelu obrázků posledních let. Ale Flux 2 se v mém velmi komplexním testovacím promptu ukázal jako výborný.

AI novinky bez hype – kurátorované lidmi

Se členstvím v THE‑DECODER se můžete těšit na reklamy bez obsahu a můžete se zapojit do naší komunity: diskutujte v systému komentářů, přijímejte náš každodenní zpravodaj AI, 6× ročně „AI Radar“ s nejnovějšími pokroky v AI výzkumu, až 25 % slevu na AI události a přístup do kompletního archivu za posledních deset let.

Please follow and like us:

Doporučené články