Jak dva studenti odmítli milionovou nabídku od Elona Muska a vytvořili revoluční AI

Před dvěma lety navrhl Elon Musk dvěma dvacetiletým studentům milionovou smlouvu, aby je přitáhl do své společnosti xAI. William Chen a Guan Wang, přátelé ze školních let z Michiganu, udělali to, co by většina lidí označila za šílenství — odmítli peníze nejbohatšího člověka na světě.

Namísto práce pro technologického giganta se rozhodli jít svou vlastní cestou a vytvořit umělou inteligenci, která funguje na principu lidského mozku. Dnes jejich startup Sapient Intelligence vykazuje výsledky, které překonávají modely OpenAI a Anthropic v testech zaměřených na abstraktní myšlení. Tento přelomový projekt zaujal pozornost odborníků a změní způsob, jakým přemýšlíme o umělé inteligenci.

První úspěch a nabídka od Muska

Vše začalo v laboratoři mozku na Tsinghua University v Pekingu. Chen a Wang vytvořili OpenChat — malý jazykový model, který trénovali ne na obrovských množstvích dat z internetu, ale na omezeném počtu kvalitních dialogů. Klíčovým prvkem se stalo použití učení s posilováním, kdy se systém učí na vlastních chybách, jako živý organismus.

Jejich projekt způsobil revoluci v akademických kruzích, dokázal totiž, že kvalita dat je důležitější než jejich množství. Právě tehdy dostali nabídku od Muska, který hledal talenty do xAI.

„Rozhodli jsme se, že velké jazykové modely mají své limity. Chtěli jsme novou architekturu, která překoná strukturální omezení tradičního strojového učení,“ vysvětlil Chen důvod odmítnutí.

HRM: Průlom v noci

Studenti věřili, že cesta k opravdové umělé inteligenci (AGI) nevede skrze zvětšování velikosti modelů, ale změnou jejich architektury. Tak se zrodil model HRM (Hierarchical Reasoning Model). Průlom nastal v červnu 2024, kdy ve 3 hodiny ráno Chen a Wang uviděli výsledky testů svého experimentálního prototypu. Malý model s 27 miliony parametrů, což je mikroskopická velikost oproti GPT-4, předčil velké hráče v oboru v úlohách na logiku:

Vyřešil komplexní sudoku (Sudoku-Extreme).
Našel optimální cesty v labyrinthech 30×30.
Ukázal impozantní výsledky v benchmarku ARC-AGI.

Jak to funguje: myšlení místo hádání

Na rozdíl od transformátorů (architektura GPT), které jednoduše předpovídají další slovo na základě statistik, HRM napodobuje práci lidského mozku. Má dvouvrstvou strukturu, která kombinuje „pomalé“ hluboké myšlení s „rychlými“ reflexními reakcemi.

„To není hádání. To je myšlení,“ říká Chen. Podle něj jejich model mnohem méně „halucinuje“ (vymýšlí fakta) a již vykazuje výsledky na úrovni state-of-the-art v předpovídání počasí, obchodování a medicíně.

Budoucnost Sapient

V současnosti se zakladatelé připravují na otevření kanceláře v USA a shánění nového financování. Jejich hlavní myšlenka zůstává radikální: AGI (obecná umělá inteligence, rovná lidské) není možné vytvořit prostým navyšováním výpočetní síly starých modelů. Budoucnost patří efektivním, „mozkovým“ architekturám.

Proč je to důležité

Příběh Chena a Wanga rozpadá mýtus, že k vytvoření revoluční AI potřebujete miliardy dolarů a datacentra velikosti města. Dokazuje, že v éře gigantů (jako Google, OpenAI, Microsoft) je stále místo pro „garážové“ inovace, pokud jsou založeny na geniální myšlence, a ne na hrubé síle výpočtů.

Please follow and like us: