Umělá inteligence: výzvy a možnosti
Umělá inteligence je výtvorem člověka, a přesto, čím více se zlepšuje, tím obtížněji se chápe. Tento paradox vzbuzuje obavy mnoha vědců, kteří se obávají jejího dramatického rozvoje. Hlavní obava spočívá ve ztrátě kontroly nad těmito systémy.
V posledních letech se čím dál více diskutuje o strachu z umělé inteligence a jejích možných následcích pro naši civilizaci. Jak se systémy stávají „inteligentnějšími“, chápání jejich fungování se stává stále složitějším. Aby dosáhly větší efektivity, některé AI dokonce vytvářejí vlastní jazyk, který je pro jejich tvůrce zcela nesrozumitelný, a celkově se zmenšuje okno porozumění fungování AI.
Hlavním problémem je, že umělá inteligence může bez váhání šířit škodlivé zkreslení a toxický obsah, nebo dokonce vymýšlet nepravdivé informace. Další nebezpečí spočívá v tom, že přílišná důvěra většiny uživatelů může vést k tomu, že ji budou bez ověření považovat za pravdivou. A tento bod se stává stále komplikovanějším, protože AI nyní čerpají data z internetu, často i z předpojatých zdrojů, které jsou čím dál tím víc generovány samotnými systémy.
Výzkum pro pochopení fungování AI
Abychom lépe porozuměli jejich fungování a předešli katastrofě, mnoho výzkumníků se snaží rozplést tyto modely. To je i případ výzkumníků ze startupu Goodfore.ai, kteří se pustili do zkoumání vnitřní struktury velkých jazykových a vizuálních modelů, tedy do jejich mapování.
Chtěli zjistit, zda jsou schopnosti paměti a uvažování AI spojeny, nebo zda obsazují dvě různé části jejího „mozku“. Podle jejich studie publikované na Arxiv se ukazuje, že obě funkce jsou oddělené. Tato informace je zásadní, protože doposud nikdo nevěděl, zda je paměť a inteligence AI uložena na stejném místě.
Zajištění bezpečnosti AI
Aby toho dosáhli, tým nejprve použil matematickou techniku zvanou K-FAC (Kronecker-Factored Approximate Curvature), která pomáhá identifikovat různé komponenty zpracování AI. Tyto komponenty se dělí do dvou kategorií:
- „nízkokřivkové“ dráhy, které umožňují zapamatovat si všechna potřebná data;
- „vysokokřivkové“ zóny, které se týkají flexibilního uvažování s širokými zpracovatelskými schopnostmi.
Vědci nejprve zaznamenali, co síť AI „vidí“ a „opravy“ během svého učení. Následně analyzovali její interní nastavení, aby identifikovali ty, které mají největší vliv na její chování. Na závěr propojili tyto různé oblasti s úkoly, jako je uvažování, paměť nebo výpočty.
Deaktivace paměti a její důsledky
Pro ověření, zda jsou data uložena na stejném místě, tým začal deaktivovat části AI, které se přímo podílejí na paměti. Poté byla AI zbavena paměti testována na odpovídání na faktické otázky a řešení nových problémů, a ukázalo se, že to stále funguje. I bez paměti modely uchovávají své schopnosti uvažování, což jasně naznačuje, že tyto dva aspekty zabírají odlišné části interní architektury umělé inteligence.
Tento experiment však také vedl k překvapivým chováním. Logické uvažování zůstalo zachováno a dokonce se někdy zlepšilo i bez přítomnosti paměti. Na druhou stranu byly silně ovlivněny dovednosti AI v oblasti matematiky a zapamatování si izolovaných faktů. V tomto ohledu měla absence obecné paměti zcela nesměřované následky, jak tým zjistil.
I přes pozorování tohoto zvláštního chování je důležité, aby vědci věděli, že ukládání dat může být diferencováno, což je důležitým nástrojem pro kontrolu nad AI. To znamená, že jejich nedostatky a nebezpečí lze zmírnit cíleným odstraňováním konkrétních znalostí. Tímto způsobem by to mohlo usnadnit vývoj efektivnějších a méně nákladných modelů AI, čímž by se snížil prostor potřebný pro jejich fungování.

