Nová technika pro dekódování myšlenkových obrazů pomocí umělé inteligence

V Japonsku vyvinul vědec techniku, která využívá skenery mozku a umělou inteligenci k převodu mentálních obrazů na přesné popisné věty. I když se již udělaly pokroky v použití skenerů mozkové aktivity k převodu myšlených slov na text, převod složitých mentálních obrazů do jazyka se ukázal jako výzva, podle Tomoyasu Horikawy, autora studie publikované v časopise Science Advances.

Nová metoda Horikawy, známá jako „mind-captioning“ (mentální titulkování), funguje tím, že umělá inteligence generuje popisný text, který odráží informace v mozku o vizuálních detailech, jako jsou objekty, místa, akce a události, stejně jako vztahy mezi nimi.

Horikawa, výzkumník v Laboratořích komunikačních věd společnosti NTT v Tokiu, začal analyzovat mozkovou aktivitu šesti účastníků, mluvčí japonského jazyka ve věku od 22 do 37 let, při sledování videoklipů. Účastníci sledovali 2 180 videí bez zvuku, která trvala pouze několik sekund a obsahovala různé objekty, scény a akce.

Velké jazykové modely — generativní AI systémy vytrénované na rozsáhlých datových sadách — vzaly titulky k videím a převedly je na číselné sekvence. Horikawa trénoval jednodušší modely AI, známé jako „dekodéry“, aby spojily skenovanou mozkovou aktivitu související s videoklipy s těmito číselnými sekvencemi.

Poté použil dekodéry k interpretaci mozkové aktivity účastníků studie při sledování nebo vzpomínání na videa, s nimiž AI během tréninku nepracovala. Byl vyvinut další algoritmus, který postupně generoval sekvence slov, které nejlépe odpovídaly dekódované mozkové aktivitě.

Jak se AI učila z dat, nástroj popisného textu se stále zlepšoval v používání skenerů mozku a popisování videí, která účastníci viděli. „Je to jen další krok k tomu, co, podle mě, můžeme legitimně nazvat čtením mozku nebo čtením myšlenek,“ uvedl Marcello Ienca, profesor etiky AI a neurovědy na Technické univerzitě v Mnichově.

Potenciál pro hluboké zdravotní zásahy

Model AI generoval text v angličtině, i když účastníci nebyli rodilí mluvčí angličtiny. Tato metoda může vytvářet úplné popisy vizuálního obsahu, dokonce aniž by použila aktivitu v oblastech mozku souvisejících s jazykem, známými jako „jazyková síť“.

Tato technologie by mohla být potenciálně použita k pomoci lidem s afázií, kteří mají potíže s vyjadřováním, nebo s amyotrofickou laterální sklerózou (ALS), neurodegenerativním onemocněním, které ovlivňuje řeč. „Myslím, že tato studie otvírá cestu k hlubokým zásahům pro lidi, kteří mají potíže s komunikací,“ dodal psycholog Scott Barry Kaufman.

Etické otázky a související obavy

Úspěch této metody, která by mohla být aplikována i na rozluštění myšlenek dětí nebo zvířat, „vyvolává etické obavy“ ohledně soukromí a možnosti odhalení soukromých myšlenek osoby předtím, než je verbálně vyjádří. „Pokud tato technologie v budoucnu bude použita spotřebiteli mimo biomediální účely, myslím, že to je maximální výzva v oblasti soukromí,“ zdůraznil Ienca.

Dodal, že existuje mnoho firem, jako je Neuralink, startup Elona Muska, které veřejně tvrdí, že brzy uvedou na trh neuronové implantáty pro širší populaci. „Pokud se dostaneme k tomu, potřebujeme mít velmi, velmi přísná pravidla ohledně přístupu k myslím a mozkům lidí,“ řekl Ienca.

Horikawa však podotkl, že metoda použitá v jeho studii vyžaduje velké množství sběru dat, s aktivní spoluprací účastníků. „I když je technologie užitečná pro neurovědecký výzkum, není tak přesná pro praktické využití,“ komentoval.

Na závěr, i když někteří lidé mohou mít obavy, že tato technologie představuje závažné riziko pro mentální soukromí, „současný přístup nemůže snadno číst soukromé myšlenky osoby,“ uzavřel Horikawa.

Please follow and like us: