Novinky Technika
Listopadu 15, 2022

AI model MinD-Vis dokáže číst myšlenky lidí na základě mozkové aktivity

Stručně

Model AI dokáže interpretovat to, na čem člověk vidí mozkovou aktivitu – zde je návod

Nový model umělé inteligence nazvaný MinD-Vis dokáže interpretovat to, co člověk vidí, na základě mozkové aktivity. Model funguje na základě interpretace „mnemotechnických invariantů“, které jsou přítomny v mozku, když člověk vidí předmět. Tyto mnemotechnické invarianty jsou vzory, které jsou uchovány v různých vzpomínkách na stejný objekt.

MinD-Vis: Nový model difúze umělé inteligence pro čtení myšlenek

Aby autoři získali globální zakotvení mozkové aktivity, nejprve vycvičili model s vlastním dohledem (stejný pro různé lidi). Poté zavedli křížovou pozornost na tyto mentální reprezentace pomocí předem trénovaných Latentní difúze. Model byl schopen po rychlém doladění na 1.5k obrazu zcela rozluštit, co člověk před sebou vidí-fMRI páry!

Aby bylo možné lépe porozumět lidskému zrakovému systému a poskytnout základy pro propojení lidského a počítačového vidění prostřednictvím rozhraní Brain-Computer Interface, pokouší se dekódování vizuálních podnětů ze záznamů mozku rozšířit naše chápání vizuálního systému. Složitost základních reprezentací mozkových signálů a nedostatek anotací dat ztěžují opětovné vytvoření přesných obrazů ve vysoké kvalitě ze záznamů mozku.

Model byl schopen po rychlém jemném doladění na 1.5k párech obrázek-fMRI úplně dešifrovat, co člověk vidí před sebou!

Za prvé, pomocí modelování masky v rozsáhlém latentním prostoru inspirovaném řídkým kódováním informací v primárním zrakovém kortexu vytváříme účinnou reprezentaci dat fMRI s vlastním dohledem. Poté prokážeme, že MinD-Vis dokáže přestavět vysoce věrohodné obrázky se sémanticky shodnými detaily ze záznamů mozku pomocí minimálního počtu párových anotací přidáním dvojitého kondicionování k modelu latentní difúze.

Výzkumníci tvrdili

Podle experimentálních výsledků strategie překonala současnou technologii sémantického mapování (100cestná sémantická klasifikace) a kvalitu generace (FID) o 66 %, resp. 41 %. Model byl testován jak kvalitativně, tak kvantitativně. Za účelem vyhodnocení rámce byla také provedena důkladná studie o ablaci.

Tréninková data, kód a modelové váhy jsou dostupné veřejnosti na požádat.

Vědci se domnívají, že model by mohl být použit k vývoji protetiky pro lidi, kteří jsou nevidomí nebo slabozrací. Mohla by být také použita k pomoci lidem s poruchami paměti, jako je Alzheimerova choroba.

Čtěte více:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Další články
Damir Yalalov
Damir Yalalov

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Hot Stories
Připojte se k našemu zpravodaji.
Novinky

The DOGE Frenzy: Analýza nedávného nárůstu hodnoty dogecoinu (DOGE).

Odvětví kryptoměn se rychle rozrůstá a meme coiny se připravují na výrazný vzestup. Dogecoin (DOGE),...

Vědět více

Vývoj obsahu generovaného umělou inteligencí v Metaverse

Vznik generativního obsahu umělé inteligence je jedním z nejvíce fascinujících pokroků ve virtuálním prostředí...

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
OKX Jumpstart uvádí Runecoiny, umožňuje sázky BTC k vydělávání tokenů RUNE
Trhy Novinky Technika
OKX Jumpstart uvádí Runecoiny, umožňuje sázky BTC k vydělávání tokenů RUNE
29. dubna 2024
Nejlepší nabídky tohoto týdne, velké investice do AI, IT, Web3a kryptoměny (22-26.04)
Strávit Business Trhy Technika
Nejlepší nabídky tohoto týdne, velké investice do AI, IT, Web3a kryptoměny (22-26.04)
26. dubna 2024
Vitalik Buterin komentuje centralizaci PoW a poznamenává, že to byla dočasná fáze do PoS
Novinky Technika
Vitalik Buterin komentuje centralizaci PoW a poznamenává, že to byla dočasná fáze do PoS
26. dubna 2024
Offchain Labs odhaluje objev dvou kritických zranitelností v důkazech o podvodech OP Stack společnosti Optimism
Novinky Vývoj Technika
Offchain Labs odhaluje objev dvou kritických zranitelností v důkazech o podvodech OP Stack společnosti Optimism
26. dubna 2024
CRYPTOMERIA LABS PTE. LTD.