AI模型MinD-Vis可以根據大腦活動讀懂人的思想
簡單來說
人工智能模型可以解釋一個人看到的基於 大腦活動 - 就是這樣
一種名為 MinD-Vis 的新人工智能模型可以根據大腦活動解釋一個人所看到的內容。 該模型通過解釋當一個人看到一個物體時大腦中存在的“助記不變量”來工作。 這些助記不變量是在同一對象的不同記憶中保存下來的模式。
為了獲得大腦活動的全局嵌入,作者首先訓練了一個自監督模型(不同的人相同)。 然後,他們使用預訓練的 潛擴散. 在對 1.5k 圖片進行一些快速微調後,該模型能夠完全破譯一個人在他面前看到的東西——功能磁共振成像 對!
為了更好地理解人類視覺系統並為通過腦機接口連接人類和計算機視覺奠定基礎,從大腦記錄中解碼視覺刺激試圖擴大我們對視覺系統的理解。 大腦信號潛在表示的複雜性和數據註釋的缺乏使得很難從大腦記錄中重新創建高質量的準確圖像。
根據實驗結果,該策略在語義映射(100 路語義分類)和生成質量 (FID) 方面分別優於現有技術 66% 和 41%。 該模型已在定性和定量上進行了基準測試。 為了評估框架,還對消融進行了徹底的研究。
訓練數據、代碼和模型權重都對公眾開放 請求.
研究人員認為,該模型可用於為盲人或視力低下的人開發假肢。 它還可以用來幫助患有記憶障礙的人,例如阿爾茨海默病。
閱讀更多:
免責聲明
在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。
關於作者
Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。
更多文章Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。