德州研究人員提出基於大腦 MRI 信號和 AI 重建文本的新方法
簡單來說
德克薩斯大學提出了一種新方法,可以根據 MRI 大腦信號重建一個人聽到的文本。
該方法涉及訓練編碼器網絡以恢復與文本對應的大腦 MRI 圖像,並使用預訓練的語言模型生成繼續文本的選項。
統計上 生成的文本 比隨機的更接近原始,可以用來探索大腦不同部分的功能。
德克薩斯大學的研究人員提出了一種從 MRI 大腦信號中重建文本的新方法。 此外,解碼發生在語義上與真實文本相似的連貫文本中。
之前已經嘗試過解碼一個人聽到(或在他們腦海中說出)的文本。 根據信號從大腦中取出的方式,有兩種不同的方法。 入侵式信號提取是第一個:一種芯片 直接從大腦讀取衝動 神經元被放置在人的顱骨中。 該方法具有侵入性、昂貴且複雜。 非侵入性信號提取技術,包括 MRI 和 M/EEG,是第二種選擇; 它們不需要任何鑽孔,而且更便宜。
然而,用於收集大腦信號的非侵入性技術有一個嚴重的缺陷:一個人的 MRI 讀數在受到刺激(例如聽到一個詞)後大約 10 秒內會受到該刺激的影響。 一個英語母語者平均每秒可以說兩個單詞。 事實證明,如果您在聽說英語的人說話時記錄 MRI 信號,則每張 MRI 圖像都包含有關大腦處理大約 XNUMX 個單詞的數據。
因此,使用 MRI 不可能忠實地再現一個人聽到的文本。 此外,許多關於從使用非侵入性技術收集的大腦信號中恢復文本的主題的早期研究僅成功地檢索了特定的單詞和短語。
得克薩斯州的研究人員開發了一種 MRI 技術來重建(幾乎)可理解的文本。 這段文字與人們實際聽到的內容之間會有一些差異。 然而,它在語義上是等價的,這意味著它將代表通常被接受的解釋。
為了恢復與這段文字相關的大腦 MRI,研究人員訓練了編碼器網絡,該網絡從一段文字中學習。 然後,使用預先訓練的語言模型(例如 GPT),研究者執行以下步驟:
- 研究人員問 GPT 為每兩秒推進一次文本創造無數可能性。 編碼器網絡接收到這些選項並嘗試使用它們來恢復當前的 MRI 圖像。 我們認為允許最準確地表示真實 MRI 信號的文本版本是準確的。
這是一個例子:
原始輸入 | 發電量 |
我不知道是該尖叫、哭泣還是逃跑。 相反,我說:“別管我; 我不需要你的幫助。” 亞當不見了,我一個人哭著打掃衛生。 | 我開始尖叫和哭泣,然後她只是說,我告訴過你別管我; 你不能再傷害我了。 對不起,”然後他怒氣沖沖地離開了。 雖然我以為他已經離開了,但我還是哭了起來。 |
如果你用它來編造演講而不是聽別人的錄音,這項技術將有很多用途。 甚至虛構語音的重建也是文章作者的實驗主題。 再一次,最終文本被證明比隨機文本更類似於原始文本。 該方法似乎有效。
借助此類模型,您可以研究不同大腦區域的運作。 在這項研究中,大腦中處理可聽語音的三個獨立區域被用來生成 MRI 信號。 通過從模型輸入中添加和消除來自大腦各個部分的信號,可以了解信息的哪一部分由大腦的哪個區域處理。 此外,您可以對比使用來自其他組件的信號重建的編碼器模型。
閱讀有關人工智能的更多信息:
免責聲明
在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。
關於作者
Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。
更多文章Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。