微軟迫使法學碩士忘記哈利波特
微軟透露了一個方法 用於指示大型語言模型 (LLM) 忘記資料集中的特定訊息,而不需要完全重建訓練資料。 這種方法為改進法學碩士並有可能解決涉及版權內容的法律問題開闢了新的可能性。
微軟的團隊最近展示了他們如何能夠製作 Llama-2 模型忘記哈利波特書籍的細節,而不影響模型訓練資料中的其他資料或模型在其研究項目頁面上描述的研究中的整體表現。
該過程首先識別模型資料集中需要忘記的特定資訊。 在本例中,它是與 JK 羅琳標誌性系列相關的詳細信息,包括情節細節、角色名稱和名言。 然後,這些詞被系統地替換為通用的、不相關的短語。
然後,研究人員採用語言模型根據這些通用資料產生新資訊。 然後使用這些新數據重新訓練原始數據 Llama-2型號 逐漸地。 每走一步,模型都會與《哈利波特》系列書籍拉開距離,直到當被問及這些書籍時它開始產生幻覺反應。
這種方法的一個顯著特徵是它不會損害模型的整體性能。 這意味著雖然法學碩士越來越忘記特定數據,但其整體語言能力仍然完好無損。
儘管這種方法仍在完善中,但其影響是廣泛的。 特別是在涉及法律索賠和版權問題的情況下,它可能為那些創建法學碩士和其他人工智慧模型的人提供生命線。
這項創新是在人工智慧模型中使用受版權保護內容的法律糾紛不斷增加之際出現的。 例如, 《紐約時報》最近要求刪除 其出版物來自 GPT-4 數據集。 如果成功的話 法律挑戰,開發人員通常需要重建他們的模型資料集,這是一個耗時且資源密集的過程。 微軟的方法如果進一步完善和採用,可以為此類挑戰提供有效的解決方案。
微軟選擇性地忘記大型語言模型中特定資訊的方法(法學碩士)是人工智慧開發的重大突破,有可能解決受版權保護的內容問題並簡化改進。 這種方法可以應用於各個領域,展示負責任的人工智慧開發和應用。
免責聲明
在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。
關於作者
Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。
更多文章Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。