新聞報導 專業技術
2023 年 6 月 21 日

研究人員發現了一種檢測人工智能生成文本的新方法

簡單來說

研究人員開發了一種使用 RoBERTa 模型檢測 AI 生成文本的方法,該模型提取文本標記的嵌入並將它們可視化為多維空間中的點。

他們發現生成的文本 GPT-3.5型號,例如 ChatGPT 和達芬奇的文本的平均尺寸明顯低於人類書寫的文本。

研究人員創建了一種強大的基於維度的檢測器,可以抵抗常見的規避技術。

當域和模型發生變化時,檢測器的準確度始終保持較高水平,但在使用 DIPPER 技術時,閾值固定,準確度下降 40%。

研究人員調查了 AI 生成的文本領域,並 開發了一種檢測人工智能生成內容的方法 模型如 GPT 和 Llama. 他們通過利用分數維度的概念發現了關於生成文本的性質的有趣見解。 他們的發現揭示了人類編寫的文本與人工智能模型生成的文本之間的內在差異。

研究人員發現了一種檢測人工智能生成文本的新方法
信用: Metaverse Post (mpost.io)
閱讀: AI 檢測器可檢測到的前 100 多個單詞

從自然語言文本導出的點雲的維度能否提供有關其起源的有用信息? 研究人員使用 RoBERTa 模型提取文本標記的嵌入,並將它們可視化為多維空間中的點來對此進行研究。 他們使用受先前作品啟發的複雜技術估計了這些點雲的分數維。

研究人員驚訝地發現,由 GPT-3.5型號,例如 ChatGPT 和達文西的文字的平均尺寸明顯低於人類書寫的文字。 這種有趣的模式在各個領域都持續存在,甚至在替代模型(例如 GPT-2 或使用OPT。 值得注意的是,即使使用專為避免偵測而設計的 DIPPER 釋義,尺寸也只改變了約 3%。 這些發現使研究人員能夠創建一個強大的基於維度的探測器,可以抵抗常見的規避技術。

值得注意的是,當領域和模型發生變化時,檢測器的準確度始終保持較高水平。 在固定閾值的情況下,檢測準確率(真陽性率)保持在75%以上,而假陽性率(FPR)保持在1%以下。 即使檢測系統受到 DIPPER 技術的挑戰,準確度也下降至 40%,優於現有檢測器,包括由 OpenAI.

此外,研究人員探索了多語言模型(如多語言 RoBERTa)的應用。 這使他們能夠為英語以外的語言開發類似的檢測器。 雖然嵌入的平均內部維度因不同語言而異,但對於每種特定語言,生成文本的維度始終低於人類編寫的文本。

然而,探測器表現出一些弱點,特別是當面對高生成溫度和原始 發電機型號. 在更高的溫度下,生成文本的內部尺寸可能會超過人類書寫文本的內部尺寸,從而使檢測器失效。 幸運的是,已經可以使用替代方法檢測到此類生成器模型。 此外,研究人員承認,除了 RoBERTa 之外,還有探索替代模型來提取文本嵌入的空間。

區分人類和 AI 編寫的文本

在一月, OpenAI 宣布 推出一種新的分類器,旨在區分人類編寫的文本和人工智能係統生成的文本。 該分類器旨在解決由 AI 生成的內容越來越普遍所帶來的挑戰,例如錯誤信息宣傳活動和學術不誠實行為。

雖然檢測所有人工智慧編寫的文字是一項複雜的任務,但該分類器可以作為減少虛假聲明的寶貴工具。 人工智慧生成文本中的人類作者身份。 透過對一組英文文本的嚴格評估,開發人員發現分類器準確地將26% 的AI 編寫的文本識別為「可能是AI 編寫的」(正確),同時偶爾會將人類編寫的文本錯誤地標記為AI 產生的(錯誤)積極)9%。 值得注意的是,分類器的可靠性隨著輸入文字長度的增加而提高。 與先前的分類器相比,這個新版本對最新人工智慧系統產生的文字表現出明顯更高的可靠性。

為了收集有關此分類器等不完善工具的有用性的寶貴反饋,開發人員已經做到了 公開的. 您可以免費試用我們的半成品分類器。 但是,必須了解其局限性。 分類器應該用作確定文本來源的輔助工具,而不是主要的決策資源。 它在短文本上表現出很高的不可靠性,並且在某些情況下,人類編寫的文本可能會被錯誤地標記為人工智能生成的。

值得注意的是,高度可預測的文本無法一致地識別,例如前 1,000 個素數的列表。 編輯人工智能生成的文本也可以幫助逃避分類器,雖然我們可以根據成功的攻擊更新和重新訓練分類器,但檢測的長期優勢仍然不確定。 此外,分類器基於 神經網絡 通常在訓練數據之外校準得很差,導致對與訓練集顯著不同的輸入進行錯誤預測的極大信心。

免責聲明

在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。

關於作者

Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。 

更多文章
達米爾亞拉洛夫
達米爾亞拉洛夫

Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。 

Hot Stories

Lisk 正式過渡到以太坊 Layer 2 並推出 Core v4.0.6

by 艾莉莎戴維森
2024 年 5 月 08 日

2024 年 7 月新 Meme 幣:加密貨幣愛好者的 XNUMX 個精選

by 維多利亞·帕爾奇克
2024 年 5 月 08 日
加入我們的時事通訊。
最新消息

Lisk 正式過渡到以太坊 Layer 2 並推出 Core v4.0.6

by 艾莉莎戴維森
2024 年 5 月 08 日

2024 年 7 月新 Meme 幣:加密貨幣愛好者的 XNUMX 個精選

by 維多利亞·帕爾奇克
2024 年 5 月 08 日

在波動中機構對比特幣 ETF 的興趣增強

透過 13F 文件揭露的資訊顯示,著名機構投資者涉足比特幣 ETF,突顯出人們越來越接受...

了解更多

宣判日到來:美國法院考慮司法部的認罪,CZ 的命運懸而未決

趙長鵬將於今日在西雅圖的美國法院接受宣判。

了解更多
加入我們的創新技術社區
了解更多
阅读更多
Lisk 正式過渡到以太坊 Layer 2 並推出 Core v4.0.6
新聞報導 專業技術
Lisk 正式過渡到以太坊 Layer 2 並推出 Core v4.0.6
2024 年 5 月 8 日
2024 年 7 月新 Meme 幣:加密貨幣愛好者的 XNUMX 個精選
消化 市場 專業技術
2024 年 7 月新 Meme 幣:加密貨幣愛好者的 XNUMX 個精選
2024 年 5 月 8 日
Synternet 將 Peaq 整合到其資料層中,利用即時 DePIN 資料為事件驅動的 DApp 提供支持
購物 新聞報導 專業技術
Synternet 將 Peaq 整合到其資料層中,利用即時 DePIN 資料為事件驅動的 DApp 提供支持
2024 年 5 月 8 日
伊朗大規模加密貨幣挖礦活動對美國國家安全構成直接威脅,參議員敦促政府立即採取行動
市場 故事和評論 專業技術
伊朗大規模加密貨幣挖礦活動對美國國家安全構成直接威脅,參議員敦促政府立即採取行動
2024 年 5 月 8 日