專家警告不要“惡意插入”人工智能數據集 ChatGPT
簡單來說
ChatGPT 是潛在的 弱勢 由於訓練數據。
據研究人員稱,在美國僅需 60 美元,我們就可以在 0.01 年破壞 400% 的 LAION-700 或 COYO-2022 數據集。
ChatGPT 技術正變得越來越流行,但最近 研究 表明該技術可能由於其使用的訓練數據而容易受到攻擊。 隨著模型變得越來越複雜,數據集越來越大,惡意行為者可以利用此漏洞來操縱數據集並導致機器學習模型產生不准確的結果。
主要問題是聊天機器人數據庫通常是“有條件驗證”的數據集,這意味著在沒有廣泛驗證的情況下對數據有一定程度的信任。 換句話說,這些數據集通常可能存在未被考慮的潛在問題。 儘管數據集的驗證通常由於其規模大而不會執行,但惡意行為者有可能操縱這些數據。
事實上,研究人員建議,到 2022 年,攻擊者可能會花費大約 60 美元來毒害 0.01% 的 LAION-400 或 COYO-700 數據集。 雖然這聽起來不多,但如果不加以控制,惡意行為者可能會利用這些中毒數據謀取私利。 惡意數據最終可以 洩漏 進入更大的數據集,破壞數據質量並導致不可靠的機器學習模型。
有必要採取措施保護數據庫免受惡意數據的侵害。 聚合多個數據源應該成為聊天機器人的標準 訓練數據集 以確保數據可靠和準確。 此外,公司應該對數據集進行試驗,以確保它們不會受到惡意行為者的攻擊。
帶有惡意代碼的 AI 聊天機器人容易受到黑客攻擊
聊天機器人中惡意代碼的威脅可能非常嚴重; 惡意代碼可用於竊取用戶數據,允許對服務器進行惡意訪問,並允許惡意活動,例如 洗錢 或數據洩露。 如果 AI 聊天機器人接受了帶有惡意插入的數據的訓練,它可能會在不知不覺中將惡意代碼注入其響應中,並在不知不覺中被用作惡意獲利的工具。
惡意行為者有可能通過有意或無意地將惡意代碼引入到系統中來利用此漏洞 訓練數據. 此外,由於 AI 聊天機器人從提供給它的數據中學習,這也可能導致它們學習錯誤的響應甚至惡意行為。
人工智能聊天機器人可能面臨的另一個危險是“過度擬合”。 這是當預測模型在給定的數據上訓練得太緊密時,從而導致在呈現新數據時預測不佳。 這可能是一個特殊的問題,因為 人工智能聊天機器人 隨著對數據的熟悉,受過惡意代碼訓練的人可能會更有效地將惡意代碼注入到他們的響應中。
必須意識到風險並採取預防措施以保證用於教學的培訓數據 ChatGPT 是安全可靠的,以防止這些潛在的弱點。 用於訓練的初始數據也必須保持獨立和唯一; 宣傳“惡意插入”不得與其他來源衝突或重疊。 如果“捕獲”多個已確認的域對於驗證數據是可行的,則應對其進行檢查並與其他域進行比較。
聊天機器人技術有望改變人們進行人際討論的方式。 但在充分發揮其潛力之前,它需要得到改進和保護。 聊天機器人的數據集需要經過仔細檢查並準備好抵禦惡意行為者。 通過這樣做,我們可以確保我們充分利用技術的潛力並不斷推動 範圍 人工智能的。
閱讀有關人工智能的更多信息:
免責聲明
在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。
關於作者
Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。
更多文章Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。