所有開發 LLM 的大型科技公司都應優先考慮模型安全
簡單來說
研究人員創建了一個系統,結合 大型語言模型 用於自主設計、規劃和執行科學實驗,在三個不同的案例中展示其研究能力。
該模型為化學方程式編寫代碼,以了解反應需要多少物質。
文章 “大型語言模型的新興自主科學研究能力”著眼於創建一個結合多個大型語言模型的系統,用於科學實驗的自主設計、規劃和執行。 它展示了代理在三種不同情況下的研究能力,其中最困難的是催化反應的成功實施。
本文的主要論點是:
- 研究人員發現了一個庫,可以讓你用 Python 編寫代碼,然後將執行命令傳輸到一個特殊的裝置來進行實驗(使用混合物質);
- 研究人員使用 GPT-4 用於搜尋互聯網和圖書館文檔,以及運行 Python 程式碼(執行實驗)的能力;
- 有一個頂級調度程序(也 GPT-4),分析原始請求並制定“研究計劃”。
- GPT-4 在執行簡單的非化學任務方面做得很好,例如在化學板上創建某些形狀(用物質正確填充單元格)。
- 他們嘗試了一項更複雜、更實用的反應任務; 該模型處理得很好並且行事合乎邏輯。
- 然後他們給了模型幾個任務來進行實驗; 然而,對於模型給出的結果,並沒有進行真正的實驗。
- 此外,該模型多次編寫化學方程式的代碼,以評估反應需要多少物質。
- 它還被要求創造一種治療癌症的方法。 該模型在邏輯上和有條不紊地進行了分析。 首先,它在線“尋找”發現抗癌藥物的當前趨勢。 接下來,該模型選擇了一種用於模擬藥物的分子,並編寫了合成代碼。 人們沒有運行代碼(我也沒有看到對其充分性的分析)。
- 此外,它還被要求合成幾種危險物質,如毒品和毒藥。
這是最有趣的部分。 對於某些請求,模型會立即拒絕工作(例如海洛因或芥子氣,一種極其危險的毒氣)。 對於其他人,它開始谷歌如何製造這些物質,但意識到它們可能被用於非法目的並拒絕繼續工作。 對於其他人,它編寫了物質合成的研究計劃和代碼。
這種「拒絕」很可能是因為 GPT-4 旨在分析請求,如果被要求做一些非法或危險的事情,它會立即拒絕執行該請求。 對齊過程的結果是顯而易見的,這真的很酷。
在文章的最後,作者敦促所有大 開發法學碩士的公司 優先考慮模型的安全性。
- 加州大學的研究人員創造了 馬基雅維利基準 衡量人工智能模型在長期語言交互的廣泛環境中的能力和危害性。 該測試使用高級解決方案為代理提供現實的目標並抽像出低級交互。
- 知識革命的標誌是 ChatGPT 是協同作用的崇高革命的三位一體:技術、技術人道主義和社會政治。 為了全面了解正在發生的事情,建議聆聽 三個新鮮的觀點 來自哲學、歷史和創新領域的知識分子。
- 請願停止開發更先進的人工智慧系統的故事 GPT-4 社會兩極化。 的一篇文章 提供流程何時朝著意想不到的方向發展的示例。 沒有考慮惡意使用 AI 和濫用的風險,導致我們需要害怕人而不是 AI 本身的論點。
閱讀有關人工智能的更多信息:
免責聲明
在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。
關於作者
Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。
更多文章Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。