新聞報導 微博 專業技術
2023 年 5 月 10 日

Anthropic 基於 60 條原則為聊天模型提出“上下文 AI”

簡單來說

OpenAI 使用來自人類反饋的強化學習 (RLHF) 來調整 語言模型 以人為本、安全和實用。

Anthropic 提出了另一種方法:上下文 AI,它涉及人們編寫模型應遵循的憲法。

本章程基於聯合國人權宣言、Apple 的服務條款、鼓勵考慮非西方觀點的原則。

Anthropic 提出了一種使用“憲法人工智能'。 該方法建立在 OpenAI“ 強化學習 來自人類反饋,但通過避免編寫深度訓練樣本的需要而建立在它的基礎上。 相反,該模型被訓練為通過使用憲法來響應輸入,該憲法旨在作為模型遵循的一組法律。

Anthropic 基於 60 條原則為聊天模型提出“上下文 AI”
人類網
推薦: EX-OpenAI 員工創立了 Anthropic,該公司已吸引超過 700 億美元的融資

通過這種方法,人工智能可以通過評估它所說的內容與它的一套合法接受的原則來生成自己的訓練樣本。 這種節省時間的技術可以看作是 艾薩克·阿西莫夫機器人定律 實行。

構成模型基礎的原則太多了,無法詳細討論。 然而,它們涵蓋了許多主題,例如道德、風險規避、經濟學和人工智能。 每一項的開發都是為了幫助指導 AI 在響應時做出決策 會話提示.

Anthropic 成功地訓練了一個名為 Claude 的人工智能模型,該模型成功地與 OpenAI“ ChatGPT。 使用 體質-AI方法, Claude 可以以令人印象深刻的準確度響應對話提示,但隨著 Anthropic 繼續以這種改變遊戲規則的技術為基礎,預計會有更多改進。

使用一組原則和一些過程示例,該模型被教導如何在整個第一階段評估和修改自己的回复。 第二階段涉及使用強化學習訓練模型,但它不是使用人類的輸入,而是使用基於一組原則的 AI 生成的反饋來選擇更良性的輸出。

事實上,這種新方法有可能為不再需要構建自己的訓練樣本的公司節省時間和金錢。 相反,這種“現成的”方法可以用作創建定制模型的基礎——不需要編程知識。 同樣重要的是要注意這項技術如何也有望提高會話機器人的安全性。 制定一套法律上接受的原則 減輕風險 AI 會流氓。

因此,Constitution AI 不僅有望讓聊天模型開髮變得更簡單、更快捷,而且更安全。 人工智能和聊天機器人世界的雙贏局面。

對 Anthropic 的聊天機器人“情境人工智能”的分析

Anthropic 的情境人工智能基於 60 多項原則,這些原則源自聯合國人權宣言、Apple 的服務條款、鼓勵考慮非西方觀點的原則、 Deepmind的 Sparrow Rules 和 Anthropic Research Set 1 和 Set 2。

事實上,人工智慧現在可以被教導按照從如此廣泛和多樣化的來源中得出的原則來行事,這確實是了不起的。 例如,透過納入《聯合國人權宣言》中的原則,聊天機器人的反應現在反映了維護自由、平等和兄弟情誼概念的重要性。 這些原則是確保 聊天機器人對話 保持道德和尊重。 同樣,Apple 服務條款的納入確保了 聊天機器人 考慮其用戶的隱私利益。

鼓勵考慮非西方觀點的原則在“情境人工智能”模型中也發揮著重要作用。 這些原則反映了 AI 需要尊重其他文化,並確保聊天機器人的響應不會被視為有害或冒犯性。 類似地,Deepmind 的 Sparrow 規則規定聊天機器人的響應旨在與用戶建立關係。

Anthropic Research Set 1 和 Set 2 的結合為人工智能對話保持文明和尊重提供了最終保證。 人工智能經過培訓,以確保它以周到和禮貌的方式回答問題。

總而言之,Anthropic 的“情境人工智能”模型是人工智能領域的一項極其重要的突破。 人工智能研究. 通過允許根據從如此廣泛的來源中得出的原則來教授 AI,自動對話的倫理意義得到了極大的改善。

閱讀有關人工智能的更多信息:

免責聲明

在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。

關於作者

Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。 

更多文章
達米爾亞拉洛夫
達米爾亞拉洛夫

Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。 

Hot Stories

Injective 與 AltLayer 聯手為 inEVM 帶來重新抵押安全性

by 艾莉莎戴維森
2024 年 5 月 03 日

Masa 與 Teller 合作推出 MASA 借貸池,支援 USDC 借貸

by 艾莉莎戴維森
2024 年 5 月 03 日

CARV 宣布與 Aethir 合作,以分散其數據層並分配獎勵

by 艾莉莎戴維森
2024 年 5 月 03 日
加入我們的時事通訊。
最新消息

Injective 與 AltLayer 聯手為 inEVM 帶來重新抵押安全性

by 艾莉莎戴維森
2024 年 5 月 03 日

Masa 與 Teller 合作推出 MASA 借貸池,支援 USDC 借貸

by 艾莉莎戴維森
2024 年 5 月 03 日

CARV 宣布與 Aethir 合作,以分散其數據層並分配獎勵

by 艾莉莎戴維森
2024 年 5 月 03 日

在波動中機構對比特幣 ETF 的興趣增強

透過 13F 文件揭露的資訊顯示,著名機構投資者涉足比特幣 ETF,突顯出人們越來越接受...

了解更多

宣判日到來:美國法院考慮司法部的認罪,CZ 的命運懸而未決

趙長鵬將於今日在西雅圖的美國法院接受宣判。

了解更多
加入我們的創新技術社區
了解更多
阅读更多
Injective 與 AltLayer 聯手為 inEVM 帶來重新抵押安全性
購物 新聞報導 專業技術
Injective 與 AltLayer 聯手為 inEVM 帶來重新抵押安全性
2024 年 5 月 3 日
Masa 與 Teller 合作推出 MASA 借貸池,支援 USDC 借貸
市場 新聞報導 專業技術
Masa 與 Teller 合作推出 MASA 借貸池,支援 USDC 借貸
2024 年 5 月 3 日
Velodrome 將在未來幾週內推出 Superchain Beta 版本,並在 OP 堆疊第 2 層區塊鏈上進行擴展
市場 新聞報導 專業技術
Velodrome 將在未來幾週內推出 Superchain Beta 版本,並在 OP 堆疊第 2 層區塊鏈上進行擴展
2024 年 5 月 3 日
CARV 宣布與 Aethir 合作,以分散其數據層並分配獎勵
購物 新聞報導 專業技術
CARV 宣布與 Aethir 合作,以分散其數據層並分配獎勵
2024 年 5 月 3 日