Stability AI的 StableVicuna 是第一個經過人類反饋訓練的聊天機器人
簡單來說
Stability AI 發布了 StableVicuna,這是第一個大規模開源聊天機器人,它使用帶有人類反饋的強化學習 (RLHF)。
StableVicuna 基於 Vicuna 聊天機器人,使用 13 億個參數 LLaMA 模型。
Stability AI 有 介紹 其在 AI 領域的最新突破是 StableVicuna,這是第一個經過人類反饋訓練的大型開源聊天機器人。 創新的聊天機器人是 Stability AI,創建流行的開源圖像模型的公司, Stable Diffusion,以及最新的AI圖像生成算法, 深弗洛伊德.
StableVicuna 基於 13 月發布的 Vicuna 聊天機器人,使用了 XNUMX 億個參數 LLaMA 模型。 是什麼決定了駱馬毛變種 Stability AI 與 Carper AI 的不同之處在於它使用了帶有人類反饋的強化學習 (RLHF)。 該方法使得模型能夠不斷改進。
Stability AI 表明聊天機器人的成功歸因於兩種訓練方法類型:指令微調和通過人類反饋進行強化學習。 然而,大多數現有的聊天機器人模型僅使用其中一種方法,而不是同時使用兩種方法。 最近,RLHF 訓練的數據集已公開。 因此,連同用戶友好的培訓工具,這使得 StableVicuna 的創建成為可能,這是第一個大規模的 聊天機器人模型 包含這兩種類型的培訓。
StableVicuna 結合了文本生成、簡單的數學函數和編寫代碼的能力。 它與通用基準測試中的其他開源聊天機器人相當。
根據 解碼器,使用其他聊天機器人的數據進行微調的開源聊天機器人有可能通過重複訓練放大現有的錯誤和偏見,從而導致迴聲室效應。 微調數據還可以通過引入原始模型中不存在的信息來加劇幻覺。
用戶可以訪問聊天機器人的演示 擁抱臉. 該公司還披露了未來通過聊天界面提供 StableVicuna 的計劃。
閱讀更多:
免責聲明
在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。
關於作者
Agne 是一名記者,負責報導虛擬宇宙、人工智能和人工智能領域的最新趨勢和發展。 Web3 行業為 Metaverse Post。 她對講故事的熱情促使她對這些領域的專家進行了大量採訪,總是試圖發現令人興奮和引人入勝的故事。 Agne 擁有文學學士學位,在旅行、藝術和文化等廣泛主題的寫作方面擁有豐富的背景。 她也志願擔任動物權利組織的編輯,幫助提高人們對動物福利議題的認識。 聯繫她 [電子郵件保護].
更多文章Agne 是一名記者,負責報導虛擬宇宙、人工智能和人工智能領域的最新趨勢和發展。 Web3 行業為 Metaverse Post。 她對講故事的熱情促使她對這些領域的專家進行了大量採訪,總是試圖發現令人興奮和引人入勝的故事。 Agne 擁有文學學士學位,在旅行、藝術和文化等廣泛主題的寫作方面擁有豐富的背景。 她也志願擔任動物權利組織的編輯,幫助提高人們對動物福利議題的認識。 聯繫她 [電子郵件保護].