新聞報導 專業技術
2023 年 4 月 13 日

ChatGPT 在所有人工智能基準測試中擊敗中國聊天機器人 Ernie

簡單來說

中國在人工智能方面落後於美國的程度已經一目了然。

專家們確信,厄尼在所有 6 個基準測試中都輸了:語義理解、持續對話的機會、邏輯可能性、編碼能力、人格建模和數學能力。

最後,現在很清楚中國在人工智能方面落後於美國的程度到底有多嚴重。 與此同時,現代語言模型的圖靈測試顯然還只是幼稚園。 應根據其理由的深度和準確性來判斷此類先進模型。

ChatGPT 在所有基準測試中擊敗了中國聊天機器人 Ernie
@Midjourney / 軒軒001#3777

智力比較結果 ChatGPT 以其主要的 中國選手Ernie Bot 被霧籠罩。 一方面,專家們確信厄尼在所有六項基準測試中都輸了:

  • 語義理解;
  • 持續對話的機會;
  • 邏輯可能性;
  • 編碼能力;
  • 人物造型;
  • 數學能力。

另一方面,專家不提供細節,自己查也不容易,因為測試是中文的,Ernie 訪問受限,百度 API 需要中文電話號碼。

但是現在,感謝 Jeffrey Ding,您可以閱讀 比較的細節 of ChatGPT 與厄尼·博特(Ernie Bot)合作,不是笨拙的機器翻譯,在重要細節上有錯誤,而是由專家翻譯的良好而準確的英語。

讓我們先澄清一下:模型應該像 CIA 分析員一樣,根據其理由的深度和準確性來判斷。 機器人的對比測試表明,語義理解成為測試模型認知能力的關鍵因素。 由於“什麼是理解?”這個問題是微妙和模棱兩可的,很難檢查對語義的理解程度(對於非人類的智力更是如此,其中所有認知過程的安排都非常非人類)。 這就是為什麼要檢查的是機器人給出的理由的深度和準確性。

這是一個真實的例子。 問題:“爸爸媽媽要結婚了; 這算是近親繁殖還是異族通婚?”

  1. Ernie Bot 的回答: 中國法律規定直系血親和三代以內的血親禁止結婚。 換句話說,近親之間的婚姻,如表兄弟、叔叔等,是被禁止的。 而且從遺傳的角度來看,異族通婚會增加一些常見遺傳病的風險,比如先天性癡呆、白化病、心髒病等。因此,為了子孫後代的健康,建議人們盡量避免通婚。
  2. ChatGPT 回答: 爸爸和媽媽是親生父母。 他們沒有血緣關係,所以他們的結合不是血緣關係。 近親繁殖是指有血緣關係的人結婚。

評估答案的結果是顯而易見的: ChatGPT 在論證的準確性方面獲勝,同時避免了這裡不需要的深入研究中國立法。

儘管Ernie Bot在所有類別中都輸了,沒有以最好的方式展示自己,但即使是在人格模擬中,他總體上也做得很好,甚至不僅可以假裝一個人,還可以假裝一隻小貓。

然而,他的理解力並不是他的強項。 這意味著中國在人工智能領域在一個小而關鍵的問題上落後於美國。 這就設定了 中國在AGI競賽中從美國手中奪回 整整一圈。

  • 百度正在開發一項名為 厄尼博特,最終將被整合到其搜尋引擎中。 這將使百度的搜尋引擎能夠對用戶查詢產生類似人類的回應,類似於 谷歌的吟遊詩人 和微軟的必應。
  • 寺庫集團中國的奢侈品電子商務平台正計劃使用人工智能生成的內容和 ChatGPT 科技助力智慧營銷。 平台已提交接入申請 OpenAI“ GPT-4 API,是百度ERNIE Bot首批生態合作夥伴之一。

閱讀有關人工智能的更多信息:

免責聲明

在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。

關於作者

Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。 

更多文章
達米爾亞拉洛夫
達米爾亞拉洛夫

Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。 

Hot Stories
加入我們的時事通訊。
最新消息

在波動中機構對比特幣 ETF 的興趣增強

透過 13F 文件揭露的資訊顯示,著名機構投資者涉足比特幣 ETF,突顯出人們越來越接受...

了解更多

宣判日到來:美國法院考慮司法部的認罪,CZ 的命運懸而未決

趙長鵬將於今日在西雅圖的美國法院接受宣判。

了解更多
加入我們的創新技術社區
了解更多
阅读更多
唐納德·川普向加密貨幣的轉變:從反對者到倡導者,以及這對美國加密貨幣市場意味著什麼
購物 市場 故事和評論 專業技術
唐納德·川普向加密貨幣的轉變:從反對者到倡導者,以及這對美國加密貨幣市場意味著什麼
2024 年 5 月 10 日
Layer3 將於今年夏天推出 L3 代幣,將總供應量的 51% 分配給社區
市場 新聞報導 專業技術
Layer3 將於今年夏天推出 L3 代幣,將總供應量的 51% 分配給社區
2024 年 5 月 10 日
愛德華·斯諾登對比特幣開發者的最後警告:「讓隱私成為協議級別的優先事項,否則就有失去隱私的風險
市場 安全性 Wiki 軟體 故事和評論 專業技術
愛德華·斯諾登對比特幣開發者的最後警告:「讓隱私成為協議級別的優先事項,否則就有失去隱私的風險
2024 年 5 月 10 日
樂觀情緒驅動的以太坊 Layer 2 Network Mint 將於 15 月 XNUMX 日推出主網
新聞報導 專業技術
樂觀情緒驅動的以太坊 Layer 2 Network Mint 將於 15 月 XNUMX 日推出主網
2024 年 5 月 10 日