意見 專業技術
2023 年 2 月 10 日

馬克斯普朗克研究所: GPT-3 認知能力測量產生驚人的結果

簡單來說

人工智能在決策方面至少已經達到了人類的水平。

德國馬克斯普朗克生物控制論研究所決定對此進行測試,並進行了一項研究來比較人類和人類的認知能力。 GPT-3.

研究人員決定通過對人們進行規範的心理測試來檢驗這一點,以測試他們在決策、信息搜索和因果關係方面的技能。

更引人注目的是,人工智能的這種能力不僅在人類的水平上,而且還會犯人類常見的錯誤。

根據研究結果,人工智慧的決策能力已經與人類相當 GPT-3 馬克斯普朗克研究所進行的認知能力測量。

對大型語言模型(如 GPT-3 繼續激烈爭論是否取得突破性成果 ChatGPT 機器人,它使用 GPT-3 技術,證明機器人與人類一樣聰明。 不過,爭論毫無意義: defi“智能”一詞的定義是模糊的。 每個人都認為智力是另外一回事,而且智力的範圍 definits 是巨大的:

  • 從 defi琳達·戈特弗雷德森(Linda Gottfredson) 認為,“智力是一種不可或缺的心理能力,包括總結、計劃、解決問題、抽象思考、理解複雜想法以及從經驗中快速學習的能力。 ”
  • 同時,根據愛德華·博林 (Edward Boring) 的說法,“智力是智力測試所衡量的。”
馬克斯普朗克研究所: GPT-3 認知能力測量產生了驚人的結果
@Midjourney / 卡科埃斯
推薦帖子: TOP 5 GPT- 2023 年為 Google Sheets 和 Docs 提供支援的擴展

事實使情況變得複雜,無論人們怎麼說,沒有明確的理由出現與人類相媲美的大型智慧語言模型。 畢竟唯一能做的就是 GPT-3 (和 ChatGPT) 可以做的是根據人們編寫的文本中單詞序列樣本的巨大統計數據巧妙地預測下一個單詞。

然而,僅此技能就可以 ChatGPT 令人驚訝的創造力:除了回答提出的任何問題之外,它還能夠編寫故事、科學文章、論文,甚至代碼(這足以 通過一些考試 在人類層面)。

但是,這個理由是否足以討論人工智慧的出現(基於 GPT-3 和 ChatGPT)具有與人類智力相當的智力?

為了回答這個問題,讓我們回顧一下格雷戈里·特雷弗頓的 defi“智力最終是講故事”(這 defi概念解釋了為什麼智力和理性在英語中被包含在同一個詞中)。

這裡的邏輯是這樣的:

  • 智力,無論其形式如何 defined,旨在用於非平凡任務中的複雜決策。
  • 在做出這樣的決定時,除了形式思維外,敘事思維也起著巨大的作用; 例如,在法理學中,當陪審團做出決定時,不是形式思維而是敘述在他們如何評估證據和做出判決決定方面起著決定性作用。
  • 那麼為什麼不應該 ChatGPT高度發達的敘事和形式思維是類人智能出現的基礎嗎?

德國馬克斯普朗克生物控制論研究所決定對此進行測試,並進行了一項研究來比較人類和人類的認知能力。 GPT-3。 研究人員決定透過對人們進行典型的心理測驗來檢驗這一點,以測試他們在決策、資訊搜尋和因果關係方面的技能。

馬克斯普朗克研究所: GPT-3 認知能力測量產生了驚人的結果
@Midjourney / 卡科埃斯
推薦帖子: 10 年面向數字營銷人員的 2023 大人工智能 SEO 工具

研究結果,發表在美國國家科學院院刊上,令人驚嘆:

  • 人工智能解決了根據描述做出正確決策的問題,與人類一樣好,甚至更好。
  • 更引人注目的是,人工智能的這種能力不僅在人類的水平上,而且還會犯人類常見的錯誤。

此外,做出正確決定的能力在小插圖描述的任務中得到了測試:對人和/或情況的簡短描述,人們會根據這些描述表達他們的想法、價值觀、社會規範或他們自己的印象。 AI 中似乎不存在上述任何內容。 然而,這並不妨礙人工智能做出與人類相同的決定。

在另外兩個認知能力上,人工智能都不及人類。

  • 在查找資料時, GPT-3 沒有顯示定向研究的跡象。
  • 在因果問題中, GPT-3 雖然是小孩子的水平,但也僅止於此。

作者認為,為了趕上擁有這兩種能力的人,人工智能缺乏的只是與我們以及與世界其他地方的積極溝通,但它很快就會過去。 畢竟,數百萬人已經與 ChatGPT.

閱讀更多關於 ChatGPT 和人工智能:

免責聲明

在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。

關於作者

Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。 

更多文章
達米爾亞拉洛夫
達米爾亞拉洛夫

Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。 

Hot Stories
加入我們的時事通訊。
最新消息

在波動中機構對比特幣 ETF 的興趣增強

透過 13F 文件揭露的資訊顯示,著名機構投資者涉足比特幣 ETF,突顯出人們越來越接受...

了解更多

宣判日到來:美國法院考慮司法部的認罪,CZ 的命運懸而未決

趙長鵬將於今日在西雅圖的美國法院接受宣判。

了解更多
加入我們的創新技術社區
了解更多
阅读更多
Morph 推出其 Holesky 測試網,具有樂觀的 zkEVM 整合、橋接機制和去中心化定序器網路功能
新聞報導 專業技術
Morph 推出其 Holesky 測試網,具有樂觀的 zkEVM 整合、橋接機制和去中心化定序器網路功能
2024 年 5 月 6 日
Robinhood Crypto 因涉嫌證券違規而收到美國證券交易委員會的 Wells 通知
市場 新聞報導 專業技術
Robinhood Crypto 因涉嫌證券違規而收到美國證券交易委員會的 Wells 通知
2024 年 5 月 6 日
QuickSwap 部署在 X Layer 主網上,並透過 Citadel 發布擴展 Polygon CDK 網絡
新聞報導 專業技術
QuickSwap 部署在 X Layer 主網上,並透過 Citadel 發布擴展 Polygon CDK 網絡 
2024 年 5 月 6 日
Layer 2 網路 Linea 發起 ZeroLend 零代幣認領 Airdrop 用戶和投資者
市場 新聞報導 專業技術
Layer 2 網路 Linea 發起 ZeroLend 零代幣認領 Airdrop 用戶和投資者
2024 年 5 月 6 日