新聞報導 專業技術
2023 年 3 月 29 日

GPT-4 研究稱,在邏輯推理測驗中表現優於一般人

簡單來說

俄羅斯人工智能研究員 Ilya Pestov 創建了邏輯思維測試,有 12 人通過了測試。

他最近獲得了更聰明的訪問權限 GPT-4,並進行了一項實驗,看看正確的查詢是否可以產生一些結果。

結果表明, GPT-4 邏輯推理能力優於一般人。

俄羅斯著名 AI 研究員 Ilya Pestov 在他的個人主頁上發了一條消息 電報頻道 關於神經網絡如何處理邏輯測試。 伊利亞曾經創造 @psylogicbot 邏輯思維測試,約有 12 人參加。 您可以在參加考試後查看統計數據。

@Midjourney / 阿卜杜拉(hamoXX)#7378
閱讀更多: 20 年 2023 多個最佳 Telegram AI 聊天機器人

他寫道 ChatGPT 也進行了測試,但結果還有很多不足之處。 他最近獲得了更聰明、更新的版本 GPT 模型-GPT-4——並決定檢查是否會得到類似的結果。

實驗進行如下:研究人員創建了一個文本來描述神經網絡必須完成的任務。 研究人員在評論中發布了所有內容:提示是:“我會給你一個邏輯謎題和四個可能的答案; 從其中選出一個正確答案。” 然後,對於每個測試問題,Ilya 創建一個新對話框並發送 GPT-4 描述以及問題文本。 機器人收到了沒有任何更正或提示的響應。

共有 25 個問題,每個正確答案可得一分。 根據統計,使用者平均得分為13.6分,中位數不超過14分。 GPT-4 得到? 成功拿到16分了!

神經網絡再一次在邏輯推理方面勝過普通人。 也就是說,它的表現優於大多數接受測試的人。 這是在考慮到:

  • 測試是用俄語進行的,而模型針對英語進行了微調;
  • GPT-4用於聊天的 ,其智能程度低於其前身(道德限制的副作用)。

另外,我們將發布問題 22 的出色答案,其中神經元使用一階邏輯從數學上推導出結果。 雖然這在應用數學中有所涉及,但它並不是每個人都需要上的大學課程。

另外,我們將發布問題 22 的出色答案,其中神經元使用一階邏輯從數學上推導出結果。 我們都知道如何在應用數學中做到這一點,但這是大學的一門附加課程。

仍然相信 神經網絡 是一種時尚嗎? 首先,努力超越 GPT-4 (並在評論中分享您的結果)。

閱讀有關人工智能的更多信息:

免責聲明

在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。

關於作者

Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。 

更多文章
達米爾亞拉洛夫
達米爾亞拉洛夫

Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。 

Hot Stories
加入我們的時事通訊。
最新消息

DOGE 狂熱:分析狗狗幣 (DOGE) 最近的價值飆升

加密貨幣行業正在迅速擴張,模因幣正在為大幅上漲做好準備。狗狗幣(DOGE),...

了解更多

元宇宙中人工智慧生成內容的演變

生成式人工智慧內容的出現是虛擬環境中最令人著迷的發展之一...

了解更多
加入我們的創新技術社區
了解更多
阅读更多
本週的熱門交易以及人工智慧、IT 領域的主要投資 Web3和加密貨幣 (22-26.04)
消化 購物 市場 專業技術
本週的熱門交易以及人工智慧、IT 領域的主要投資 Web3和加密貨幣 (22-26.04)
2024 年 4 月 26 日
Vitalik Buterin 對 PoW 中心化發表評論,指出這只是 PoS 之前的臨時階段
新聞報導 專業技術
Vitalik Buterin 對 PoW 中心化發表評論,指出這只是 PoS 之前的臨時階段
2024 年 4 月 26 日
Offchain 實驗室在 Optimism 的 OP Stack 詐欺證明中發現了兩個關鍵漏洞
新聞報導 軟體 專業技術
Offchain 實驗室在 Optimism 的 OP Stack 詐欺證明中發現了兩個關鍵漏洞
2024 年 4 月 26 日
Dymension 用於橋接 RollApps eIBC 流動性的開放市場在主網上啟動
新聞報導 專業技術
Dymension 用於橋接 RollApps eIBC 流動性的開放市場在主網上啟動 
2024 年 4 月 26 日