GPT-4 研究稱,在邏輯推理測驗中表現優於一般人
簡單來說
俄羅斯人工智能研究員 Ilya Pestov 創建了邏輯思維測試,有 12 人通過了測試。
他最近獲得了更聰明的訪問權限 GPT-4,並進行了一項實驗,看看正確的查詢是否可以產生一些結果。
結果表明, GPT-4 邏輯推理能力優於一般人。
俄羅斯著名 AI 研究員 Ilya Pestov 在他的個人主頁上發了一條消息 電報頻道 關於神經網絡如何處理邏輯測試。 伊利亞曾經創造 @psylogicbot 邏輯思維測試,約有 12 人參加。 您可以在參加考試後查看統計數據。
他寫道 ChatGPT 也進行了測試,但結果還有很多不足之處。 他最近獲得了更聰明、更新的版本 GPT 模型-GPT-4——並決定檢查是否會得到類似的結果。
實驗進行如下:研究人員創建了一個文本來描述神經網絡必須完成的任務。 研究人員在評論中發布了所有內容:提示是:“我會給你一個邏輯謎題和四個可能的答案; 從其中選出一個正確答案。” 然後,對於每個測試問題,Ilya 創建一個新對話框並發送 GPT-4 描述以及問題文本。 機器人收到了沒有任何更正或提示的響應。
共有 25 個問題,每個正確答案可得一分。 根據統計,使用者平均得分為13.6分,中位數不超過14分。 GPT-4 得到? 成功拿到16分了!
神經網絡再一次在邏輯推理方面勝過普通人。 也就是說,它的表現優於大多數接受測試的人。 這是在考慮到:
- 測試是用俄語進行的,而模型針對英語進行了微調;
- GPT-4用於聊天的 ,其智能程度低於其前身(道德限制的副作用)。
另外,我們將發布問題 22 的出色答案,其中神經元使用一階邏輯從數學上推導出結果。 雖然這在應用數學中有所涉及,但它並不是每個人都需要上的大學課程。
仍然相信 神經網絡 是一種時尚嗎? 首先,努力超越 GPT-4 (並在評論中分享您的結果)。
閱讀有關人工智能的更多信息:
免責聲明
在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。
關於作者
Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。
更多文章Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。