รายงานข่าว เทคโนโลยี
March 29, 2023

GPT-4 ทำงานได้ดีกว่าคนทั่วไปในการทดสอบการใช้เหตุผลเชิงตรรกะ การศึกษาอ้างว่า

ในบทสรุป

Ilya Pestov นักวิจัยด้าน AI ชาวรัสเซีย ได้สร้างแบบทดสอบการคิดเชิงตรรกะ ซึ่งมีผู้ผ่านการทดสอบกว่า 12 คน

เขาเพิ่งได้รับการเข้าถึงอย่างชาญฉลาด GPT-4และทำการทดลองเพื่อดูว่าคำค้นหาที่ถูกต้องจะให้ผลลัพธ์บางอย่างหรือไม่

ผลปรากฏว่า GPT-4 มีประสิทธิภาพเหนือกว่าคนทั่วไปในด้านการใช้เหตุผลเชิงตรรกะ

Ilya Pestov นักวิจัย AI ชื่อดังชาวรัสเซีย โพสต์ข้อความบนตัวเขา ช่องทางโทรเลข เกี่ยวกับประสิทธิภาพของโครงข่ายประสาทเทียมในการจัดการกับการทดสอบเชิงตรรกะ อิลยาเคยสร้าง @psylogicbot การทดสอบการคิดเชิงตรรกะซึ่งดำเนินการโดยผู้คนประมาณ 12 คน คุณสามารถตรวจสอบสถิติได้หลังจากทำแบบทดสอบ

@Midjourney / อับดุลลา(hamoXX)#7378
อ่านเพิ่มเติม: 20+ สุดยอด Telegram AI Chatbot ประจำปี 2023

เขาเขียนว่า ChatGPT ได้รับการทดสอบด้วย แต่ผลลัพธ์ก็ยังเป็นที่ต้องการอีกมาก เขาเพิ่งได้รับสิทธิ์เข้าถึงเวอร์ชันที่ชาญฉลาดและอัปเดตมากขึ้นของ GPT แบบอย่าง-GPT-4—และตัดสินใจตรวจสอบว่าจะได้ผลลัพธ์ที่คล้ายกันหรือไม่

ดำเนินการทดลองดังนี้: ผู้วิจัยสร้างข้อความที่อธิบายถึงงานที่โครงข่ายประสาทเทียมต้องทำให้สำเร็จ นักวิจัยโพสต์ทุกอย่างในความคิดเห็น: ข้อความแจ้งคือ: “ฉันจะให้ปริศนาตรรกะและคำตอบที่เป็นไปได้สี่ข้อแก่คุณ เลือกคำตอบที่ถูกต้องเพียงข้อเดียวจากพวกเขา” จากนั้นสำหรับคำถามทดสอบแต่ละข้อ Ilya ได้สร้างกล่องโต้ตอบใหม่และส่ง GPT-4 คำอธิบายพร้อมกับข้อความคำถาม บอทได้รับการตอบกลับโดยไม่มีการแก้ไขหรือคำใบ้ใดๆ

มีคำถามทั้งหมด 25 ข้อ โดยแต่ละข้อจะให้คะแนน 13.6 คะแนน ตามสถิติผู้ใช้งานได้คะแนนเฉลี่ย 14 คะแนน โดยมีค่ามัธยฐานไม่เกิน XNUMX ได้เท่าไหร่ GPT-4 รับ? คว้า 16 แต้มได้แล้ว!

เป็นอีกครั้งที่โครงข่ายประสาทเทียมมีประสิทธิภาพเหนือกว่าคนทั่วไปในด้านเหตุผลเชิงตรรกะ นั่นคือมีประสิทธิภาพดีกว่าคนส่วนใหญ่ที่ทดสอบ และนี่คือการพิจารณา:

  • การทดสอบดำเนินการในภาษารัสเซีย ในขณะที่แบบจำลองได้รับการปรับให้เหมาะกับภาษาอังกฤษ
  • GPT-4ซึ่งใช้ในการแชทมีความฉลาดน้อยกว่ารุ่นก่อน (ผลข้างเคียงจากข้อจำกัดด้านจริยธรรม)

แยกจากกัน เราจะโพสต์คำตอบที่ยอดเยี่ยมสำหรับคำถามที่ 22 ซึ่งเซลล์ประสาทใช้ตรรกะลำดับที่หนึ่งเพื่อหาผลลัพธ์ทางคณิตศาสตร์ แม้ว่าสิ่งนี้จะครอบคลุมในวิชาคณิตศาสตร์ประยุกต์ แต่ก็ไม่ใช่หลักสูตรของมหาวิทยาลัยที่ทุกคนจะต้องเรียน

แยกจากกัน เราจะโพสต์คำตอบที่ยอดเยี่ยมสำหรับคำถามที่ 22 ซึ่งเซลล์ประสาทใช้ตรรกะลำดับที่หนึ่งเพื่อรับผลลัพธ์ทางคณิตศาสตร์ เราทุกคนรู้วิธีการทำในวิชาคณิตศาสตร์ประยุกต์เช่นกัน แต่เป็นหลักสูตรเพิ่มเติมของมหาวิทยาลัย

ยังคงเชื่ออย่างนั้น เครือข่ายประสาทเทียม เป็นแฟชั่นใช่ไหม? ขั้นแรก พยายามทำให้เหนือกว่า GPT-4 (และแบ่งปันผลลัพธ์ของคุณในความคิดเห็น)

อ่านเพิ่มเติมเกี่ยวกับ AI:

ข้อจำกัดความรับผิดชอบ

สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า

เกี่ยวกับผู้เขียน

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

บทความอื่น ๆ
ดาเมียร์ ยาลอฟ
ดาเมียร์ ยาลอฟ

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

Hot Stories
เข้าร่วมจดหมายข่าวของเรา
ข่าวล่าสุด

DOGE Frenzy: การวิเคราะห์มูลค่าที่เพิ่มขึ้นล่าสุดของ Dogecoin (DOGE)

อุตสาหกรรมสกุลเงินดิจิทัลกำลังขยายตัวอย่างรวดเร็ว และเหรียญมีมกำลังเตรียมพร้อมสำหรับการแกว่งตัวขึ้นอย่างมีนัยสำคัญ โดชคอยน์ (DOGE), ...

รู้เพิ่มเติม

วิวัฒนาการของเนื้อหาที่สร้างโดย AI ใน Metaverse

การเกิดขึ้นของเนื้อหา AI เจนเนอเรชั่นถือเป็นหนึ่งในพัฒนาการที่น่าสนใจที่สุดภายในสภาพแวดล้อมเสมือนจริง ...

รู้เพิ่มเติม
เข้าร่วมชุมชนเทคโนโลยีที่เป็นนวัตกรรมของเรา
อ่านเพิ่มเติม
อ่านเพิ่มเติม
ข้อเสนอที่ดีที่สุดประจำสัปดาห์นี้ การลงทุนที่สำคัญใน AI, ไอที Web3และสกุลเงินดิจิทัล (22-26.04)
ย่อยอาหาร บัญชีธุรกิจ ตลาด เทคโนโลยี
ข้อเสนอที่ดีที่สุดประจำสัปดาห์นี้ การลงทุนที่สำคัญใน AI, ไอที Web3และสกุลเงินดิจิทัล (22-26.04)
April 26, 2024
Vitalik Buterin แสดงความคิดเห็นเกี่ยวกับการรวมศูนย์ของ PoW โปรดทราบว่านี่เป็นขั้นตอนชั่วคราวจนกว่าจะถึง PoS
รายงานข่าว เทคโนโลยี
Vitalik Buterin แสดงความคิดเห็นเกี่ยวกับการรวมศูนย์ของ PoW โปรดทราบว่านี่เป็นขั้นตอนชั่วคราวจนกว่าจะถึง PoS
April 26, 2024
Offchain Labs เผยการค้นพบช่องโหว่ที่สำคัญสองรายการในการพิสูจน์การฉ้อโกงของ OP Stack ของ Optimism
รายงานข่าว ซอฟต์แวร์ เทคโนโลยี
Offchain Labs เผยการค้นพบช่องโหว่ที่สำคัญสองรายการในการพิสูจน์การฉ้อโกงของ OP Stack ของ Optimism
April 26, 2024
ตลาดเปิดของ Dymension สำหรับการเชื่อมโยงสภาพคล่องจาก RollApps eIBC เปิดตัวบน Mainnet
รายงานข่าว เทคโนโลยี
ตลาดเปิดของ Dymension สำหรับการเชื่อมโยงสภาพคล่องจาก RollApps eIBC เปิดตัวบน Mainnet 
April 26, 2024
CRYPTOMERIA LABS PTE. บจก.