รายงานข่าว เทคโนโลยี
March 29, 2023

GPT-4 ทำงานได้ดีกว่าคนทั่วไปในการทดสอบการใช้เหตุผลเชิงตรรกะ การศึกษาอ้างว่า

ในบทสรุป

Ilya Pestov นักวิจัยด้าน AI ชาวรัสเซีย ได้สร้างแบบทดสอบการคิดเชิงตรรกะ ซึ่งมีผู้ผ่านการทดสอบกว่า 12 คน

เขาเพิ่งได้รับการเข้าถึงอย่างชาญฉลาด GPT-4และทำการทดลองเพื่อดูว่าคำค้นหาที่ถูกต้องจะให้ผลลัพธ์บางอย่างหรือไม่

ผลปรากฏว่า GPT-4 มีประสิทธิภาพเหนือกว่าคนทั่วไปในด้านการใช้เหตุผลเชิงตรรกะ

Ilya Pestov นักวิจัย AI ชื่อดังชาวรัสเซีย โพสต์ข้อความบนตัวเขา ช่องทางโทรเลข เกี่ยวกับประสิทธิภาพของโครงข่ายประสาทเทียมในการจัดการกับการทดสอบเชิงตรรกะ อิลยาเคยสร้าง @psylogicbot การทดสอบการคิดเชิงตรรกะซึ่งดำเนินการโดยผู้คนประมาณ 12 คน คุณสามารถตรวจสอบสถิติได้หลังจากทำแบบทดสอบ

@Midjourney / อับดุลลา(hamoXX)#7378
อ่านเพิ่มเติม: 20+ สุดยอด Telegram AI Chatbot ประจำปี 2023

เขาเขียนว่า ChatGPT ได้รับการทดสอบด้วย แต่ผลลัพธ์ก็ยังเป็นที่ต้องการอีกมาก เขาเพิ่งได้รับสิทธิ์เข้าถึงเวอร์ชันที่ชาญฉลาดและอัปเดตมากขึ้นของ GPT แบบอย่าง-GPT-4—และตัดสินใจตรวจสอบว่าจะได้ผลลัพธ์ที่คล้ายกันหรือไม่

ดำเนินการทดลองดังนี้: ผู้วิจัยสร้างข้อความที่อธิบายถึงงานที่โครงข่ายประสาทเทียมต้องทำให้สำเร็จ นักวิจัยโพสต์ทุกอย่างในความคิดเห็น: ข้อความแจ้งคือ: “ฉันจะให้ปริศนาตรรกะและคำตอบที่เป็นไปได้สี่ข้อแก่คุณ เลือกคำตอบที่ถูกต้องเพียงข้อเดียวจากพวกเขา” จากนั้นสำหรับคำถามทดสอบแต่ละข้อ Ilya ได้สร้างกล่องโต้ตอบใหม่และส่ง GPT-4 คำอธิบายพร้อมกับข้อความคำถาม บอทได้รับการตอบกลับโดยไม่มีการแก้ไขหรือคำใบ้ใดๆ

มีคำถามทั้งหมด 25 ข้อ โดยแต่ละข้อจะให้คะแนน 13.6 คะแนน ตามสถิติผู้ใช้งานได้คะแนนเฉลี่ย 14 คะแนน โดยมีค่ามัธยฐานไม่เกิน XNUMX ได้เท่าไหร่ GPT-4 รับ? คว้า 16 แต้มได้แล้ว!

เป็นอีกครั้งที่โครงข่ายประสาทเทียมมีประสิทธิภาพเหนือกว่าคนทั่วไปในด้านเหตุผลเชิงตรรกะ นั่นคือมีประสิทธิภาพดีกว่าคนส่วนใหญ่ที่ทดสอบ และนี่คือการพิจารณา:

  • การทดสอบดำเนินการในภาษารัสเซีย ในขณะที่แบบจำลองได้รับการปรับให้เหมาะกับภาษาอังกฤษ
  • GPT-4ซึ่งใช้ในการแชทมีความฉลาดน้อยกว่ารุ่นก่อน (ผลข้างเคียงจากข้อจำกัดด้านจริยธรรม)

แยกจากกัน เราจะโพสต์คำตอบที่ยอดเยี่ยมสำหรับคำถามที่ 22 ซึ่งเซลล์ประสาทใช้ตรรกะลำดับที่หนึ่งเพื่อหาผลลัพธ์ทางคณิตศาสตร์ แม้ว่าสิ่งนี้จะครอบคลุมในวิชาคณิตศาสตร์ประยุกต์ แต่ก็ไม่ใช่หลักสูตรของมหาวิทยาลัยที่ทุกคนจะต้องเรียน

แยกจากกัน เราจะโพสต์คำตอบที่ยอดเยี่ยมสำหรับคำถามที่ 22 ซึ่งเซลล์ประสาทใช้ตรรกะลำดับที่หนึ่งเพื่อรับผลลัพธ์ทางคณิตศาสตร์ เราทุกคนรู้วิธีการทำในวิชาคณิตศาสตร์ประยุกต์เช่นกัน แต่เป็นหลักสูตรเพิ่มเติมของมหาวิทยาลัย

ยังคงเชื่ออย่างนั้น เครือข่ายประสาทเทียม เป็นแฟชั่นใช่ไหม? ขั้นแรก พยายามทำให้เหนือกว่า GPT-4 (และแบ่งปันผลลัพธ์ของคุณในความคิดเห็น)

อ่านเพิ่มเติมเกี่ยวกับ AI:

ข้อจำกัดความรับผิดชอบ

สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า

เกี่ยวกับผู้เขียน

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

บทความอื่น ๆ
ดาเมียร์ ยาลอฟ
ดาเมียร์ ยาลอฟ

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

Hot Stories
เข้าร่วมจดหมายข่าวของเรา
ข่าวล่าสุด

จาก Ripple สู่ Big Green DAO: โครงการ Cryptocurrency มีส่วนสนับสนุนการกุศลอย่างไร

เรามาสำรวจความคิดริเริ่มที่ใช้ประโยชน์จากศักยภาพของสกุลเงินดิจิทัลเพื่อการกุศลกันดีกว่า

รู้เพิ่มเติม

AlphaFold 3, Med-Gemini และอื่นๆ: วิธีที่ AI พลิกโฉมการดูแลสุขภาพในปี 2024

AI แสดงให้เห็นในรูปแบบต่างๆ ในการดูแลสุขภาพ ตั้งแต่การเปิดเผยความสัมพันธ์ทางพันธุกรรมใหม่ๆ ไปจนถึงการเสริมศักยภาพให้กับระบบการผ่าตัดด้วยหุ่นยนต์ ...

รู้เพิ่มเติม
เข้าร่วมชุมชนเทคโนโลยีที่เป็นนวัตกรรมของเรา
อ่านเพิ่มเติม
อ่านเพิ่มเติม
จาก Ripple สู่ Big Green DAO: โครงการ Cryptocurrency มีส่วนสนับสนุนการกุศลอย่างไร
การวิเคราะห์ คริปโต Wiki บัญชีธุรกิจ การศึกษา ไลฟ์สไตล์ ตลาด ซอฟต์แวร์ เทคโนโลยี
จาก Ripple สู่ Big Green DAO: โครงการ Cryptocurrency มีส่วนสนับสนุนการกุศลอย่างไร
May 13, 2024
AlphaFold 3, Med-Gemini และอื่นๆ: วิธีที่ AI พลิกโฉมการดูแลสุขภาพในปี 2024
AI Wiki การวิเคราะห์ ย่อยอาหาร ความคิดเห็น บัญชีธุรกิจ ตลาด รายงานข่าว ซอฟต์แวร์ เรื่องราวและบทวิจารณ์ เทคโนโลยี
AlphaFold 3, Med-Gemini และอื่นๆ: วิธีที่ AI พลิกโฉมการดูแลสุขภาพในปี 2024
May 13, 2024
Nim Network เตรียมเปิดตัวเฟรมเวิร์กโทเค็นการเป็นเจ้าของ AI และดำเนินการขายผลตอบแทนพร้อมกำหนดวันสแนปชอตในเดือนพฤษภาคม
ตลาด รายงานข่าว เทคโนโลยี
Nim Network เตรียมเปิดตัวเฟรมเวิร์กโทเค็นการเป็นเจ้าของ AI และดำเนินการขายผลตอบแทนพร้อมกำหนดวันสแนปชอตในเดือนพฤษภาคม
May 13, 2024
Binance ร่วมมือกับอาร์เจนตินาเพื่อต่อสู้กับอาชญากรรมทางไซเบอร์
ความคิดเห็น บัญชีธุรกิจ ตลาด รายงานข่าว ซอฟต์แวร์ เทคโนโลยี
Binance ร่วมมือกับอาร์เจนตินาเพื่อต่อสู้กับอาชญากรรมทางไซเบอร์
May 13, 2024
CRYPTOMERIA LABS PTE. บจก.