GPT-4 ทำงานได้ดีกว่าคนทั่วไปในการทดสอบการใช้เหตุผลเชิงตรรกะ การศึกษาอ้างว่า
ในบทสรุป
Ilya Pestov นักวิจัยด้าน AI ชาวรัสเซีย ได้สร้างแบบทดสอบการคิดเชิงตรรกะ ซึ่งมีผู้ผ่านการทดสอบกว่า 12 คน
เขาเพิ่งได้รับการเข้าถึงอย่างชาญฉลาด GPT-4และทำการทดลองเพื่อดูว่าคำค้นหาที่ถูกต้องจะให้ผลลัพธ์บางอย่างหรือไม่
ผลปรากฏว่า GPT-4 มีประสิทธิภาพเหนือกว่าคนทั่วไปในด้านการใช้เหตุผลเชิงตรรกะ
Ilya Pestov นักวิจัย AI ชื่อดังชาวรัสเซีย โพสต์ข้อความบนตัวเขา ช่องทางโทรเลข เกี่ยวกับประสิทธิภาพของโครงข่ายประสาทเทียมในการจัดการกับการทดสอบเชิงตรรกะ อิลยาเคยสร้าง @psylogicbot การทดสอบการคิดเชิงตรรกะซึ่งดำเนินการโดยผู้คนประมาณ 12 คน คุณสามารถตรวจสอบสถิติได้หลังจากทำแบบทดสอบ
อ่านเพิ่มเติม: 20+ สุดยอด Telegram AI Chatbot ประจำปี 2023 |
เขาเขียนว่า ChatGPT ได้รับการทดสอบด้วย แต่ผลลัพธ์ก็ยังเป็นที่ต้องการอีกมาก เขาเพิ่งได้รับสิทธิ์เข้าถึงเวอร์ชันที่ชาญฉลาดและอัปเดตมากขึ้นของ GPT แบบอย่าง-GPT-4—และตัดสินใจตรวจสอบว่าจะได้ผลลัพธ์ที่คล้ายกันหรือไม่
ดำเนินการทดลองดังนี้: ผู้วิจัยสร้างข้อความที่อธิบายถึงงานที่โครงข่ายประสาทเทียมต้องทำให้สำเร็จ นักวิจัยโพสต์ทุกอย่างในความคิดเห็น: ข้อความแจ้งคือ: “ฉันจะให้ปริศนาตรรกะและคำตอบที่เป็นไปได้สี่ข้อแก่คุณ เลือกคำตอบที่ถูกต้องเพียงข้อเดียวจากพวกเขา” จากนั้นสำหรับคำถามทดสอบแต่ละข้อ Ilya ได้สร้างกล่องโต้ตอบใหม่และส่ง GPT-4 คำอธิบายพร้อมกับข้อความคำถาม บอทได้รับการตอบกลับโดยไม่มีการแก้ไขหรือคำใบ้ใดๆ
มีคำถามทั้งหมด 25 ข้อ โดยแต่ละข้อจะให้คะแนน 13.6 คะแนน ตามสถิติผู้ใช้งานได้คะแนนเฉลี่ย 14 คะแนน โดยมีค่ามัธยฐานไม่เกิน XNUMX ได้เท่าไหร่ GPT-4 รับ? คว้า 16 แต้มได้แล้ว!
เป็นอีกครั้งที่โครงข่ายประสาทเทียมมีประสิทธิภาพเหนือกว่าคนทั่วไปในด้านเหตุผลเชิงตรรกะ นั่นคือมีประสิทธิภาพดีกว่าคนส่วนใหญ่ที่ทดสอบ และนี่คือการพิจารณา:
- การทดสอบดำเนินการในภาษารัสเซีย ในขณะที่แบบจำลองได้รับการปรับให้เหมาะกับภาษาอังกฤษ
- GPT-4ซึ่งใช้ในการแชทมีความฉลาดน้อยกว่ารุ่นก่อน (ผลข้างเคียงจากข้อจำกัดด้านจริยธรรม)
แยกจากกัน เราจะโพสต์คำตอบที่ยอดเยี่ยมสำหรับคำถามที่ 22 ซึ่งเซลล์ประสาทใช้ตรรกะลำดับที่หนึ่งเพื่อหาผลลัพธ์ทางคณิตศาสตร์ แม้ว่าสิ่งนี้จะครอบคลุมในวิชาคณิตศาสตร์ประยุกต์ แต่ก็ไม่ใช่หลักสูตรของมหาวิทยาลัยที่ทุกคนจะต้องเรียน
ยังคงเชื่ออย่างนั้น เครือข่ายประสาทเทียม เป็นแฟชั่นใช่ไหม? ขั้นแรก พยายามทำให้เหนือกว่า GPT-4 (และแบ่งปันผลลัพธ์ของคุณในความคิดเห็น)
อ่านเพิ่มเติมเกี่ยวกับ AI:
ข้อจำกัดความรับผิดชอบ
สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า
เกี่ยวกับผู้เขียน
Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต
บทความอื่น ๆDamir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต