สถาบันมักซ์พลังค์: GPT-3 การวัดความสามารถทางปัญญาให้ผลลัพธ์ที่น่าอัศจรรย์
ในบทสรุป
อย่างน้อย AI ก็อยู่ในระดับเดียวกับมนุษย์ในการตัดสินใจ
สถาบันมักซ์พลังค์ด้านไซเบอร์เนติกส์ทางชีวภาพแห่งเยอรมนี ตัดสินใจทดสอบสิ่งนี้และดำเนินการศึกษาเพื่อเปรียบเทียบความสามารถทางปัญญาของมนุษย์และ GPT-3.
นักวิจัยตัดสินใจที่จะตรวจสอบสิ่งนี้โดยใช้การทดสอบทางจิตวิทยาที่ยอมรับกับผู้คนเพื่อทดสอบทักษะในการตัดสินใจ การค้นหาข้อมูล และความสัมพันธ์ระหว่างเหตุและผล
ที่โดดเด่นยิ่งกว่าคือความจริงที่ว่าความสามารถนี้ของ AI ไม่ใช่แค่ในระดับของคนเท่านั้น แต่ยังทำผิดพลาดแบบเดียวกับที่คนทั่วไปทำอีกด้วย
ทักษะการตัดสินใจของ AI นั้นทัดเทียมกับทักษะของมนุษย์อยู่แล้ว ตามผลการวิจัย GPT-3 การวัดความสามารถทางปัญญาดำเนินการที่สถาบันมักซ์พลังค์
ผู้ที่ชื่นชอบและผู้คลางแคลงใจเกี่ยวกับโมเดลภาษาขนาดใหญ่เช่น GPT-3 ยังคงโต้แย้งอย่างรุนแรงว่าความสำเร็จที่ก้าวหน้าของ ChatGPT บอทซึ่งใช้ GPT-3 เทคโนโลยีพิสูจน์ให้เห็นว่าบอทมีความฉลาดพอ ๆ กับมนุษย์ การอภิปรายไม่มีจุดหมายแม้ว่า: defiความหมายของคำว่า "ปัญญา" นั้นคลุมเครือ ทุกคนถือว่าความฉลาดเป็นอย่างอื่นและขอบเขตของ defiNions เป็นอย่างมาก:
- เริ่มต้นที่ definition โดยลินดา กอตต์เฟรดสัน “เชาวน์ปัญญาเป็นความสามารถทางจิตที่บูรณาการซึ่งรวมถึงความสามารถในการสรุป วางแผน แก้ปัญหา คิดเชิงนามธรรม เข้าใจความคิดที่ซับซ้อน และเรียนรู้อย่างรวดเร็วจากประสบการณ์”
- ในขณะเดียวกัน ตามที่ Edward Boring กล่าวว่า "ความฉลาดเป็นสิ่งที่วัดการทดสอบความฉลาด"
สถานการณ์มีความซับซ้อนเนื่องจากข้อเท็จจริงที่ว่า ไม่ว่าใครจะพูดอะไรก็ตาม ก็ไม่มีเหตุผลที่ชัดเจนสำหรับการเกิดขึ้นของแบบจำลองทางสติปัญญาขนาดใหญ่ที่เทียบได้กับมนุษย์ ท้ายที่สุดสิ่งเดียวที่ GPT-3 (และ ChatGPT) สามารถทำได้คือการทำนายคำถัดไปอย่างช่ำชองโดยอิงจากสถิติจำนวนมหาศาลของตัวอย่างลำดับคำในข้อความที่เขียนโดยผู้คน
อย่างไรก็ตามทักษะนี้เพียงอย่างเดียวเท่านั้นที่อนุญาต ChatGPT ความคิดสร้างสรรค์อันน่าประหลาดใจ: นอกจากจะตอบคำถามใดๆ ที่มันถามแล้ว มันยังสามารถเขียนเรื่องราว บทความทางวิทยาศาสตร์ วิทยานิพนธ์ หรือแม้แต่เขียนโค้ด (ซึ่งเพียงพอที่จะ ผ่านการสอบบางส่วน ในระดับมนุษย์)
แต่เหตุผลนี้เพียงพอที่จะหารือเกี่ยวกับการเกิดขึ้นของ AI หรือไม่ (ตาม GPT-3 และ ChatGPT) มีสติปัญญาเทียบได้กับสติปัญญาของมนุษย์?
เพื่อตอบคำถามนี้ ลองนึกถึง Gregory Treverton's defiสังเกตว่า “ความฉลาดคือการเล่าเรื่องในท้ายที่สุด” (นี่ definition อธิบายว่าเหตุใดปัญญาและเหตุผลจึงถูกรวมไว้ในคำเดียวกันในภาษาอังกฤษ)
ตรรกะที่นี่คือ:
- ความฉลาดไม่ว่าจะอยู่ในรูปแบบใด defined มีไว้สำหรับการตัดสินใจที่ซับซ้อนในงานที่ไม่สำคัญ
- ในการตัดสินใจดังกล่าว นอกเหนือจากการคิดอย่างเป็นทางการแล้ว การคิดเชิงบรรยายมีบทบาทอย่างมาก ตัวอย่างเช่น ในหลักนิติศาสตร์ เมื่อมีการตัดสินโดยคณะลูกขุน การไม่ใช้ความคิดอย่างเป็นทางการแต่การเล่าเรื่องจะมีบทบาทชี้ขาดในการประเมินหลักฐานและตัดสินใจในคำตัดสิน
- เหตุใดจึงไม่ควร ChatGPTการเล่าเรื่องและการคิดที่เป็นทางการที่พัฒนาอย่างยอดเยี่ยมเป็นพื้นฐานสำหรับการเกิดขึ้นของสติปัญญาที่เหมือนมนุษย์?
สถาบันมักซ์พลังค์ด้านไซเบอร์เนติกส์ทางชีวภาพแห่งเยอรมนี ตัดสินใจทดสอบสิ่งนี้และดำเนินการศึกษาเพื่อเปรียบเทียบความสามารถทางปัญญาของมนุษย์และ GPT-3. นักวิจัยตัดสินใจตรวจสอบสิ่งนี้โดยใช้การทดสอบทางจิตวิทยามาตรฐานกับผู้คนเพื่อทดสอบทักษะในการตัดสินใจ การสืบค้นข้อมูล และความสัมพันธ์ระหว่างเหตุและผล
พื้นที่ ผลการศึกษาซึ่งตีพิมพ์ในวารสาร Proceedings of the National Academy of Sciences น่าทึ่งมาก:
- AI แก้ปัญหาในการตัดสินใจที่ถูกต้องตามคำอธิบายเช่นเดียวกับหรือดีกว่ามนุษย์
- ที่โดดเด่นยิ่งกว่าคือความจริงที่ว่าความสามารถนี้ของ AI ไม่ใช่แค่ในระดับของคนเท่านั้น แต่ยังทำผิดพลาดแบบเดียวกับที่คนทั่วไปทำอีกด้วย
ยิ่งไปกว่านั้น ความสามารถในการตัดสินใจที่ถูกต้องได้รับการทดสอบในงานที่อธิบายโดยบทความสั้น ๆ: คำอธิบายสั้น ๆ ของบุคคลและ/หรือสถานการณ์เพื่อตอบสนองซึ่งผู้คนเปิดเผยความคิด ค่านิยม บรรทัดฐานทางสังคม หรือความประทับใจของตนเอง ดูเหมือนว่าจะไม่มีสิ่งใดใน AI ข้างต้น อย่างไรก็ตาม สิ่งนี้ไม่ได้ป้องกัน AI จากการตัดสินใจเช่นเดียวกับมนุษย์
ในอีกสองความสามารถทางปัญญา AI ยังขาดมนุษย์
- ในการค้นหาข้อมูล GPT-3 ไม่แสดงสัญญาณของการวิจัยโดยตรง
- ในปัญหาเหตุและผล GPT-3 อยู่ในระดับเด็กเล็กแต่เพียงเท่านี้
ผู้เขียนเชื่อว่าเพื่อที่จะติดต่อกับผู้คนที่มีความสามารถทั้งสองนี้ AI ขาดเพียงการสื่อสารที่กระตือรือร้นกับเราและกับส่วนที่เหลือของโลก แต่มันจะผ่านไปอย่างรวดเร็ว ท้ายที่สุดแล้วผู้คนนับล้านก็สื่อสารด้วย ChatGPT.
อ่านเพิ่มเติมเกี่ยวกับ ChatGPT และเอไอ:
ข้อจำกัดความรับผิดชอบ
สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า
เกี่ยวกับผู้เขียน
Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต
บทความอื่น ๆDamir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต