โมเดล Gemini ขั้นสูงของ Google ที่ขับเคลื่อนโดย Deep Think ได้รับรางวัลเหรียญทองในการแข่งขันคณิตศาสตร์โอลิมปิกระหว่างประเทศด้วยการแก้ปัญหาในระดับมนุษย์
ในบทสรุป
โมเดล AI Gemini ของ DeepMind รุ่นขั้นสูงของ Google ประสบความสำเร็จในระดับเหรียญทองในการแข่งขันคณิตศาสตร์โอลิมปิกระหว่างประเทศ โดยสามารถแก้ปัญหาได้ 5 ใน 6 ข้อ ถือเป็นก้าวสำคัญของ AI ในการใช้เหตุผลทางคณิตศาสตร์ในระดับมนุษย์
แผนกปัญญาประดิษฐ์ของ Google Google DeepMind ประกาศว่าแบบจำลอง Gemini Deep Think เวอร์ชันขั้นสูงสามารถแก้โจทย์ได้สำเร็จ 35 ข้อ จากทั้งหมด XNUMX ข้อ ในการแข่งขันคณิตศาสตร์โอลิมปิกระหว่างประเทศ (IMO) โดยได้รับคะแนน XNUMX คะแนน เทียบเท่ากับผลงานระดับเหรียญทอง นี่เป็นหนึ่งในกรณีแรก ๆ ที่ผู้ประสานงาน IMO ได้ประเมินและรับรองผลลัพธ์ของแบบจำลองอย่างเป็นทางการ โดยใช้มาตรฐานเดียวกันกับที่ใช้กับผู้เข้าร่วมการแข่งขันที่เป็นมนุษย์
ระบบ Gemini Deep Think ที่ใช้ในการสาธิตนี้ featured ความสามารถในการใช้เหตุผลขั้นสูงที่ปรับให้เหมาะกับปัญหาทางคณิตศาสตร์ที่ซับซ้อน ผสานรวมความก้าวหน้าทางการวิจัยล่าสุด ซึ่งรวมถึงวิธีการที่เรียกว่าการคิดแบบขนาน ซึ่งช่วยให้แบบจำลองสามารถสำรวจและบูรณาการแนวทางการแก้ปัญหาหลาย ๆ วิธีพร้อมกันก่อนที่จะได้คำตอบสุดท้าย แทนที่จะใช้กระบวนการเชิงเส้นเดียว
เพื่อเพิ่มประสิทธิภาพการทำงาน แบบจำลองนี้ได้รับการฝึกฝนโดยใช้เทคนิคการเรียนรู้แบบเสริมแรง ซึ่งออกแบบมาเพื่อเพิ่มประสิทธิภาพการใช้เหตุผลแบบหลายขั้นตอน การพิสูจน์ทฤษฎีบท และการแก้ปัญหาทั่วไป นอกจากนี้ ระบบยังสามารถเข้าถึงชุดคำตอบทางคณิตศาสตร์คุณภาพสูงที่คัดสรรมาอย่างดี พร้อมคำแนะนำในการแก้ปัญหาแบบ IMO
จะมีการแชร์เวอร์ชันจำกัดของโมเดล Deep Think นี้กับผู้ทดสอบที่ได้รับเลือก รวมถึงนักคณิตศาสตร์ ก่อนที่จะเผยแพร่ให้กับสมาชิก Google AI Ultra ในวงกว้าง
การพัฒนานี้ถือเป็นก้าวสำคัญที่ก้าวข้ามความสำเร็จในปีที่แล้ว ในปี 2024 แบบจำลองอย่าง AlphaGeometry และ AlphaProof จำเป็นต้องมีการแทรกแซงจากมนุษย์เพื่อแปลปัญหาเป็นภาษาเฉพาะโดเมน (เช่น Lean) แล้วแปลกลับมาอีกครั้ง นอกจากนี้ การแก้ปัญหายังต้องใช้เวลาประมวลผลหลายวัน ในทางตรงกันข้าม แบบจำลองที่ปรับปรุงแล้ว โมเดลราศีเมถุน ผลิตโซลูชันทางคณิตศาสตร์ที่เข้มงวดโดยตรงจากคำชี้แจงปัญหา IMO อย่างเป็นทางการ โดยใช้ภาษาธรรมชาติทั้งหมด และภายในกรอบเวลาการแข่งขันมาตรฐาน 4.5 ชั่วโมง
IMO กลายเป็นมาตรฐานสำคัญสำหรับ AI ในการใช้เหตุผลทางคณิตศาสตร์ขั้นสูง
IMO เป็นการแข่งขันระดับโลกที่จัดขึ้นมายาวนาน โดยรวบรวมนักเรียนก่อนมหาวิทยาลัยที่มีผลการเรียนดีเยี่ยมมาร่วมกันแก้โจทย์คณิตศาสตร์ขั้นสูง 1959 ข้อ ในหัวข้อต่างๆ เช่น พีชคณิต การจัดหมู่ เรขาคณิต และทฤษฎีจำนวน IMO ก่อตั้งขึ้นในปี พ.ศ. 50 และได้รับการยกย่องอย่างกว้างขวางว่าเป็นหนึ่งในการแข่งขันคณิตศาสตร์ที่ท้าทายที่สุดในโลก แต่ละประเทศที่เข้าร่วมจะมีนักเรียน 8 คน และจะมอบเหรียญรางวัลให้กับผู้เข้าแข่งขัน XNUMX% แรก โดยประมาณ XNUMX% จะได้รับเหรียญทอง
ในช่วงไม่กี่ปีที่ผ่านมา การแข่งขันครั้งนี้ยังกลายเป็นมาตรฐานสำหรับการประเมินความสามารถของปัญญาประดิษฐ์ในการแก้ปัญหาที่ซับซ้อนและการให้เหตุผลทางคณิตศาสตร์ ในปี 2024 ระบบ AlphaProof และ AlphaGeometry 2 จาก Google DeepMind สามารถทำผลงานได้ระดับเงิน โดยสามารถแก้โจทย์ได้ 28 ข้อจากทั้งหมด XNUMX ข้อ และได้รับคะแนน XNUMX คะแนน ผลลัพธ์นี้ซึ่งอาศัยภาษาคณิตศาสตร์เชิงรูปนัย ถือเป็นก้าวสำคัญในการแสดงให้เห็นถึงศักยภาพของปัญญาประดิษฐ์ในการเทียบเคียงกับทักษะทางคณิตศาสตร์ขั้นสูงของมนุษย์
ข้อจำกัดความรับผิดชอบ
สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า
เกี่ยวกับผู้เขียน
อลิสา นักข่าวผู้ทุ่มเทของ MPostเชี่ยวชาญด้านสกุลเงินดิจิทัล การพิสูจน์ความรู้เป็นศูนย์ การลงทุน และขอบเขตที่กว้างขวางของ Web3- ด้วยสายตาที่กระตือรือร้นต่อแนวโน้มและเทคโนโลยีที่เกิดขึ้นใหม่ เธอจึงนำเสนอความครอบคลุมที่ครอบคลุมเพื่อแจ้งและดึงดูดผู้อ่านเกี่ยวกับภูมิทัศน์ทางการเงินดิจิทัลที่พัฒนาอยู่ตลอดเวลา
บทความอื่น ๆ
อลิสา นักข่าวผู้ทุ่มเทของ MPostเชี่ยวชาญด้านสกุลเงินดิจิทัล การพิสูจน์ความรู้เป็นศูนย์ การลงทุน และขอบเขตที่กว้างขวางของ Web3- ด้วยสายตาที่กระตือรือร้นต่อแนวโน้มและเทคโนโลยีที่เกิดขึ้นใหม่ เธอจึงนำเสนอความครอบคลุมที่ครอบคลุมเพื่อแจ้งและดึงดูดผู้อ่านเกี่ยวกับภูมิทัศน์ทางการเงินดิจิทัลที่พัฒนาอยู่ตลอดเวลา