GPT-4 สืบทอดข้อเท็จจริงที่ "หลอนประสาท" และข้อผิดพลาดในการให้เหตุผลจากก่อนหน้านี้ GPT Models
ในบทสรุป
OpenAI พูดว่า GPT-4 มีข้อจำกัดเหมือนเมื่อก่อน GPT โมเดล.
GPT-4 ยังคงเห็นภาพหลอนข้อเท็จจริงและทำให้เกิดข้อผิดพลาดในการให้เหตุผล
อย่างไรก็ตาม GPT-4 คะแนนสูงกว่า 40% OpenAIล่าสุด GPT-3.5 ในการประเมินข้อเท็จจริงที่ขัดแย้งภายในของบริษัท
OpenAI ได้เตือนผู้ใช้ว่ารุ่นภาษาล่าสุด GPT-4ยังคงไม่น่าเชื่อถืออย่างสมบูรณ์และสามารถ "เห็นภาพหลอน" ข้อเท็จจริงและทำให้เกิดข้อผิดพลาดในการให้เหตุผลได้ บริษัทขอเรียกร้องให้ผู้ใช้ใช้ความระมัดระวังเมื่อใช้ผลลัพธ์ของโมเดลภาษา โดยเฉพาะอย่างยิ่งใน “บริบทที่มีเดิมพันสูง”
อย่างไรก็ตามข่าวดีก็คือ GPT-4 ลดภาพหลอนลงอย่างมากเมื่อเทียบกับรุ่นก่อนหน้า OpenAI อ้างว่า GPT-4 คะแนนสูงกว่าครั้งล่าสุดถึง 40% GPT-3.5 ในการประเมินความเป็นจริงของฝ่ายตรงข้ามภายใน
“เราได้ดำเนินการกับเกณฑ์มาตรฐานภายนอก เช่น TruthfulQA ซึ่งทดสอบความสามารถของแบบจำลองในการแยกข้อเท็จจริงออกจากชุดข้อความที่ไม่ถูกต้องซึ่งฝ่ายตรงข้ามเลือกไว้ คำถามเหล่านี้จับคู่กับคำตอบที่ไม่ถูกต้องตามข้อเท็จจริงและน่าสนใจทางสถิติ” OpenAI เขียนใน โพสต์บล็อก.
แม้จะมีการปรับปรุงนี้ โมเดลก็ยังขาดความรู้เกี่ยวกับเหตุการณ์ที่เกิดขึ้นหลังเดือนกันยายน 2021 และบางครั้งก็เกิดข้อผิดพลาดในการให้เหตุผลง่ายๆ เช่นเดียวกับโมเดลก่อนหน้านี้ นอกจากนี้ ยังใจง่ายมากเกินไปในการยอมรับข้อความเท็จที่เห็นได้ชัดจากผู้ใช้ และล้มเหลวในปัญหาหนักๆ เช่น การแนะนำช่องโหว่ด้านความปลอดภัยในโค้ด นอกจากนี้ยังไม่ตรวจสอบข้อเท็จจริงของข้อมูลที่มีให้อีกด้วย
เช่นเดียวกับรุ่นก่อน, GPT-4 สามารถสร้างคำแนะนำที่เป็นอันตราย รหัสบั๊กกี้ หรือข้อมูลที่ไม่ถูกต้องได้ อย่างไรก็ตาม ความสามารถเพิ่มเติมของแบบจำลองจะนำไปสู่พื้นที่ความเสี่ยงใหม่ๆ ที่ต้องทำความเข้าใจ เพื่อประเมินขอบเขตของความเสี่ยงเหล่านี้ ผู้เชี่ยวชาญกว่า 50 คน จากโดเมนต่างๆ รวมถึงความเสี่ยงในการจัดตำแหน่ง AI ความปลอดภัยทางไซเบอร์ ความเสี่ยงทางชีวภาพ ความไว้วางใจและความปลอดภัย และความปลอดภัยระหว่างประเทศ มีส่วนร่วมในการทดสอบโมเดลแบบตรงข้าม ความคิดเห็นและข้อมูลของพวกเขาจะถูกนำมาใช้เพื่อปรับปรุงโมเดล เช่น การรวบรวมข้อมูลเพิ่มเติมเพื่อปรับปรุง GPT-4ความสามารถในการปฏิเสธคำขอเกี่ยวกับวิธีการสังเคราะห์สารเคมีอันตราย
หนึ่งในวิธีหลัก OpenAI กำลังลดผลลัพธ์ที่เป็นอันตรายโดยการรวมสัญญาณรางวัลความปลอดภัยเพิ่มเติมในระหว่างการฝึกอบรม RLHF (การเรียนรู้การเสริมกำลังจากการตอบสนองของมนุษย์) สัญญาณจะฝึกโมเดลให้ปฏิเสธคำขอเนื้อหาที่เป็นอันตราย เช่น defiตามแนวทางการใช้งานของโมเดล รางวัลมอบให้โดย GPT-4 ตัวจําแนกแบบ Zero-shot ซึ่งจะตัดสินขอบเขตความปลอดภัยและรูปแบบความสมบูรณ์ตามการแจ้งเตือนที่เกี่ยวข้องกับความปลอดภัย
OpenAI ยังกล่าวอีกว่าได้ลดแนวโน้มของโมเดลในการตอบสนองต่อคำขอเนื้อหาที่ไม่ได้รับอนุญาตลง 82% เมื่อเทียบกับ GPT-3.5 และ GPT-4 ตอบสนองต่อคำขอที่ละเอียดอ่อน เช่น คำแนะนำทางการแพทย์ และการทำร้ายตัวเองตามนโยบายของบริษัทบ่อยขึ้น 29%
ในขณะที่ OpenAIการแทรกแซงของได้เพิ่มความยากในการดึงเอาพฤติกรรมที่ไม่ดีออกมา GPT-4ยังคงเป็นไปได้และยังมีการเจลเบรคที่สามารถสร้างเนื้อหาที่ละเมิดแนวทางการใช้งานได้
“ในขณะที่ระบบ AI เป็นที่แพร่หลายมากขึ้น การได้รับความน่าเชื่อถือในระดับสูงในการแทรกแซงเหล่านี้จะมีความสำคัญมากขึ้นเรื่อยๆ สำหรับตอนนี้ สิ่งสำคัญคือต้องเสริมข้อจำกัดเหล่านี้ด้วยเทคนิคความปลอดภัยเวลาปรับใช้ เช่น การตรวจสอบการละเมิด” บริษัทกล่าวเสริม
OpenAI กำลังร่วมมือกับนักวิจัยภายนอกเพื่อทำความเข้าใจและประเมินผลกระทบที่อาจเกิดขึ้นจาก GPT-4 และรุ่นต่อๆ ไป ทีมงานยังพัฒนาการประเมินความสามารถที่เป็นอันตรายที่อาจเกิดขึ้นในระบบ AI ในอนาคต ในขณะที่พวกเขายังคงศึกษาศักยภาพทางสังคมและ ผลกระทบทางเศรษฐกิจ of GPT-4 และระบบ AI อื่นๆ OpenAI จะแบ่งปันสิ่งที่ค้นพบและข้อมูลเชิงลึกกับสาธารณะในเวลาที่กำหนด
อ่านเพิ่มเติม:
ข้อจำกัดความรับผิดชอบ
สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า
เกี่ยวกับผู้เขียน
ซินดี้เป็นนักข่าวที่ Metaverse Postครอบคลุมหัวข้อที่เกี่ยวข้องกับ web3, NFT, metaverse และ AI โดยเน้นไปที่การสัมภาษณ์กับ Web3 ผู้เล่นในอุตสาหกรรม เธอได้พูดคุยกับผู้บริหารระดับ C มากกว่า 30 คนและเพิ่มขึ้นเรื่อยๆ เพื่อนำข้อมูลเชิงลึกอันมีค่ามาสู่ผู้อ่าน Cindy มีพื้นเพมาจากสิงคโปร์ ปัจจุบันประจำอยู่ที่เมืองทบิลิซี รัฐจอร์เจีย เธอสำเร็จการศึกษาระดับปริญญาตรีสาขาการสื่อสารและสื่อศึกษาจากมหาวิทยาลัยเซาท์ออสเตรเลีย และมีประสบการณ์ด้านสื่อสารมวลชนและการเขียนมาหลายทศวรรษ ติดต่อเธอได้ทาง [ป้องกันอีเมล] ด้วยการแถลงข่าว ประกาศ และโอกาสในการสัมภาษณ์
บทความอื่น ๆซินดี้เป็นนักข่าวที่ Metaverse Postครอบคลุมหัวข้อที่เกี่ยวข้องกับ web3, NFT, metaverse และ AI โดยเน้นไปที่การสัมภาษณ์กับ Web3 ผู้เล่นในอุตสาหกรรม เธอได้พูดคุยกับผู้บริหารระดับ C มากกว่า 30 คนและเพิ่มขึ้นเรื่อยๆ เพื่อนำข้อมูลเชิงลึกอันมีค่ามาสู่ผู้อ่าน Cindy มีพื้นเพมาจากสิงคโปร์ ปัจจุบันประจำอยู่ที่เมืองทบิลิซี รัฐจอร์เจีย เธอสำเร็จการศึกษาระดับปริญญาตรีสาขาการสื่อสารและสื่อศึกษาจากมหาวิทยาลัยเซาท์ออสเตรเลีย และมีประสบการณ์ด้านสื่อสารมวลชนและการเขียนมาหลายทศวรรษ ติดต่อเธอได้ทาง [ป้องกันอีเมล] ด้วยการแถลงข่าว ประกาศ และโอกาสในการสัมภาษณ์