รายงานข่าว เทคโนโลยี
March 16, 2023

GPT-4 สืบทอดข้อเท็จจริงที่ "หลอนประสาท" และข้อผิดพลาดในการให้เหตุผลจากก่อนหน้านี้ GPT Models

ในบทสรุป

OpenAI พูดว่า GPT-4 มีข้อจำกัดเหมือนเมื่อก่อน GPT โมเดล.

GPT-4 ยังคงเห็นภาพหลอนข้อเท็จจริงและทำให้เกิดข้อผิดพลาดในการให้เหตุผล

อย่างไรก็ตาม GPT-4 คะแนนสูงกว่า 40% OpenAIล่าสุด GPT-3.5 ในการประเมินข้อเท็จจริงที่ขัดแย้งภายในของบริษัท

GPT-4 สืบทอดข้อเท็จจริง "ภาพหลอน" และข้อผิดพลาดในการให้เหตุผลจากก่อนหน้านี้ GPT Models

OpenAI ได้เตือนผู้ใช้ว่ารุ่นภาษาล่าสุด GPT-4ยังคงไม่น่าเชื่อถืออย่างสมบูรณ์และสามารถ "เห็นภาพหลอน" ข้อเท็จจริงและทำให้เกิดข้อผิดพลาดในการให้เหตุผลได้ บริษัทขอเรียกร้องให้ผู้ใช้ใช้ความระมัดระวังเมื่อใช้ผลลัพธ์ของโมเดลภาษา โดยเฉพาะอย่างยิ่งใน “บริบทที่มีเดิมพันสูง”

อย่างไรก็ตามข่าวดีก็คือ GPT-4 ลดภาพหลอนลงอย่างมากเมื่อเทียบกับรุ่นก่อนหน้า OpenAI อ้างว่า GPT-4 คะแนนสูงกว่าครั้งล่าสุดถึง 40% GPT-3.5 ในการประเมินความเป็นจริงของฝ่ายตรงข้ามภายใน 

ผ่านทาง OpenAI

“เราได้ดำเนินการกับเกณฑ์มาตรฐานภายนอก เช่น TruthfulQA ซึ่งทดสอบความสามารถของแบบจำลองในการแยกข้อเท็จจริงออกจากชุดข้อความที่ไม่ถูกต้องซึ่งฝ่ายตรงข้ามเลือกไว้ คำถามเหล่านี้จับคู่กับคำตอบที่ไม่ถูกต้องตามข้อเท็จจริงและน่าสนใจทางสถิติ” OpenAI เขียนใน โพสต์บล็อก.

แม้จะมีการปรับปรุงนี้ โมเดลก็ยังขาดความรู้เกี่ยวกับเหตุการณ์ที่เกิดขึ้นหลังเดือนกันยายน 2021 และบางครั้งก็เกิดข้อผิดพลาดในการให้เหตุผลง่ายๆ เช่นเดียวกับโมเดลก่อนหน้านี้ นอกจากนี้ ยังใจง่ายมากเกินไปในการยอมรับข้อความเท็จที่เห็นได้ชัดจากผู้ใช้ และล้มเหลวในปัญหาหนักๆ เช่น การแนะนำช่องโหว่ด้านความปลอดภัยในโค้ด นอกจากนี้ยังไม่ตรวจสอบข้อเท็จจริงของข้อมูลที่มีให้อีกด้วย

เช่นเดียวกับรุ่นก่อน, GPT-4 สามารถสร้างคำแนะนำที่เป็นอันตราย รหัสบั๊กกี้ หรือข้อมูลที่ไม่ถูกต้องได้ อย่างไรก็ตาม ความสามารถเพิ่มเติมของแบบจำลองจะนำไปสู่พื้นที่ความเสี่ยงใหม่ๆ ที่ต้องทำความเข้าใจ เพื่อประเมินขอบเขตของความเสี่ยงเหล่านี้ ผู้เชี่ยวชาญกว่า 50 คน จากโดเมนต่างๆ รวมถึงความเสี่ยงในการจัดตำแหน่ง AI ความปลอดภัยทางไซเบอร์ ความเสี่ยงทางชีวภาพ ความไว้วางใจและความปลอดภัย และความปลอดภัยระหว่างประเทศ มีส่วนร่วมในการทดสอบโมเดลแบบตรงข้าม ความคิดเห็นและข้อมูลของพวกเขาจะถูกนำมาใช้เพื่อปรับปรุงโมเดล เช่น การรวบรวมข้อมูลเพิ่มเติมเพื่อปรับปรุง GPT-4ความสามารถในการปฏิเสธคำขอเกี่ยวกับวิธีการสังเคราะห์สารเคมีอันตราย

หนึ่งในวิธีหลัก OpenAI กำลังลดผลลัพธ์ที่เป็นอันตรายโดยการรวมสัญญาณรางวัลความปลอดภัยเพิ่มเติมในระหว่างการฝึกอบรม RLHF (การเรียนรู้การเสริมกำลังจากการตอบสนองของมนุษย์) สัญญาณจะฝึกโมเดลให้ปฏิเสธคำขอเนื้อหาที่เป็นอันตราย เช่น defiตามแนวทางการใช้งานของโมเดล รางวัลมอบให้โดย GPT-4 ตัวจําแนกแบบ Zero-shot ซึ่งจะตัดสินขอบเขตความปลอดภัยและรูปแบบความสมบูรณ์ตามการแจ้งเตือนที่เกี่ยวข้องกับความปลอดภัย

OpenAI ยังกล่าวอีกว่าได้ลดแนวโน้มของโมเดลในการตอบสนองต่อคำขอเนื้อหาที่ไม่ได้รับอนุญาตลง 82% เมื่อเทียบกับ GPT-3.5 และ GPT-4 ตอบสนองต่อคำขอที่ละเอียดอ่อน เช่น คำแนะนำทางการแพทย์ และการทำร้ายตัวเองตามนโยบายของบริษัทบ่อยขึ้น 29%

ผ่านทาง OpenAI

ในขณะที่ OpenAIการแทรกแซงของได้เพิ่มความยากในการดึงเอาพฤติกรรมที่ไม่ดีออกมา GPT-4ยังคงเป็นไปได้และยังมีการเจลเบรคที่สามารถสร้างเนื้อหาที่ละเมิดแนวทางการใช้งานได้ 

“ในขณะที่ระบบ AI เป็นที่แพร่หลายมากขึ้น การได้รับความน่าเชื่อถือในระดับสูงในการแทรกแซงเหล่านี้จะมีความสำคัญมากขึ้นเรื่อยๆ สำหรับตอนนี้ สิ่งสำคัญคือต้องเสริมข้อจำกัดเหล่านี้ด้วยเทคนิคความปลอดภัยเวลาปรับใช้ เช่น การตรวจสอบการละเมิด” บริษัทกล่าวเสริม

OpenAI กำลังร่วมมือกับนักวิจัยภายนอกเพื่อทำความเข้าใจและประเมินผลกระทบที่อาจเกิดขึ้นจาก GPT-4 และรุ่นต่อๆ ไป ทีมงานยังพัฒนาการประเมินความสามารถที่เป็นอันตรายที่อาจเกิดขึ้นในระบบ AI ในอนาคต ในขณะที่พวกเขายังคงศึกษาศักยภาพทางสังคมและ ผลกระทบทางเศรษฐกิจ of GPT-4 และระบบ AI อื่นๆ OpenAI จะแบ่งปันสิ่งที่ค้นพบและข้อมูลเชิงลึกกับสาธารณะในเวลาที่กำหนด

อ่านเพิ่มเติม:

คีย์เวิร์ด:

ข้อจำกัดความรับผิดชอบ

สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า

เกี่ยวกับผู้เขียน

ซินดี้เป็นนักข่าวที่ Metaverse Postครอบคลุมหัวข้อที่เกี่ยวข้องกับ web3, NFT, metaverse และ AI โดยเน้นไปที่การสัมภาษณ์กับ Web3 ผู้เล่นในอุตสาหกรรม เธอได้พูดคุยกับผู้บริหารระดับ C มากกว่า 30 คนและเพิ่มขึ้นเรื่อยๆ เพื่อนำข้อมูลเชิงลึกอันมีค่ามาสู่ผู้อ่าน Cindy มีพื้นเพมาจากสิงคโปร์ ปัจจุบันประจำอยู่ที่เมืองทบิลิซี รัฐจอร์เจีย เธอสำเร็จการศึกษาระดับปริญญาตรีสาขาการสื่อสารและสื่อศึกษาจากมหาวิทยาลัยเซาท์ออสเตรเลีย และมีประสบการณ์ด้านสื่อสารมวลชนและการเขียนมาหลายทศวรรษ ติดต่อเธอได้ทาง [ป้องกันอีเมล] ด้วยการแถลงข่าว ประกาศ และโอกาสในการสัมภาษณ์

บทความอื่น ๆ
ซินดี้ แทน
ซินดี้ แทน

ซินดี้เป็นนักข่าวที่ Metaverse Postครอบคลุมหัวข้อที่เกี่ยวข้องกับ web3, NFT, metaverse และ AI โดยเน้นไปที่การสัมภาษณ์กับ Web3 ผู้เล่นในอุตสาหกรรม เธอได้พูดคุยกับผู้บริหารระดับ C มากกว่า 30 คนและเพิ่มขึ้นเรื่อยๆ เพื่อนำข้อมูลเชิงลึกอันมีค่ามาสู่ผู้อ่าน Cindy มีพื้นเพมาจากสิงคโปร์ ปัจจุบันประจำอยู่ที่เมืองทบิลิซี รัฐจอร์เจีย เธอสำเร็จการศึกษาระดับปริญญาตรีสาขาการสื่อสารและสื่อศึกษาจากมหาวิทยาลัยเซาท์ออสเตรเลีย และมีประสบการณ์ด้านสื่อสารมวลชนและการเขียนมาหลายทศวรรษ ติดต่อเธอได้ทาง [ป้องกันอีเมล] ด้วยการแถลงข่าว ประกาศ และโอกาสในการสัมภาษณ์

Hot Stories
เข้าร่วมจดหมายข่าวของเรา
ข่าวล่าสุด

DOGE Frenzy: การวิเคราะห์มูลค่าที่เพิ่มขึ้นล่าสุดของ Dogecoin (DOGE)

อุตสาหกรรมสกุลเงินดิจิทัลกำลังขยายตัวอย่างรวดเร็ว และเหรียญมีมกำลังเตรียมพร้อมสำหรับการแกว่งตัวขึ้นอย่างมีนัยสำคัญ โดชคอยน์ (DOGE), ...

รู้เพิ่มเติม

วิวัฒนาการของเนื้อหาที่สร้างโดย AI ใน Metaverse

การเกิดขึ้นของเนื้อหา AI เจนเนอเรชั่นถือเป็นหนึ่งในพัฒนาการที่น่าสนใจที่สุดภายในสภาพแวดล้อมเสมือนจริง ...

รู้เพิ่มเติม
เข้าร่วมชุมชนเทคโนโลยีที่เป็นนวัตกรรมของเรา
อ่านเพิ่มเติม
อ่านเพิ่มเติม
ข้อเสนอที่ดีที่สุดประจำสัปดาห์นี้ การลงทุนที่สำคัญใน AI, ไอที Web3และสกุลเงินดิจิทัล (22-26.04)
ย่อยอาหาร บัญชีธุรกิจ ตลาด เทคโนโลยี
ข้อเสนอที่ดีที่สุดประจำสัปดาห์นี้ การลงทุนที่สำคัญใน AI, ไอที Web3และสกุลเงินดิจิทัล (22-26.04)
April 26, 2024
Vitalik Buterin แสดงความคิดเห็นเกี่ยวกับการรวมศูนย์ของ PoW โปรดทราบว่านี่เป็นขั้นตอนชั่วคราวจนกว่าจะถึง PoS
รายงานข่าว เทคโนโลยี
Vitalik Buterin แสดงความคิดเห็นเกี่ยวกับการรวมศูนย์ของ PoW โปรดทราบว่านี่เป็นขั้นตอนชั่วคราวจนกว่าจะถึง PoS
April 26, 2024
Offchain Labs เผยการค้นพบช่องโหว่ที่สำคัญสองรายการในการพิสูจน์การฉ้อโกงของ OP Stack ของ Optimism
รายงานข่าว ซอฟต์แวร์ เทคโนโลยี
Offchain Labs เผยการค้นพบช่องโหว่ที่สำคัญสองรายการในการพิสูจน์การฉ้อโกงของ OP Stack ของ Optimism
April 26, 2024
ตลาดเปิดของ Dymension สำหรับการเชื่อมโยงสภาพคล่องจาก RollApps eIBC เปิดตัวบน Mainnet
รายงานข่าว เทคโนโลยี
ตลาดเปิดของ Dymension สำหรับการเชื่อมโยงสภาพคล่องจาก RollApps eIBC เปิดตัวบน Mainnet 
April 26, 2024
CRYPTOMERIA LABS PTE. บจก.