Anthropic เสนอ 'AI เชิงบริบท' สำหรับโมเดลการแชทตามหลักการ 60 ข้อ
ในบทสรุป
OpenAI ใช้การเรียนรู้แบบเสริมแรงจากผลตอบรับของมนุษย์ (RLHF) เพื่อจัดตำแหน่ง โมเดลภาษา ด้วยหลักมนุษยธรรม ความปลอดภัย และประโยชน์ใช้สอย
Anthropic เสนอทางเลือกอื่น: AI ตามบริบท ซึ่งเกี่ยวข้องกับคนเขียนรัฐธรรมนูญที่แบบจำลองควรปฏิบัติตาม
ธรรมนูญนี้อิงตามคำประกาศสิทธิมนุษยชนของสหประชาชาติ ข้อกำหนดในการให้บริการของ Apple หลักการที่ส่งเสริมการพิจารณาในมุมมองที่ไม่ใช่คนตะวันตก
Anthropic ได้เสนอแนวทางใหม่ในการฝึกอบรมโมเดลการแชทโดยใช้ 'AI รัฐธรรมนูญ'. วิธีการนี้ต่อยอด OpenAI's การเรียนรู้การเสริมแรง จากคำติชมของมนุษย์ แต่สร้างขึ้นโดยหลีกเลี่ยงความจำเป็นในการเขียนตัวอย่างการฝึกอบรมเชิงลึก แบบจำลองได้รับการฝึกอบรมให้ตอบสนองต่อข้อมูลผ่านการใช้รัฐธรรมนูญซึ่งหมายถึงการทำหน้าที่เป็นชุดกฎหมายเพื่อให้แบบจำลองปฏิบัติตาม
ด้วยวิธีการนี้ AI สามารถสร้างตัวอย่างการฝึกอบรมของตนเองโดยการประเมินสิ่งที่ได้กล่าวไปเทียบกับชุดหลักการที่ยอมรับทางกฎหมาย เทคนิคการประหยัดเวลานี้สามารถมองเห็นได้เช่น อาซิมอฟไอแซค's กฎหมายหุ่นยนต์ นำไปปฏิบัติ
หลักการที่เป็นฐานของแบบจำลองมีมากมายเกินกว่าจะอภิปรายในรายละเอียด อย่างไรก็ตาม ครอบคลุมหลายหัวข้อ เช่น ศีลธรรม การหลีกเลี่ยงความเสี่ยง เศรษฐศาสตร์ และปัญญาประดิษฐ์ แต่ละอย่างได้รับการพัฒนาเพื่อช่วยชี้นำการตัดสินใจของ AI เมื่อต้องตอบสนอง พร้อมท์การสนทนา.
Anthropic สามารถฝึกฝนโมเดล AI ชื่อ Claude ได้อย่างมีประสิทธิภาพ ซึ่งประสบความสำเร็จในการแข่งขันด้วย OpenAI's ChatGPT. ใช้ วิธีรัฐธรรมนูญ-AIClaude สามารถตอบสนองการสนทนาด้วยระดับความแม่นยำที่น่าประทับใจ แต่คาดว่าจะมีการปรับปรุงเพิ่มเติมเนื่องจาก Anthropic ยังคงต่อยอดจากเทคโนโลยีที่เปลี่ยนแปลงเกมนี้
แนวทางใหม่นี้มีศักยภาพในการประหยัดเวลาและเงินสำหรับบริษัทต่างๆ ที่ไม่จำเป็นต้องสร้างตัวอย่างการฝึกอบรมของตนเองอีกต่อไป แต่วิธีการ 'สำเร็จรูป' นี้สามารถใช้เป็นพื้นฐานสำหรับการสร้างแบบจำลองที่พอดีแบบกำหนดเองได้ โดยไม่ต้องมีความรู้ด้านการเขียนโปรแกรม สิ่งสำคัญคือต้องสังเกตว่าเทคโนโลยีนี้สัญญาว่าจะเพิ่มความปลอดภัยอย่างไรเมื่อพูดถึงบอทสนทนา การสร้างชุดของหลักการที่เป็นที่ยอมรับทางกฎหมาย ช่วยลดความเสี่ยง ของ AI จะโกง
ดังนั้น Constituation AI ไม่เพียงแต่สัญญาว่าจะทำให้การพัฒนาโมเดลแชทง่ายและรวดเร็วขึ้นเท่านั้น แต่ยังทำให้ปลอดภัยยิ่งขึ้นอีกด้วย สถานการณ์ที่ได้ประโยชน์ทั้งสองฝ่ายสำหรับโลกของปัญญาประดิษฐ์และ ChatBots
การมองเชิงวิเคราะห์เกี่ยวกับ “Contextual AI” ของ Anthropic สำหรับ Chatbots
Contextual AI ของ Anthropic อิงตามหลักการมากกว่า 60 ข้อที่ได้รับจากปฏิญญาว่าด้วยสิทธิมนุษยชนของสหประชาชาติ ข้อกำหนดในการให้บริการของ Apple หลักการที่ส่งเสริมการพิจารณาในมุมมองที่ไม่ใช่คนตะวันตก ดีพมายด์ กฎนกกระจอกและการวิจัยมานุษยวิทยา ชุดที่ 1 และชุดที่ 2
ความจริงที่ว่าตอนนี้ AI สามารถสอนให้ประพฤติตนตามหลักการที่ได้รับจากแหล่งข้อมูลที่กว้างขวางและหลากหลายนั้นน่าทึ่งอย่างแท้จริง ด้วยการนำหลักการจากปฏิญญาสิทธิมนุษยชนแห่งสหประชาชาติ มาใช้ การตอบสนองของแชทบอทจึงสะท้อนถึงความสำคัญของการรักษาแนวคิดเรื่องเสรีภาพ ความเสมอภาค และภราดรภาพ หลักการดังกล่าวเป็นองค์ประกอบสำคัญในการรับประกันว่า การสนทนาแชทบอท มีจริยธรรมและให้ความเคารพ ในทำนองเดียวกัน การรวมข้อกำหนดในการให้บริการของ Apple ช่วยให้มั่นใจได้ว่า chatbot คำนึงถึงผลประโยชน์ความเป็นส่วนตัวของผู้ใช้
หลักการที่สนับสนุนการพิจารณามุมมองที่ไม่ใช่ตะวันตกยังมีบทบาทสำคัญในแบบจำลอง "AI ตามบริบท" หลักการเหล่านี้สะท้อนถึงความจำเป็นที่ AI จะต้องเคารพวัฒนธรรมอื่น และรับรองว่าการตอบสนองของแชทบอทจะไม่ถูกมองว่าเป็นอันตรายหรือน่ารังเกียจ ในทำนองเดียวกัน กฎ Sparrow ของ Deepmind กำหนดให้แชทบอทตอบสนองด้วยการตอบสนองเพื่อสร้างความสัมพันธ์กับผู้ใช้
การรวมชุดการวิจัยมานุษยวิทยาชุดที่ 1 และชุดที่ 2 เข้าด้วยกันเป็นการรับประกันขั้นสุดท้ายว่าการสนทนาของ AI ยังคงสุภาพและให้เกียรติกัน AI ได้รับการฝึกอบรมเพื่อให้แน่ใจว่าตอบคำถามอย่างรอบคอบและสุภาพ
สรุปแล้ว โมเดล “Contextual AI” ของ Anthropic เป็นความก้าวหน้าครั้งสำคัญอย่างเหลือเชื่อในด้านของ การวิจัย AI. การอนุญาตให้ AI ได้รับการสอนตามหลักการที่ได้รับจากแหล่งข้อมูลที่หลากหลายนั้น ความหมายทางจริยธรรมของการสนทนาอัตโนมัติจึงได้รับการปรับปรุงอย่างมาก
อ่านเพิ่มเติมเกี่ยวกับ AI:
ข้อจำกัดความรับผิดชอบ
สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า
เกี่ยวกับผู้เขียน
Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต
บทความอื่น ๆDamir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต