รายงานข่าว เอสเอ็มดับบลิว เทคโนโลยี
May 10, 2023

Anthropic เสนอ 'AI เชิงบริบท' สำหรับโมเดลการแชทตามหลักการ 60 ข้อ

ในบทสรุป

OpenAI ใช้การเรียนรู้แบบเสริมแรงจากผลตอบรับของมนุษย์ (RLHF) เพื่อจัดตำแหน่ง โมเดลภาษา ด้วยหลักมนุษยธรรม ความปลอดภัย และประโยชน์ใช้สอย

Anthropic เสนอทางเลือกอื่น: AI ตามบริบท ซึ่งเกี่ยวข้องกับคนเขียนรัฐธรรมนูญที่แบบจำลองควรปฏิบัติตาม

ธรรมนูญนี้อิงตามคำประกาศสิทธิมนุษยชนของสหประชาชาติ ข้อกำหนดในการให้บริการของ Apple หลักการที่ส่งเสริมการพิจารณาในมุมมองที่ไม่ใช่คนตะวันตก

Anthropic ได้เสนอแนวทางใหม่ในการฝึกอบรมโมเดลการแชทโดยใช้ 'AI รัฐธรรมนูญ'. วิธีการนี้ต่อยอด OpenAI's การเรียนรู้การเสริมแรง จากคำติชมของมนุษย์ แต่สร้างขึ้นโดยหลีกเลี่ยงความจำเป็นในการเขียนตัวอย่างการฝึกอบรมเชิงลึก แบบจำลองได้รับการฝึกอบรมให้ตอบสนองต่อข้อมูลผ่านการใช้รัฐธรรมนูญซึ่งหมายถึงการทำหน้าที่เป็นชุดกฎหมายเพื่อให้แบบจำลองปฏิบัติตาม

Anthropic เสนอ 'AI เชิงบริบท' สำหรับโมเดลการแชทตามหลักการ 60 ข้อ
มานุษยวิทยา.com
ที่แนะนำ: Ex-OpenAI พนักงานก่อตั้ง Anthropic ซึ่งเป็นธุรกิจที่ดึงดูดเงินทุนกว่า 700 ล้านดอลลาร์

ด้วยวิธีการนี้ AI สามารถสร้างตัวอย่างการฝึกอบรมของตนเองโดยการประเมินสิ่งที่ได้กล่าวไปเทียบกับชุดหลักการที่ยอมรับทางกฎหมาย เทคนิคการประหยัดเวลานี้สามารถมองเห็นได้เช่น อาซิมอฟไอแซค's กฎหมายหุ่นยนต์ นำไปปฏิบัติ

หลักการที่เป็นฐานของแบบจำลองมีมากมายเกินกว่าจะอภิปรายในรายละเอียด อย่างไรก็ตาม ครอบคลุมหลายหัวข้อ เช่น ศีลธรรม การหลีกเลี่ยงความเสี่ยง เศรษฐศาสตร์ และปัญญาประดิษฐ์ แต่ละอย่างได้รับการพัฒนาเพื่อช่วยชี้นำการตัดสินใจของ AI เมื่อต้องตอบสนอง พร้อมท์การสนทนา.

Anthropic สามารถฝึกฝนโมเดล AI ชื่อ Claude ได้อย่างมีประสิทธิภาพ ซึ่งประสบความสำเร็จในการแข่งขันด้วย OpenAI's ChatGPT. ใช้ วิธีรัฐธรรมนูญ-AIClaude สามารถตอบสนองการสนทนาด้วยระดับความแม่นยำที่น่าประทับใจ แต่คาดว่าจะมีการปรับปรุงเพิ่มเติมเนื่องจาก Anthropic ยังคงต่อยอดจากเทคโนโลยีที่เปลี่ยนแปลงเกมนี้

การใช้ชุดหลักการและตัวอย่างกระบวนการบางส่วน แบบจำลองได้รับการสอนวิธีประเมินและแก้ไขคำตอบของตนเองตลอดระยะแรก ขั้นตอนที่สองเกี่ยวข้องกับการฝึกอบรมแบบจำลองโดยใช้การเรียนรู้แบบเสริมแรง แต่แทนที่จะใช้ข้อมูลจากมนุษย์ จะใช้ข้อเสนอแนะที่สร้างโดย AI ตามหลักการชุดหนึ่งเพื่อเลือกผลลัพธ์ที่อ่อนโยนกว่า

แนวทางใหม่นี้มีศักยภาพในการประหยัดเวลาและเงินสำหรับบริษัทต่างๆ ที่ไม่จำเป็นต้องสร้างตัวอย่างการฝึกอบรมของตนเองอีกต่อไป แต่วิธีการ 'สำเร็จรูป' นี้สามารถใช้เป็นพื้นฐานสำหรับการสร้างแบบจำลองที่พอดีแบบกำหนดเองได้ โดยไม่ต้องมีความรู้ด้านการเขียนโปรแกรม สิ่งสำคัญคือต้องสังเกตว่าเทคโนโลยีนี้สัญญาว่าจะเพิ่มความปลอดภัยอย่างไรเมื่อพูดถึงบอทสนทนา การสร้างชุดของหลักการที่เป็นที่ยอมรับทางกฎหมาย ช่วยลดความเสี่ยง ของ AI จะโกง

ดังนั้น Constituation AI ไม่เพียงแต่สัญญาว่าจะทำให้การพัฒนาโมเดลแชทง่ายและรวดเร็วขึ้นเท่านั้น แต่ยังทำให้ปลอดภัยยิ่งขึ้นอีกด้วย สถานการณ์ที่ได้ประโยชน์ทั้งสองฝ่ายสำหรับโลกของปัญญาประดิษฐ์และ ChatBots

การมองเชิงวิเคราะห์เกี่ยวกับ “Contextual AI” ของ Anthropic สำหรับ Chatbots

Contextual AI ของ Anthropic อิงตามหลักการมากกว่า 60 ข้อที่ได้รับจากปฏิญญาว่าด้วยสิทธิมนุษยชนของสหประชาชาติ ข้อกำหนดในการให้บริการของ Apple หลักการที่ส่งเสริมการพิจารณาในมุมมองที่ไม่ใช่คนตะวันตก ดีพมายด์ กฎนกกระจอกและการวิจัยมานุษยวิทยา ชุดที่ 1 และชุดที่ 2

ความจริงที่ว่าตอนนี้ AI สามารถสอนให้ประพฤติตนตามหลักการที่ได้รับจากแหล่งข้อมูลที่กว้างขวางและหลากหลายนั้นน่าทึ่งอย่างแท้จริง ด้วยการนำหลักการจากปฏิญญาสิทธิมนุษยชนแห่งสหประชาชาติ มาใช้ การตอบสนองของแชทบอทจึงสะท้อนถึงความสำคัญของการรักษาแนวคิดเรื่องเสรีภาพ ความเสมอภาค และภราดรภาพ หลักการดังกล่าวเป็นองค์ประกอบสำคัญในการรับประกันว่า การสนทนาแชทบอท มีจริยธรรมและให้ความเคารพ ในทำนองเดียวกัน การรวมข้อกำหนดในการให้บริการของ Apple ช่วยให้มั่นใจได้ว่า chatbot คำนึงถึงผลประโยชน์ความเป็นส่วนตัวของผู้ใช้

หลักการที่สนับสนุนการพิจารณามุมมองที่ไม่ใช่ตะวันตกยังมีบทบาทสำคัญในแบบจำลอง "AI ตามบริบท" หลักการเหล่านี้สะท้อนถึงความจำเป็นที่ AI จะต้องเคารพวัฒนธรรมอื่น และรับรองว่าการตอบสนองของแชทบอทจะไม่ถูกมองว่าเป็นอันตรายหรือน่ารังเกียจ ในทำนองเดียวกัน กฎ Sparrow ของ Deepmind กำหนดให้แชทบอทตอบสนองด้วยการตอบสนองเพื่อสร้างความสัมพันธ์กับผู้ใช้

การรวมชุดการวิจัยมานุษยวิทยาชุดที่ 1 และชุดที่ 2 เข้าด้วยกันเป็นการรับประกันขั้นสุดท้ายว่าการสนทนาของ AI ยังคงสุภาพและให้เกียรติกัน AI ได้รับการฝึกอบรมเพื่อให้แน่ใจว่าตอบคำถามอย่างรอบคอบและสุภาพ

สรุปแล้ว โมเดล “Contextual AI” ของ Anthropic เป็นความก้าวหน้าครั้งสำคัญอย่างเหลือเชื่อในด้านของ การวิจัย AI. การอนุญาตให้ AI ได้รับการสอนตามหลักการที่ได้รับจากแหล่งข้อมูลที่หลากหลายนั้น ความหมายทางจริยธรรมของการสนทนาอัตโนมัติจึงได้รับการปรับปรุงอย่างมาก

อ่านเพิ่มเติมเกี่ยวกับ AI:

ข้อจำกัดความรับผิดชอบ

สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า

เกี่ยวกับผู้เขียน

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

บทความอื่น ๆ
ดาเมียร์ ยาลอฟ
ดาเมียร์ ยาลอฟ

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

Hot Stories
เข้าร่วมจดหมายข่าวของเรา
ข่าวล่าสุด

ความอยากอาหารของสถาบันเติบโตขึ้นสู่ Bitcoin ETFs ท่ามกลางความผันผวน

การเปิดเผยผ่านการยื่นเอกสาร 13F เผยให้เห็นนักลงทุนสถาบันที่มีชื่อเสียงกำลังเล่น Bitcoin ETFs ซึ่งตอกย้ำถึงการยอมรับที่เพิ่มขึ้นของ ...

รู้เพิ่มเติม

วันพิพากษามาถึง: ชะตากรรมของ CZ แขวนอยู่ในสมดุลขณะที่ศาลสหรัฐฯ พิจารณาคำร้องของ DOJ

ฉางเผิง จ้าว เตรียมเผชิญโทษจำคุกในศาลสหรัฐฯ ในเมืองซีแอตเทิลวันนี้

รู้เพิ่มเติม
เข้าร่วมชุมชนเทคโนโลยีที่เป็นนวัตกรรมของเรา
อ่านเพิ่มเติม
อ่านเพิ่มเติม
Injective ผนึกกำลัง AltLayer เพื่อนำการรักษาความปลอดภัยกลับมาสู่ inEVM
บัญชีธุรกิจ รายงานข่าว เทคโนโลยี
Injective ผนึกกำลัง AltLayer เพื่อนำการรักษาความปลอดภัยกลับมาสู่ inEVM
May 3, 2024
Masa ร่วมมือกับ Teller เพื่อแนะนำกลุ่มการให้ยืมของ MASA ซึ่งช่วยให้สามารถกู้ยืม USDC บนฐานได้
ตลาด รายงานข่าว เทคโนโลยี
Masa ร่วมมือกับ Teller เพื่อแนะนำกลุ่มการให้ยืมของ MASA ซึ่งช่วยให้สามารถกู้ยืม USDC บนฐานได้
May 3, 2024
Velodrome เปิดตัวเวอร์ชัน Superchain Beta ในอีกไม่กี่สัปดาห์ข้างหน้าและขยายข้ามบล็อคเชน OP Stack Layer 2
ตลาด รายงานข่าว เทคโนโลยี
Velodrome เปิดตัวเวอร์ชัน Superchain Beta ในอีกไม่กี่สัปดาห์ข้างหน้าและขยายข้ามบล็อคเชน OP Stack Layer 2
May 3, 2024
CARV ประกาศความร่วมมือกับ Aethir เพื่อกระจายอำนาจชั้นข้อมูลและแจกจ่ายรางวัล
บัญชีธุรกิจ รายงานข่าว เทคโนโลยี
CARV ประกาศความร่วมมือกับ Aethir เพื่อกระจายอำนาจชั้นข้อมูลและแจกจ่ายรางวัล
May 3, 2024
CRYPTOMERIA LABS PTE. บจก.