Stability AIStableVicuna ของ StableVicuna เป็นแชทบอทตัวแรกที่ได้รับการฝึกฝนด้วยความคิดเห็นจากมนุษย์
ในบทสรุป
Stability AI เปิดตัว StableVicuna ซึ่งเป็นแชทบอตโอเพ่นซอร์สขนาดใหญ่ตัวแรกที่ใช้ Reinforcement Learning with Human Feedback (RLHF)
StableVicuna ขึ้นอยู่กับ Vicuna chatbot และใช้พารามิเตอร์ 13 พันล้าน LLaMA แบบ
Stability AI มี แนะนำ ความก้าวหน้าล่าสุดในด้าน AI คือ StableVicuna ซึ่งเป็นแชทบอตโอเพ่นซอร์สขนาดใหญ่ตัวแรกที่ได้รับการฝึกฝนโดยอาศัยการตอบสนองของมนุษย์ Chatbot ที่เป็นนวัตกรรมใหม่เป็นผลงานของ Stability AIบริษัทที่สร้างโมเดลรูปภาพโอเพ่นซอร์สยอดนิยม Stable Diffusionและอัลกอริธึมการสร้างภาพ AI ใหม่ล่าสุด ดีฟฟลอยด์.
StableVicuna ขึ้นอยู่กับแชทบอทของ Vicuna ที่เปิดตัวในเดือนเมษายน ซึ่งใช้พารามิเตอร์ 13 พันล้าน LLaMA แบบอย่าง. อะไรที่ทำให้ Vicuna แตกต่างออกไป Stability AI และ Carper AI แตกต่างคือการใช้การเรียนรู้แบบเสริมแรงพร้อมการตอบสนองของมนุษย์ (RLHF) วิธีนี้ทำให้แบบจำลองสามารถปรับปรุงได้อย่างต่อเนื่อง
Stability AI แสดงให้เห็นว่าแชทบอทประสบความสำเร็จเนื่องจากวิธีการฝึกอบรมสองประเภท ได้แก่ การปรับแต่งคำสั่งอย่างละเอียด และการเรียนรู้แบบเสริมแรงผ่านความคิดเห็นของมนุษย์ อย่างไรก็ตาม โมเดลแชทบอทที่มีอยู่ส่วนใหญ่ใช้เพียงวิธีเดียวเท่านั้น ไม่ใช่ทั้งสองวิธี เมื่อเร็วๆ นี้ ชุดข้อมูลสำหรับการฝึกอบรม RLHF เปิดเผยต่อสาธารณะแล้ว ดังนั้น พร้อมด้วยเครื่องมือการฝึกอบรมที่ใช้งานง่าย จึงทำให้เกิดการสร้าง StableVicuna ซึ่งเป็นโครงการขนาดใหญ่แห่งแรก โมเดลแชทบอท ที่รวมการฝึกอบรมทั้งสองประเภทเข้าด้วยกัน
StableVicuna รวมการสร้างข้อความ ฟังก์ชันทางคณิตศาสตร์อย่างง่าย และความสามารถในการเขียนโค้ด เปรียบได้กับแชทบอทโอเพ่นซอร์สอื่น ๆ ในเกณฑ์มาตรฐานทั่วไป
ตามที่ ตัวถอดรหัสแชทบอทแบบโอเพ่นซอร์สที่ปรับแต่งด้วยข้อมูลจากแชทบอทอื่น ๆ มีความเสี่ยงที่จะขยายข้อผิดพลาดและอคติที่มีอยู่ผ่านการฝึกอบรมซ้ำ ๆ ทำให้เกิดเอฟเฟกต์ห้องสะท้อนเสียง การปรับข้อมูลอย่างละเอียดยังสามารถทำให้ภาพหลอนรุนแรงขึ้นได้ด้วยการใส่ข้อมูลที่ไม่มีอยู่ในรุ่นดั้งเดิม
ผู้ใช้สามารถเข้าถึงการสาธิตของแชทบอทได้ กอดใบหน้า. บริษัทยังได้เปิดเผยแผนการที่จะให้บริการ StableVicuna ผ่านทางอินเตอร์เฟสการแชทในอนาคต
อ่านเพิ่มเติม:
ข้อจำกัดความรับผิดชอบ
สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า
เกี่ยวกับผู้เขียน
Agne เป็นนักข่าวที่รายงานข่าวเกี่ยวกับแนวโน้มล่าสุดและการพัฒนาใน metaverse, AI และ Web3 อุตสาหกรรมสำหรับ Metaverse Post. ความหลงใหลในการเล่าเรื่องของเธอทำให้เธอต้องสัมภาษณ์ผู้เชี่ยวชาญในสาขาเหล่านี้หลายครั้ง โดยพยายามค้นหาเรื่องราวที่น่าตื่นเต้นและมีส่วนร่วมอยู่เสมอ แอกเน่สำเร็จการศึกษาระดับปริญญาตรีสาขาวรรณคดีและมีพื้นฐานกว้างขวางในการเขียนเกี่ยวกับหัวข้อต่างๆ มากมาย รวมถึงการท่องเที่ยว ศิลปะ และวัฒนธรรม เธอยังได้อาสาเป็นบรรณาธิการให้กับองค์กรสิทธิสัตว์ ซึ่งเธอช่วยสร้างความตระหนักรู้เกี่ยวกับปัญหาสวัสดิภาพสัตว์ ติดต่อเธอได้ที่ [ป้องกันอีเมล].
บทความอื่น ๆAgne เป็นนักข่าวที่รายงานข่าวเกี่ยวกับแนวโน้มล่าสุดและการพัฒนาใน metaverse, AI และ Web3 อุตสาหกรรมสำหรับ Metaverse Post. ความหลงใหลในการเล่าเรื่องของเธอทำให้เธอต้องสัมภาษณ์ผู้เชี่ยวชาญในสาขาเหล่านี้หลายครั้ง โดยพยายามค้นหาเรื่องราวที่น่าตื่นเต้นและมีส่วนร่วมอยู่เสมอ แอกเน่สำเร็จการศึกษาระดับปริญญาตรีสาขาวรรณคดีและมีพื้นฐานกว้างขวางในการเขียนเกี่ยวกับหัวข้อต่างๆ มากมาย รวมถึงการท่องเที่ยว ศิลปะ และวัฒนธรรม เธอยังได้อาสาเป็นบรรณาธิการให้กับองค์กรสิทธิสัตว์ ซึ่งเธอช่วยสร้างความตระหนักรู้เกี่ยวกับปัญหาสวัสดิภาพสัตว์ ติดต่อเธอได้ที่ [ป้องกันอีเมล].