RagaAI เปิดตัว Open-Source LLM Hub เพื่อความสะดวกในการประเมินโมเดลภาษาและความปลอดภัย
ในบทสรุป
RagaAI เปิดตัว 'RagaAI LLM Hub' ซึ่งเป็นแพลตฟอร์มโอเพ่นซอร์สสำหรับการประเมินและสร้างรั้วสำหรับโมเดลภาษาเฉพาะของ AI
แพลตฟอร์มทดสอบ AI รากาไอ ล่าสุดได้ประกาศเปิดตัว “RagaAI LLM ฮับ” ซึ่งเป็นแพลตฟอร์มโอเพ่นซอร์สและพร้อมสำหรับองค์กรที่ออกแบบมาเพื่อการประเมินและสร้างรั้วสำหรับ โมเดลภาษาขนาดใหญ่ (LLM) ด้วยตัววัดที่สร้างขึ้นอย่างพิถีพิถันมากกว่า 100 รายการ แพลตฟอร์มดังกล่าวมีจุดมุ่งหมายเพื่อป้องกันความล้มเหลวร้ายแรงใน LLM และแอปพลิเคชันดึงข้อมูล Augmented Generation (RAG)
RagaAI LLM Hub นำเสนอชุดเครื่องมือที่มีประสิทธิภาพสำหรับนักพัฒนาและองค์กรต่างๆ เพื่อประเมินและเปรียบเทียบ LLM อย่างมีประสิทธิภาพ ครอบคลุมประเด็นที่สำคัญ เช่น ความเกี่ยวข้องและความเข้าใจ คุณภาพเนื้อหา อาการประสาทหลอน, ความปลอดภัยและความลำเอียง, ความเกี่ยวข้องของบริบท, การสแกนรั้วและช่องโหว่ นอกจากนี้ยังมีชุดการทดสอบตามหน่วยเมตริกสำหรับการวิเคราะห์เชิงปริมาณ
“การประเมิน LLM แบบองค์รวมถือเป็นข้อกำหนดสำคัญในโลกของการสร้าง LLM ในขณะนี้ เนื่องจากนักวิทยาศาสตร์ข้อมูลและองค์กรต่างๆ ทราบว่าเทคโนโลยีและสแต็กใดที่เหมาะกับพวกเขา การวินิจฉัยปัญหาจำเป็นต้องระบุปัญหาที่ต้นเหตุอย่างพิถีพิถัน และเมื่อพิจารณาถึงสาเหตุที่เป็นไปได้หลายร้อยรายการ ต้องใช้เมตริกหลายร้อยรายการเพื่อระบุสาเหตุที่แท้จริง” เการาฟ อาการ์วาลผู้ก่อตั้ง RagaAI กล่าว MPost.
“ความสามารถของ RagaAI LLM Hub สำหรับการทดสอบแบบครอบคลุมเพิ่มมูลค่าที่สำคัญให้กับขั้นตอนการทำงานของนักพัฒนา ประหยัดเวลาที่สำคัญโดยกำจัดการวิเคราะห์เฉพาะกิจ และเร่งการพัฒนา LLM ได้ถึง 3 เท่า”
ออกแบบมาเพื่อแก้ไขปัญหาตลอดวงจรชีวิตของ LLM ตั้งแต่การพิสูจน์แนวคิดไปจนถึงการใช้งานจริง RagaAI LLM Hub ระบุปัญหาที่ซ่อนอยู่ภายใน แอปพลิเคชัน LLM และอำนวยความสะดวกในการแก้ปัญหาตั้งแต่ต้นทาง ปฏิวัติแนวทางในการประกันความน่าเชื่อถือและความน่าเชื่อถือ
RagaAI ยืนยันว่า LLM Hub ของตนเสริมความสามารถนี้ผ่านการทดสอบต่างๆ ที่ครอบคลุมด้านการตัดสินใจต่างๆ:
- พรอมต์: วนซ้ำและระบุเทมเพลตพรอมต์ที่เหมาะสมที่สุดในขณะเดียวกันก็สร้างรั้วเพื่อลดการโจมตีของฝ่ายตรงข้าม
- การจัดการบริบทสำหรับ RAG: ช่วยเหลือผู้ใช้ในการค้นหาสมดุลที่เหมาะสมที่สุดระหว่างประสิทธิภาพของ LLM และต้นทุน/เวลาแฝงเมื่อดำเนินการในวงกว้าง
- การสร้างการตอบสนอง: ใช้หน่วยเมตริกเพื่อระบุภาพหลอนในการตอบสนองของ LLM และสร้างแนวป้องกันเพื่อป้องกันอคติ การรั่วไหลของ PII และปัญหาที่อาจเกิดขึ้นอื่นๆ
การบรรเทาอาการประสาทหลอนและอคติของ AI ด้วยการวินิจฉัย LLM
RagaAI LLM Hub ค้นหาแอปพลิเคชันในอุตสาหกรรมต่างๆ รวมถึงอีคอมเมิร์ซ การเงิน การตลาด กฎหมายและการดูแลสุขภาพ สนับสนุนนักพัฒนาและองค์กรในงานต่างๆ เช่น chatbotsการสร้างเนื้อหา การสรุปข้อความ และการสร้างซอร์สโค้ด
นอกเหนือจากการประเมิน RagaAI LLM Hub ยังช่วยในการกำหนดแนวป้องกันเพื่อให้มั่นใจถึงความเป็นส่วนตัวของข้อมูลและการปฏิบัติตามกฎหมาย ส่งเสริมจริยธรรมและ AI ที่รับผิดชอบ แนวทางปฏิบัติ โดยเฉพาะอย่างยิ่งในภาคส่วนที่ละเอียดอ่อน เช่น การเงิน การดูแลสุขภาพ และกฎหมาย
“ลูกค้ารายหนึ่งของเราในพื้นที่อีคอมเมิร์ซใช้ LLM สำหรับแชทบอทเพื่อสนับสนุนลูกค้า และแชทบอทก็ให้คำตอบที่ผิด การใช้ RagaAI ทำให้ตรวจพบและแก้ไขปัญหานี้ได้สำเร็จ” Gaurav Agarwal จาก RagaAI กล่าว MPost. “ในการประกันสุขภาพ ข้อมูลส่วนบุคคลของผู้ป่วยเป็นสิ่งสำคัญที่ต้องได้รับการปกป้อง หนึ่งในลูกค้าของเรา ข้อมูลส่วนบุคคลที่สำคัญบางส่วนถูกแชร์ไปยังบุคคลที่สาม ซึ่งเป็นปัญหาความเป็นส่วนตัวของข้อมูลขนาดใหญ่ การใช้ราวกั้น RagaAI LLM Hub นี้และปัญหาอื่นๆ ที่คล้ายกันถูกตรวจพบแบบเรียลไทม์และป้องกันไม่ให้เกิดขึ้น”
นอกจากนี้ยังมีจุดมุ่งหมายเพื่อลดความเสี่ยงด้านชื่อเสียงด้วยการยึดมั่นในบรรทัดฐานและค่านิยมของสังคม
“RagaAI ช่วยในการกำหนดแนวป้องกัน เช่น การตรวจจับข้อมูลส่วนบุคคล (PII) ในการตอบสนองของ LLM สิ่งนี้ทำให้มั่นใจได้ว่าข้อมูลส่วนบุคคลจากเอกสารภายในจะไม่รั่วไหลโดยแอปพลิเคชัน LLM และมีความสำคัญต่อ Responsible AI” Gaurav Agarwal อธิบาย “มาตรการป้องกันนี้และแนวทางอื่นๆ เช่น การรับรองการตอบสนองที่เป็นกลางและยุติธรรม การไม่แสดงความคิดเห็นต่อคู่แข่ง และการลบข้อมูลที่ไม่เปิดเผยต่อสาธารณะ (MNPI) เป็นสิ่งสำคัญสำหรับบริษัทต่างๆ เนื่องจากพวกเขาต้องการหลีกเลี่ยงความเสียหายต่อสังคมและชื่อเสียง”
การเปิดตัว RagaAI LLM Hub ตามมาด้วยความสำเร็จ $ 4.7 ล้าน ในรอบการระดมทุนเริ่มต้นในเดือนมกราคม 2024 ซึ่งนำโดย pi Ventures เพื่อขยายธุรกิจ การวิจัย AIการพัฒนาและฐานลูกค้าทั่วสหรัฐอเมริกาและยุโรป
“เป้าหมายของเราคือการจัดหาเทคโนโลยีที่ดีที่สุดเพื่อทำให้ LLM น่าเชื่อถือและเชื่อถือได้ มีการลงทุนอย่างมากเพื่อสร้างเทคโนโลยีหลักเพื่อรองรับด้านการประกันคุณภาพ LLM การทำให้เทคโนโลยีโอเพ่นซอร์สนี้เป็นความพยายามของเราในการทำให้ทุกคนสามารถเข้าถึงสิ่งนี้ได้สำหรับชุมชนนักพัฒนา เพื่อสร้างโซลูชันที่ดีที่สุดที่มีอยู่” Gaurav Agarwal กล่าว
ข้อจำกัดความรับผิดชอบ
สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า
เกี่ยวกับผู้เขียน
Victor เป็นบรรณาธิการ/นักเขียนด้านการจัดการด้านเทคโนโลยีที่ Metaverse Post และครอบคลุมถึงปัญญาประดิษฐ์ คริปโต วิทยาศาสตร์ข้อมูล เมตาเวิร์ส และความปลอดภัยทางไซเบอร์ภายในขอบเขตองค์กร เขามีประสบการณ์ด้านสื่อและ AI มาครึ่งทศวรรษในสื่อชื่อดัง เช่น VentureBeat, DatatechVibe และ Analytics India Magazine ในฐานะที่ปรึกษาด้านสื่อในมหาวิทยาลัยที่มีชื่อเสียง รวมถึง Oxford และ USC และสำเร็จการศึกษาระดับปริญญาโทด้านวิทยาศาสตร์ข้อมูลและการวิเคราะห์ Victor มีความมุ่งมั่นอย่างยิ่งที่จะติดตามแนวโน้มที่เกิดขึ้นใหม่ เขาเสนอเรื่องราวล่าสุดและลึกซึ้งที่สุดแก่ผู้อ่านจากเทคโนโลยีและ Web3 ภูมิประเทศ
บทความอื่น ๆ
Victor เป็นบรรณาธิการ/นักเขียนด้านการจัดการด้านเทคโนโลยีที่ Metaverse Post และครอบคลุมถึงปัญญาประดิษฐ์ คริปโต วิทยาศาสตร์ข้อมูล เมตาเวิร์ส และความปลอดภัยทางไซเบอร์ภายในขอบเขตองค์กร เขามีประสบการณ์ด้านสื่อและ AI มาครึ่งทศวรรษในสื่อชื่อดัง เช่น VentureBeat, DatatechVibe และ Analytics India Magazine ในฐานะที่ปรึกษาด้านสื่อในมหาวิทยาลัยที่มีชื่อเสียง รวมถึง Oxford และ USC และสำเร็จการศึกษาระดับปริญญาโทด้านวิทยาศาสตร์ข้อมูลและการวิเคราะห์ Victor มีความมุ่งมั่นอย่างยิ่งที่จะติดตามแนวโน้มที่เกิดขึ้นใหม่ เขาเสนอเรื่องราวล่าสุดและลึกซึ้งที่สุดแก่ผู้อ่านจากเทคโนโลยีและ Web3 ภูมิประเทศ