Laporan berita Teknologi
08 Maret, 2024

RagaAI Meluncurkan Hub LLM Sumber Terbuka untuk Memudahkan Evaluasi & Keamanan Model Bahasa

Singkatnya

RagaAI meluncurkan 'RagaAI LLM Hub', sebuah platform sumber terbuka untuk mengevaluasi dan menetapkan batasan untuk model bahasa khusus AI.

RagaAI Meluncurkan Hub LLM Sumber Terbuka untuk Memudahkan Evaluasi & Keamanan Model Bahasa

Platform pengujian AI RagaAI baru-baru ini mengumumkan peluncuran “Pusat LLM RagaAI,” sebuah platform sumber terbuka dan siap untuk perusahaan yang dirancang untuk mengevaluasi dan menetapkan batasan bagi Model Bahasa Besar (LLM). Dengan lebih dari 100 metrik yang dibuat dengan cermat, platform ini bertujuan untuk mencegah kegagalan besar dalam aplikasi LLM dan Retrieval Augmented Generation (RAG).

RagaAI LLM Hub menawarkan kepada pengembang dan organisasi perangkat yang kuat untuk menilai dan membandingkan LLM secara efektif, yang mencakup aspek-aspek penting seperti Relevansi & Pemahaman, Kualitas Konten, Halusinasi, Keamanan & Bias, Relevansi Konteks, Pagar Pembatas dan Pemindaian Kerentanan. Selain itu, ia menyediakan serangkaian Tes Berbasis Metrik untuk analisis kuantitatif.

“Evaluasi holistik terhadap LLM merupakan persyaratan utama dalam dunia pembangunan LLM saat ini, karena para ilmuwan data dan perusahaan mencari tahu teknologi dan tumpukan apa yang cocok untuk mereka. Mendiagnosis suatu masalah memerlukan identifikasi sumber masalah secara cermat, dan mengingat ratusan kemungkinan akar permasalahan, dibutuhkan ratusan metrik untuk menentukan akar permasalahan tersebut,” Gaurav Agarwal, kata pendiri RagaAI MPost.

“Kemampuan RagaAI LLM Hub untuk pengujian komprehensif menambah nilai signifikan pada alur kerja pengembang, menghemat waktu penting dengan menghilangkan analisis ad hoc dan mempercepat pengembangan LLM hingga 3x.”  

Dirancang untuk mengatasi masalah di seluruh siklus hidup LLM, mulai dari pembuktian konsep hingga aplikasi produksi, RagaAI LLM Hub mengidentifikasi masalah mendasar dalam aplikasi LLM dan memfasilitasi penyelesaiannya pada sumbernya, merevolusi pendekatan untuk memastikan keandalan dan kepercayaan.

RagaAI menegaskan LLM Hub-nya memberdayakan kemampuan ini melalui serangkaian pengujian yang mencakup berbagai aspek pengambilan keputusan:

  • Anjuran: Ini mengulangi dan mengidentifikasi templat cepat yang optimal sambil membangun pagar pembatas untuk mengurangi serangan musuh.
  • Manajemen Konteks untuk RAG: Membantu pengguna menemukan keseimbangan optimal antara kinerja LLM dan biaya/latensi saat beroperasi dalam skala besar.
  • Pembuatan Respons: Ini menggunakan metrik untuk mengidentifikasi halusinasi dalam respons LLM dan menetapkan pagar pembatas untuk mencegah bias, kebocoran PII, dan potensi masalah lainnya.
Sumber: RagaAI

Mengurangi Halusinasi dan Bias AI Melalui Diagnosis LLM

RagaAI LLM Hub menemukan aplikasi di berbagai industri, termasuk e-commerce, keuangan, pemasaran, hukum dan layanan kesehatan, mendukung pengembang dan perusahaan dalam tugas-tugas seperti chatbots, pembuatan konten, ringkasan teks, dan pembuatan kode sumber.

Selain evaluasi, RagaAI LLM Hub juga membantu menetapkan batasan untuk memastikan privasi data dan kepatuhan hukum, mendorong etika dan AI yang bertanggung jawab praktik, khususnya di sektor-sektor sensitif seperti keuangan, kesehatan, dan hukum.

“Salah satu pelanggan kami di bidang e-niaga menggunakan LLM untuk chatbot untuk dukungan pelanggan, dan chatbot tersebut memberikan jawaban yang salah. Dengan menggunakan RagaAI, masalah ini berhasil dideteksi dan diselesaikan,” kata Gaurav Agarwal dari RagaAI MPost. “Dalam asuransi kesehatan, informasi pribadi pasien penting untuk dijaga. Di salah satu pelanggan kami, beberapa informasi pribadi penting dibagikan kepada pihak ketiga — masalah privasi data yang sangat besar. Dengan menggunakan pagar pembatas RagaAI LLM Hub, masalah ini dan masalah serupa lainnya terdeteksi secara real-time dan dicegah agar tidak terjadi.”

Gaurav Agarwal, pendiri RagaAI

Selain itu, hal ini bertujuan untuk memitigasi risiko reputasi dengan mematuhi norma dan nilai-nilai masyarakat.

“RagaAI membantu dalam menetapkan batasan seperti deteksi Informasi Identifikasi Pribadi (PII) dalam respons LLM. Hal ini memastikan tidak ada data pribadi dari dokumen internal yang dibocorkan oleh aplikasi LLM dan sangat penting bagi AI yang Bertanggung Jawab,” jelas Gaurav Agarwal. “Hal ini dan batasan lainnya seperti memastikan tanggapan yang tidak memihak dan adil, tidak mengomentari pesaing, dan menghapus Informasi Material Non Publik (MNPI) sangat penting bagi perusahaan karena mereka berupaya menghindari kerugian sosial dan reputasi.”

Peluncuran RagaAI LLM Hub mengikuti kesuksesan $ 4.7 juta dalam putaran pendanaan awal pada Januari 2024 yang dipimpin oleh pi Ventures, untuk memperluasnya penelitian AI, pengembangan dan basis klien di seluruh AS dan Eropa.

“Tujuan kami adalah menyediakan teknologi terbaik untuk menjadikan LLM dapat dipercaya dan diandalkan. Perusahaan ini berinvestasi secara signifikan untuk membangun teknologi utama guna mengatasi aspek jaminan kualitas LLM. Menjadikan teknologi ini sebagai sumber terbuka adalah upaya kami untuk menjadikannya tersedia bagi semua orang agar komunitas pengembang dapat membangun solusi terbaik yang tersedia,” kata Gaurav Agarwal.

Penolakan tanggung jawab

Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.

Tentang Penulis

Victor adalah Editor/Penulis Pelaksana Teknologi di Metaverse Post dan mencakup kecerdasan buatan, kripto, ilmu data, metaverse, dan keamanan siber dalam ranah perusahaan. Dia memiliki pengalaman media dan AI selama setengah dekade bekerja di outlet media terkenal seperti VentureBeat, DatatechVibe, dan Majalah Analytics India. Menjadi Mentor Media di universitas bergengsi termasuk Oxford dan USC dan dengan gelar Master di bidang ilmu data dan analitik, Victor sangat berkomitmen untuk terus mengikuti tren yang sedang berkembang. Dia menawarkan kepada pembaca narasi terbaru dan paling mendalam dari Tech and Web3 pemandangan.

lebih artikel
Victor Dey
Victor Dey

Victor adalah Editor/Penulis Pelaksana Teknologi di Metaverse Post dan mencakup kecerdasan buatan, kripto, ilmu data, metaverse, dan keamanan siber dalam ranah perusahaan. Dia memiliki pengalaman media dan AI selama setengah dekade bekerja di outlet media terkenal seperti VentureBeat, DatatechVibe, dan Majalah Analytics India. Menjadi Mentor Media di universitas bergengsi termasuk Oxford dan USC dan dengan gelar Master di bidang ilmu data dan analitik, Victor sangat berkomitmen untuk terus mengikuti tren yang sedang berkembang. Dia menawarkan kepada pembaca narasi terbaru dan paling mendalam dari Tech and Web3 pemandangan.

Dari Ripple hingga DAO Hijau Besar: Bagaimana Proyek Mata Uang Kripto Berkontribusi pada Amal

Mari kita jelajahi inisiatif yang memanfaatkan potensi mata uang digital untuk tujuan amal.

Tahu lebih banyak

AlphaFold 3, Med-Gemini, dan lainnya: Cara AI Mengubah Layanan Kesehatan pada tahun 2024

AI bermanifestasi dalam berbagai cara dalam layanan kesehatan, mulai dari mengungkap korelasi genetik baru hingga memberdayakan sistem bedah robotik ...

Tahu lebih banyak
Bergabunglah dengan Komunitas Teknologi Inovatif Kami
Baca Selengkapnya
Baca lebih lanjut
10 Alat AI Gratis Teratas untuk Pembuatan Konten, Pengeditan Video, dan Lainnya
AI Wiki intisari Pendidikan Gaya Hidup Perangkat lunak Teknologi
10 Alat AI Gratis Teratas untuk Pembuatan Konten, Pengeditan Video, dan Lainnya
14 Mei 2024
Komisi Sekuritas Hong Kong Memperingatkan Penipuan Deepfake yang Menargetkan Industri Kripto: Implikasinya bagi Keamanan Investor
Gaya Hidup Security Wiki Perangkat lunak Cerita dan Ulasan Teknologi
Komisi Sekuritas Hong Kong Memperingatkan Penipuan Deepfake yang Menargetkan Industri Kripto: Implikasinya bagi Keamanan Investor
14 Mei 2024
Ripple Dan Evmos Berkolaborasi Dalam Mengembangkan XRP Ledger EVM Sidechain Dengan Teknologi EvmOS
Bisnis Laporan berita Teknologi
Ripple Dan Evmos Berkolaborasi Dalam Mengembangkan XRP Ledger EVM Sidechain Dengan Teknologi EvmOS
14 Mei 2024
5ireChain Memulai 'Testnet Thunder: GA' yang Berinsentif Untuk Pengujian Stres Jaringan, Mengundang Pengguna Untuk Berpartisipasi Airdrop Hadiah
Laporan berita Teknologi
5ireChain Memulai 'Testnet Thunder: GA' yang Berinsentif Untuk Pengujian Stres Jaringan, Mengundang Pengguna Untuk Berpartisipasi Airdrop Hadiah
14 Mei 2024