Databricks menerbitkan Dolly 2.0, 12B Chat-LLM sumber terbuka pertama yang tersedia secara komersial
Secara ringkas
Databricks mengumumkan pelancaran Dolly 2.0 sebagai sumber terbuka 12B Chat-LLM pertama yang tersedia secara komersial, membolehkan syarikat mencipta model bahasa yang berkuasa tanpa melabur dalam kelompok GPU yang mahal.
Databricks mempunyai mengumumkan pelancaran Dolly 2.0 sebagai 12B Chat-LLM sumber terbuka pertama yang tersedia secara komersial. Dolly ialah kejayaan besar untuk industri pembelajaran mesin, membolehkan syarikat mencipta model bahasa yang berkuasa—seperti LLM autoregresif dengan sokongan dialog — tanpa perlu melabur dalam kelompok GPU yang mahal.
Baca lebih lanjut: Bagaimana untuk Menggunakan ChatGPT (GPT-4) secara Percuma Selamanya |
Untuk mendapatkan model bahasa sumber terbuka mereka, Databricks memerlukan set data yang besar dan berkualiti tinggi. Selepas pada mulanya mempertimbangkan Alpaca GPT-3 set data dan set data sumber terbuka lain yang tidak membenarkan penggunaan komersil, mereka memutuskan untuk membina set data berkualiti tinggi mereka sendiri. Untuk melakukan ini, mereka menggaji 5,000 orang dan meminta mereka menulis beberapa contoh yang akan digunakan untuk melatih LLM autoregresif yang mampu hanya meneruskan teks dan tidak menjalankan dialog. Dengan bantuan insentif yang hebat, seperti bonus untuk menulis contoh terbaik, mereka dapat mengumpulkan 15,000 sampel set data.
Databricks mengambil langkah seterusnya dan menggabungkan EleutherAI Pythia-12B model bahasa dengan lesen MIT, dan melatihnya semula pada set data mereka sendiri, menghasilkan Dolly 2.0. Dolly 2.0 telah dikeluarkan di bawah lesen MIT, bersama dengan kod yang disertakan. Dengan pelancaran Dolly 2.0, industri pembelajaran mesin kini mempunyai alat yang berkuasa untuk mencipta model bahasa yang mantap dengan cara yang menjimatkan kos. Ini boleh digunakan oleh syarikat dan individu yang sama-sama ingin mencipta aplikasi berkuasa yang boleh memahami dan memproses bahasa yang kompleks.
Secara keseluruhannya, pelancaran dolly 2.0 sebagai sumber terbuka pertama yang tersedia secara komersial 12B Chat-LLM merupakan peristiwa penting untuk industri pembelajaran mesin. Dengan memanfaatkan lesen MIT dan mencipta set data berkualiti tingginya sendiri, Databricks telah menjadikan model bahasa yang berkuasa boleh diakses oleh syarikat dan individu. Dolly 2.0 berdiri untuk merevolusikan industri dan merupakan langkah besar ke hadapan untuk pembelajaran mesin.
Pengguna kini sedang menunggu pembangun untuk mengkuantifikasikan Dolly dalam 4 bit dan mempercepatkannya untuk dijalankan pada CPU, serta respons daripada OpenAssistant, yang dijangka menyediakan model mereka dalam beberapa hari akan datang.
- NTIA meminta ulasan orang ramai tentang kemungkinan peraturan itu mengawal selia sistem AI seperti ChatGPT untuk membantu pentadbiran Biden memastikan mereka berfungsi seperti yang dijanjikan. NTIA mengeluarkan kenyataan mengenai pembuatan peraturan akauntabiliti AI, yang boleh menghalang kemalangan masa depan dan meminimumkan risiko daripada ancaman hipotesis.
Baca lebih lanjut mengenai AI:
Penafian
Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.
Tentang Pengarang
Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah.
lebih banyak artikelDamir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah.