Databricks menerbitkan Dolly 2.0, 12B Chat-LLM open-source pertama yang tersedia secara komersial
Singkatnya
Databricks mengumumkan peluncuran Dolly 2.0 sebagai 12B Chat-LLM open-source pertama yang tersedia secara komersial, memungkinkan perusahaan untuk membuat model bahasa yang kuat tanpa berinvestasi dalam cluster GPU yang mahal.
Databrick punya mengumumkan peluncuran Dolly 2.0 sebagai 12B Chat-LLM sumber terbuka pertama yang tersedia secara komersial. Dolly adalah terobosan besar untuk industri pembelajaran mesin, yang memungkinkan perusahaan membuat model bahasa yang kuat—seperti LLM autoregresif dengan dukungan dialog — tanpa harus berinvestasi dalam klaster GPU yang mahal.
Baca lebih lanjut: Cara Menggunakan ChatGPT (GPT-4) Gratis Selamanya |
Untuk mendapatkan model bahasa sumber terbuka, Databricks memerlukan kumpulan data yang besar dan berkualitas tinggi. Setelah awalnya mempertimbangkan Alpaca GPT-3 kumpulan data dan kumpulan data sumber terbuka lainnya yang tidak memungkinkan untuk penggunaan komersial, mereka memutuskan untuk membuat kumpulan data berkualitas tinggi mereka sendiri. Untuk melakukan ini, mereka mempekerjakan 5,000 orang dan meminta mereka menulis beberapa contoh yang akan digunakan untuk melatih LLM autoregresif yang mampu melanjutkan teks dan tidak melakukan dialog. Dengan bantuan insentif yang besar, seperti bonus untuk menulis contoh terbaik, mereka mampu mengumpulkan hasil yang mengesankan 15,000 kumpulan data sampel.
Databricks mengambil langkah berikutnya dan menggabungkan EleutherAI Pythia-12B model bahasa dengan lisensi MIT, dan melatihnya kembali pada kumpulan data mereka sendiri, menghasilkan Dolly 2.0. Dolly 2.0 telah dirilis di bawah lisensi MIT, bersama dengan kode yang menyertainya. Dengan peluncuran Dolly 2.0, industri pembelajaran mesin sekarang memiliki alat yang ampuh untuk membuat model bahasa yang kuat dengan cara yang hemat biaya. Ini dapat dimanfaatkan oleh perusahaan dan individu yang ingin membuat aplikasi canggih yang dapat memahami dan memproses bahasa yang rumit.
Secara keseluruhan, peluncuran boneka 2.0 sebagai 12B Chat-LLM open-source pertama yang tersedia secara komersial adalah tonggak penting bagi industri pembelajaran mesin. Dengan memanfaatkan lisensi MIT dan membuat kumpulan datanya sendiri yang berkualitas tinggi, Databricks telah membuat model bahasa yang kuat dapat diakses oleh perusahaan dan individu. Dolly 2.0 berdiri untuk merevolusi industri dan merupakan langkah maju yang besar untuk pembelajaran mesin.
Pengguna sekarang menunggu pengembang untuk mengukur Dolly dalam 4 bit dan mempercepatnya untuk berjalan di CPU, serta tanggapan dari OpenAssistant, yang diharapkan akan menyediakan model mereka dalam beberapa hari ke depan.
- NTIA meminta komentar publik tentang kemungkinan peraturan itu mengatur sistem AI 'like' ChatGPT untuk membantu pemerintahan Biden memastikan bahwa mereka berfungsi seperti yang dijanjikan. NTIA mengeluarkan pernyataan mengenai pembuatan peraturan akuntabilitas AI, yang dapat mencegah kesalahan di masa depan dan meminimalkan risiko dari ancaman hipotetis.
Baca lebih lanjut tentang AI:
Penolakan tanggung jawab
Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.
Tentang Penulis
Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah.
lebih artikelDamir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah.