Laporan Berita Teknologi
April 13, 2023

Databricks menerbitkan Dolly 2.0, 12B Chat-LLM sumber terbuka pertama yang tersedia secara komersial

Secara ringkas

Databricks mengumumkan pelancaran Dolly 2.0 sebagai sumber terbuka 12B Chat-LLM pertama yang tersedia secara komersial, membolehkan syarikat mencipta model bahasa yang berkuasa tanpa melabur dalam kelompok GPU yang mahal.

Databricks mempunyai mengumumkan pelancaran Dolly 2.0 sebagai 12B Chat-LLM sumber terbuka pertama yang tersedia secara komersial. Dolly ialah kejayaan besar untuk industri pembelajaran mesin, membolehkan syarikat mencipta model bahasa yang berkuasa—seperti LLM autoregresif dengan sokongan dialog — tanpa perlu melabur dalam kelompok GPU yang mahal.

Baca lebih lanjut: Bagaimana untuk Menggunakan ChatGPT (GPT-4) secara Percuma Selamanya

Untuk mendapatkan model bahasa sumber terbuka mereka, Databricks memerlukan set data yang besar dan berkualiti tinggi. Selepas pada mulanya mempertimbangkan Alpaca GPT-3 set data dan set data sumber terbuka lain yang tidak membenarkan penggunaan komersil, mereka memutuskan untuk membina set data berkualiti tinggi mereka sendiri. Untuk melakukan ini, mereka menggaji 5,000 orang dan meminta mereka menulis beberapa contoh yang akan digunakan untuk melatih LLM autoregresif yang mampu hanya meneruskan teks dan tidak menjalankan dialog. Dengan bantuan insentif yang hebat, seperti bonus untuk menulis contoh terbaik, mereka dapat mengumpulkan 15,000 sampel set data.

Databricks mengambil langkah seterusnya dan menggabungkan EleutherAI Pythia-12B model bahasa dengan lesen MIT, dan melatihnya semula pada set data mereka sendiri, menghasilkan Dolly 2.0. Dolly 2.0 telah dikeluarkan di bawah lesen MIT, bersama dengan kod yang disertakan. Dengan pelancaran Dolly 2.0, industri pembelajaran mesin kini mempunyai alat yang berkuasa untuk mencipta model bahasa yang mantap dengan cara yang menjimatkan kos. Ini boleh digunakan oleh syarikat dan individu yang sama-sama ingin mencipta aplikasi berkuasa yang boleh memahami dan memproses bahasa yang kompleks.

Secara keseluruhannya, pelancaran dolly 2.0 sebagai sumber terbuka pertama yang tersedia secara komersial 12B Chat-LLM merupakan peristiwa penting untuk industri pembelajaran mesin. Dengan memanfaatkan lesen MIT dan mencipta set data berkualiti tingginya sendiri, Databricks telah menjadikan model bahasa yang berkuasa boleh diakses oleh syarikat dan individu. Dolly 2.0 berdiri untuk merevolusikan industri dan merupakan langkah besar ke hadapan untuk pembelajaran mesin.

Pengguna kini sedang menunggu pembangun untuk mengkuantifikasikan Dolly dalam 4 bit dan mempercepatkannya untuk dijalankan pada CPU, serta respons daripada OpenAssistant, yang dijangka menyediakan model mereka dalam beberapa hari akan datang.

  • NTIA meminta ulasan orang ramai tentang kemungkinan peraturan itu mengawal selia sistem AI seperti ChatGPT untuk membantu pentadbiran Biden memastikan mereka berfungsi seperti yang dijanjikan. NTIA mengeluarkan kenyataan mengenai pembuatan peraturan akauntabiliti AI, yang boleh menghalang kemalangan masa depan dan meminimumkan risiko daripada ancaman hipotesis.

Baca lebih lanjut mengenai AI:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

lebih banyak artikel
Damir Yalalov
Damir Yalalov

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

Selera Institusi Berkembang Terhadap Bitcoin ETF Di Tengah-tengah Kemeruapan

Pendedahan melalui pemfailan 13F mendedahkan pelabur institusi terkenal yang berkecimpung dalam Bitcoin ETF, menekankan penerimaan yang semakin meningkat terhadap ...

Mengetahui lebih lanjut

Hari Penghukuman Tiba: Nasib CZ Bergantung Seimbang apabila Mahkamah AS Mempertimbangkan Rayuan DOJ

Changpeng Zhao bersedia untuk menghadapi hukuman di mahkamah AS di Seattle hari ini.

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Untuk Lebih Lanjut
Baca lagi
Injektif Menyertai Pasukan Dengan AltLayer Untuk Membawa Keselamatan Restaking Kepada inEVM
Perniagaan Laporan Berita Teknologi
Injektif Menyertai Pasukan Dengan AltLayer Untuk Membawa Keselamatan Restaking Kepada inEVM
Semoga 3, 2024
Masa Bekerjasama Dengan Juruwang Untuk Memperkenalkan Kumpulan Pinjaman MASA, Membolehkan Pinjaman USDC Di Pangkalan
pasaran Laporan Berita Teknologi
Masa Bekerjasama Dengan Juruwang Untuk Memperkenalkan Kumpulan Pinjaman MASA, Membolehkan Pinjaman USDC Di Pangkalan
Semoga 3, 2024
Velodrome Melancarkan Versi Beta Superchain Dalam Minggu Akan Datang Dan Berkembang Merentasi OP Stack Layer 2 Blockchains
pasaran Laporan Berita Teknologi
Velodrome Melancarkan Versi Beta Superchain Dalam Minggu Akan Datang Dan Berkembang Merentasi OP Stack Layer 2 Blockchains
Semoga 3, 2024
CARV Mengumumkan Perkongsian Dengan Aethir Untuk Memusnahkan Lapisan Datanya Dan Mengedarkan Ganjaran
Perniagaan Laporan Berita Teknologi
CARV Mengumumkan Perkongsian Dengan Aethir Untuk Memusnahkan Lapisan Datanya Dan Mengedarkan Ganjaran
Semoga 3, 2024