Ulat sa Balita Teknolohiya
Abril 13, 2023

Ini-publish ng Databricks ang Dolly 2.0, ang unang available na komersyal na open-source na 12B Chat-LLM

Sa madaling sabi

Inanunsyo ng Databricks ang paglulunsad ng Dolly 2.0 bilang ang unang available na komersyal na open-source na 12B Chat-LLM, na nagpapahintulot sa mga kumpanya na lumikha ng mga mahuhusay na modelo ng wika nang hindi namumuhunan sa mga mamahaling kumpol ng GPU.

Mayroon ang Databricks anunsyado ang paglulunsad ng Dolly 2.0 bilang ang unang available na komersyal na open-source na 12B Chat-LLM. Ang Dolly ay isang malaking tagumpay para sa industriya ng machine learning, na nagbibigay-daan sa mga kumpanya na lumikha ng mga mahuhusay na modelo ng wika—gaya ng mga autoregressive LLM na may suporta sa dialogue — nang hindi kinakailangang mamuhunan sa mga mamahaling GPU cluster.

Magbasa nang higit pa: Paano Magagamit ChatGPT (GPT-4) para sa Libre Magpakailanman

Para makuha ang kanilang open-source na modelo ng wika, kailangan ng Databricks ng malaki at mataas na kalidad na dataset. Pagkatapos munang isaalang-alang ang Alpaca GPT-3 dataset at iba pang open-source na dataset na hindi pinapayagan para sa komersyal na paggamit, nagpasya silang bumuo ng sarili nilang dataset na may mataas na kalidad. Upang gawin ito, gumamit sila ng 5,000 katao at hiniling sa kanila na magsulat ng ilang mga halimbawa na gagamitin upang sanayin ang isang autoregressive na LLM na may kakayahang ipagpatuloy lamang ang teksto at hindi magsagawa ng diyalogo. Sa tulong ng mahusay na mga insentibo, tulad ng mga bonus para sa pagsusulat ng pinakamahusay na mga halimbawa, nakagawa sila ng isang kahanga-hangang 15,000 sample na dataset.

Kinuha ng Databricks ang susunod na hakbang at isinama ang EleutherAI's Pythia-12B modelo ng wika na may lisensya ng MIT, at muling sinanay ito sa sarili nilang dataset, na nagresulta sa Dolly 2.0. Ang Dolly 2.0 ay inilabas sa ilalim ng lisensya ng MIT, kasama ang kasamang code. Sa paglulunsad ng Dolly 2.0, ang industriya ng machine learning ay mayroon na ngayong isang makapangyarihang tool upang lumikha ng mga mahuhusay na modelo ng wika sa isang cost-effective na paraan. Magagamit ito ng mga kumpanya at indibidwal na parehong naghahanap upang lumikha ng makapangyarihang mga application na makakaunawa at makapagproseso ng kumplikadong wika.

Sa pangkalahatan, ang paglulunsad ng Dolly 2.0 bilang ang unang open-source na available sa komersyo, ang 12B Chat-LLM ay isang mahalagang milestone para sa industriya ng machine learning. Sa pamamagitan ng pagsasamantala sa lisensya ng MIT at paglikha ng sarili nitong mataas na kalidad na dataset, ginawa ng Databricks ang mga mahuhusay na modelo ng wika na naa-access sa mga kumpanya at indibidwal. Ang Dolly 2.0 ay naninindigan upang baguhin ang industriya at ito ay isang malaking hakbang pasulong para sa machine learning.

Ang mga gumagamit ay naghihintay na ngayon para sa mga developer na i-quantize ang Dolly sa 4 na bits at pabilisin ito upang tumakbo sa CPU, pati na rin ang tugon mula sa OpenAssistant, na inaasahang magbibigay ng kanilang modelo sa susunod na mga araw.

  • Ang NTIA ay humihingi ng pampublikong komento sa mga posibleng regulasyon na ayusin ang mga sistema ng AI gaya ng ChatGPT upang tulungan ang administrasyong Biden na matiyak na gumagana ang mga ito gaya ng ipinangako. Ang NTIA ay naglabas ng isang pahayag tungkol sa AI accountability rulemaking, na maaaring maiwasan ang mga mishap sa hinaharap at mabawasan ang mga panganib mula sa hypothetical na mga banta.

Magbasa pa tungkol sa AI:

Pagtanggi sa pananagutan

Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.

Tungkol sa Ang May-akda

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Mas marami pang artikulo
Damir Yalalov
Damir Yalalov

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Ang Institutional Appetite ay Lumalaki Patungo sa Bitcoin ETFs Sa gitna ng Volatility

Ang mga pagsisiwalat sa pamamagitan ng 13F filing ay nagpapakita ng mga kilalang institusyonal na mamumuhunan na nakikipag-ugnayan sa mga Bitcoin ETF, na binibigyang-diin ang lumalaking pagtanggap ng ...

Malaman Higit Pa

Dumating na ang Araw ng Pagsentensiya: Ang Kapalaran ni CZ ay Nagbabalanse habang Isinasaalang-alang ng Korte ng US ang Panawagan ng DOJ

Si Changpeng Zhao ay handang harapin ang sentensiya sa korte ng US sa Seattle ngayon.

Malaman Higit Pa
Sumali sa Aming Innovative Tech Community
Magbasa Pa
Magbasa nang higit pa
Pinagsama-sama ng Injective ang AltLayer Upang Magdala ng Restaking Security Sa inEVM
Negosyo Ulat sa Balita Teknolohiya
Pinagsama-sama ng Injective ang AltLayer Upang Magdala ng Restaking Security Sa inEVM
Mayo 3, 2024
Nakipagtulungan ang Masa Sa Teller Upang Ipakilala ang MASA Lending Pool, Pinapagana ang USDC Borrowing On Base
markets Ulat sa Balita Teknolohiya
Nakipagtulungan ang Masa Sa Teller Upang Ipakilala ang MASA Lending Pool, Pinapagana ang USDC Borrowing On Base
Mayo 3, 2024
Inilunsad ng Velodrome ang Superchain Beta na Bersyon Sa Mga Paparating na Linggo At Lumalawak sa OP Stack Layer 2 Blockchain
markets Ulat sa Balita Teknolohiya
Inilunsad ng Velodrome ang Superchain Beta na Bersyon Sa Mga Paparating na Linggo At Lumalawak sa OP Stack Layer 2 Blockchain
Mayo 3, 2024
Inanunsyo ng CARV ang Pakikipagsosyo Sa Aethir Upang I-desentralisa ang Layer ng Data Nito At Ipamahagi ang Mga Gantimpala
Negosyo Ulat sa Balita Teknolohiya
Inanunsyo ng CARV ang Pakikipagsosyo Sa Aethir Upang I-desentralisa ang Layer ng Data Nito At Ipamahagi ang Mga Gantimpala
Mayo 3, 2024
CRYPTOMERIA LABS PTE. LTD.