Databricks objavljuje Dolly 2.0, prvi komercijalno dostupan 12B Chat-LLM otvorenog koda
Ukratko
Databricks je najavio lansiranje Dolly 2.0 kao prvog komercijalno dostupnog 12B Chat-LLM-a otvorenog koda, koji tvrtkama omogućuje stvaranje moćnih jezičnih modela bez ulaganja u skupe GPU klastere.
Databricks ima najavio lansiranje Dolly 2.0 kao prvog komercijalno dostupnog 12B Chat-LLM-a otvorenog koda. Dolly je veliko otkriće za industriju strojnog učenja, omogućujući tvrtkama stvaranje moćnih jezičnih modela — poput autoregresivnih LLM-ova s podrškom za dijalog — bez potrebe za ulaganjem u skupe GPU klastere.
Pročitajte više: Kako koristiti ChatGPT (GPT-4) besplatno zauvijek |
Kako bi dobio svoj model jezika otvorenog koda, Databricks je trebao veliki skup podataka visoke kvalitete. Nakon prvotnog razmatranja Alpake GPT-3 skupa podataka i drugih skupova podataka otvorenog koda koji ne dopuštaju komercijalnu upotrebu, odlučili su izgraditi vlastiti skup podataka visoke kvalitete. Da bi to učinili, zaposlili su 5,000 ljudi i zamolili ih da napišu nekoliko primjera koji bi se koristili za obuku autoregresijskog LLM-a koji je sposoban jednostavno nastaviti tekst, a ne voditi dijalog. Uz pomoć velikih poticaja, kao što su bonusi za pisanje najboljih primjera, uspjeli su sastaviti impresivan Skup podataka od 15,000 XNUMX uzoraka.
Databricks je napravio sljedeći korak i uključio EleutherAI Pitija-12B jezični model s licencom MIT-a i ponovno ga uvježbali na vlastitom skupu podataka, što je rezultiralo Dolly 2.0. Dolly 2.0 objavljena je pod licencom MIT-a, zajedno s popratnim kodom. S lansiranjem Dolly 2.0, industrija strojnog učenja sada ima moćan alat za stvaranje robusnih jezičnih modela na troškovno učinkovit način. Ovo mogu koristiti podjednako tvrtke i pojedinci koji žele stvoriti snažne aplikacije koje mogu razumjeti i obraditi složen jezik.
Općenito, lansiranje Dolly 2.0 kao prvi komercijalno dostupan open-source 12B Chat-LLM značajna je prekretnica za industriju strojnog učenja. Iskorištavanjem prednosti licence MIT-a i stvaranjem vlastitog skupa podataka visoke kvalitete, Databricks je moćne jezične modele učinio dostupnima tvrtkama i pojedincima. Dolly 2.0 predstavlja revoluciju u industriji i veliki je korak naprijed za strojno učenje.
Korisnici sada čekaju da programeri kvantiziraju Dolly u 4 bita i ubrzaju ga da radi na CPU-u, kao i odgovor OpenAssistanta, koji bi trebao dati svoj model u sljedećih nekoliko dana.
- NTIA traži javne komentare o mogućim propisima koji regulirati AI sustave kao ChatGPT pomoći Bidenovoj administraciji da osigura da funkcioniraju kako je obećano. NTIA je objavila izjavu o donošenju pravila o odgovornosti za umjetnu inteligenciju, koja bi mogla spriječiti buduće nesreće i minimizirati rizike od hipotetskih prijetnji.
Pročitajte više o AI:
Izjava o odricanju od odgovornosti
U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.
O autoru
Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta.
Više članakaDamir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta.