Databricks publică Dolly 2.0, primul 12B Chat-LLM open-source disponibil comercial
Pe scurt
Databricks a anunțat lansarea Dolly 2.0 ca primul 12B Chat-LLM open-source disponibil comercial, permițând companiilor să creeze modele de limbaj puternice fără a investi în clustere GPU scumpe.
Databricks are a anunțat lansarea Dolly 2.0 ca primul 12B Chat-LLM open-source disponibil comercial. Dolly este o descoperire majoră pentru industria învățării automate, permițând companiilor să creeze modele de limbaj puternice, cum ar fi LLM-uri autoregresive cu suport pentru dialog, fără a fi nevoie să investească în clustere scumpe de GPU.
Citeşte mai mult: Instrucțiuni de utilizare ChatGPT (GPT-4) gratuit pentru totdeauna |
Pentru a obține modelul de limbaj open-source, Databricks avea nevoie de un set de date mare, de înaltă calitate. După ce a luat în considerare inițial Alpaca GPT-3 setul de date și alte seturi de date open-source care nu permit utilizarea comercială, au decis să-și construiască propriul set de date de înaltă calitate. Pentru a face acest lucru, au angajat 5,000 de oameni și le-au cerut să scrie mai multe exemple care să fie folosite pentru a pregăti un LLM autoregresiv capabil să continue pur și simplu textul și să nu conducă un dialog. Cu ajutorul unor stimulente grozave, cum ar fi bonusuri pentru scrierea celor mai bune exemple, ei au reușit să adune un impresionant 15,000 de eșantion de set de date.
Databricks a făcut următorul pas și a încorporat EleutherAI Pythia-12B model de limbă cu o licență MIT și l-au reantrenat pe propriul set de date, rezultând Dolly 2.0. Dolly 2.0 a fost lansat sub o licență MIT, împreună cu codul însoțitor. Odată cu lansarea Dolly 2.0, industria învățării automate are acum un instrument puternic pentru a crea modele de limbaj robuste într-un mod rentabil. Acest lucru poate fi utilizat deopotrivă de companii și persoane fizice care caută să creeze aplicații puternice care să înțeleagă și să proceseze limbajul complex.
În general, lansarea Dolly 2.0 ca primul 12B Chat-LLM open-source disponibil comercial este o piatră de hotar semnificativă pentru industria învățării automate. Profitând de licența MIT și creându-și propriul set de date de înaltă calitate, Databricks a făcut ca modele lingvistice puternice să fie accesibile companiilor și persoanelor deopotrivă. Dolly 2.0 va revoluționa industria și reprezintă un pas major înainte pentru învățarea automată.
Utilizatorii așteaptă acum ca dezvoltatorii să cuantizeze Dolly în 4 biți și să-l accelereze pentru a rula pe procesor, precum și un răspuns de la OpenAssistant, care se așteaptă să-și ofere modelul în următoarele zile.
- NTIA solicită comentarii publice cu privire la posibilele reglementări care reglementează sistemele AI ca ChatGPT pentru a ajuta administrația Biden să se asigure că funcționează conform promisiunii. NTIA a lansat o declarație cu privire la elaborarea regulilor de responsabilitate AI, care ar putea preveni viitoare accidente și ar putea minimiza riscurile amenințărilor ipotetice.
Citiți mai multe despre AI:
Declinare a responsabilităţii
În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.
Despre autor
Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului.
Mai multe articoleDamir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului.