Aprill 13, 2023

Databricks avaldab Dolly 2.0, esimese kaubanduslikult saadaoleva avatud lähtekoodiga 12B Chat-LLM

Avaldatud: 13. aprill 2023 kell 11:15 Värskendatud: 13. aprill 2023 kell 11:15

Põgusalt

Databricks teatas Dolly 2.0 turuletoomisest kui esimesest kaubanduslikult saadaolevast avatud lähtekoodiga 12B Chat-LLM-ist, mis võimaldab ettevõtetel luua võimsaid keelemudeleid ilma kallitesse GPU-klastritesse investeerimata.

Databricksil on teatas Dolly 2.0 turuletoomine kui esimene kaubanduslikult saadaolev avatud lähtekoodiga 12B Chat-LLM. Dolly on suur läbimurre masinõppetööstuses, võimaldades ettevõtetel luua võimsaid keelemudeleid (nt dialoogitoega autoregressiivseid LLM-e), ilma et nad peaksid investeerima kallitesse GPU-klastritesse.

Loe rohkem: Kuidas kasutada ChatGPT (GPT-4) igavesti tasuta

Avatud lähtekoodiga keelemudeli saamiseks vajas Databricks suurt ja kvaliteetset andmekogumit. Pärast algselt Alpaka kaalumist GPT-3 andmestikku ja muid avatud lähtekoodiga andmekogumiid, mis ei võimalda ärilist kasutamist, otsustasid nad luua oma kvaliteetse andmestiku. Selleks võtsid nad tööle 5,000 inimest ja palusid neil kirjutada mitu näidet, mida kasutataks autoregressiivse LLM-i koolitamiseks, mis on võimeline lihtsalt teksti jätkama ja mitte dialoogi pidama. Suurepäraste stiimulite abil, nagu boonused parimate näidete kirjutamise eest, suutsid nad kokku panna muljetavaldava 15,000 XNUMX näidisandmestikku.

Databricks astus järgmise sammu ja ühendas EleutherAI's Pythia-12B MIT-litsentsiga keelemudelit ja õpetasid selle ümber oma andmestikule, mille tulemuseks oli Dolly 2.0. Dolly 2.0 on koos kaasneva koodiga välja antud MIT-i litsentsi alusel. Dolly 2.0 turuletoomisega on masinõppetööstusel nüüd võimas tööriist jõuliste keelemudelite loomiseks kulutõhusal viisil. Seda saavad kasutada nii ettevõtted kui ka üksikisikud, kes soovivad luua võimsaid rakendusi, mis suudavad mõista ja töödelda keerulist keelt.

Üldiselt käivitamine Dolly 2.0 kui esimene kaubanduslikult saadaolev avatud lähtekoodiga 12B Chat-LLM on masinõppetööstuse jaoks oluline verstapost. Kasutades ära MIT-i litsentsi ja luues oma kvaliteetse andmestiku, on Databricks muutnud võimsad keelemudelid kättesaadavaks nii ettevõtetele kui ka üksikisikutele. Dolly 2.0 tähendab tööstuse revolutsiooni ja on suur samm edasi masinõppes.

Kasutajad ootavad nüüd, et arendajad kvantiseeriksid Dolly 4 bitis ja kiirendaksid seda CPU-s töötama, samuti vastust OpenAssistantilt, mis peaks nende mudeli lähipäevadel esitama.

NTIA palub avalikke kommentaare võimalike regulatsioonide kohta, mis reguleerida AI süsteeme nagu ChatGPT aidata Bideni administratsioonil tagada, et need toimiksid nagu lubatud. NTIA avaldas avalduse tehisintellekti vastutuse reeglite kehtestamise kohta, mis võiks ära hoida tulevasi äpardusi ja minimeerida hüpoteetiliste ohtude riske.

Loe AI kohta lähemalt:

Sildid:

Kaebused

Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.

Umbes Autor

Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks.

Veel artikleid

Damir Jalalov