Databricks udgiver Dolly 2.0, den første kommercielt tilgængelige open source 12B Chat-LLM
Kort sagt
Databricks annoncerede lanceringen af Dolly 2.0 som den første kommercielt tilgængelige open source 12B Chat-LLM, der giver virksomheder mulighed for at skabe kraftfulde sprogmodeller uden at investere i dyre GPU-klynger.
Databricks har annoncerede lanceringen af Dolly 2.0 som den første kommercielt tilgængelige open source 12B Chat-LLM. Dolly er et stort gennembrud for maskinlæringsindustrien, der giver virksomheder mulighed for at skabe kraftfulde sprogmodeller – såsom autoregressive LLM'er med dialogunderstøttelse – uden at skulle investere i dyre GPU-klynger.
For at få deres open source sprogmodel havde Databricks brug for et stort datasæt af høj kvalitet. Efter først at have overvejet Alpakkaen GPT-3 datasæt og andre open source-datasæt, der ikke tillader kommerciel brug, besluttede de at bygge deres eget datasæt af høj kvalitet. For at gøre dette beskæftigede de 5,000 mennesker og bad dem om at skrive flere eksempler, der ville blive brugt til at træne en autoregressiv LLM, der er i stand til blot at fortsætte teksten og ikke føre en dialog. Ved hjælp af store incitamenter, såsom bonusser for at skrive de bedste eksempler, var de i stand til at samle en imponerende 15,000 prøvedatasæt.
Databricks tog det næste skridt og inkorporerede EleutherAI's Pythia-12b sprogmodel med en MIT-licens, og genoplært den på deres eget datasæt, hvilket resulterede i Dolly 2.0. Dolly 2.0 er blevet udgivet under en MIT-licens sammen med den medfølgende kode. Med lanceringen af Dolly 2.0 har maskinlæringsindustrien nu et kraftfuldt værktøj til at skabe robuste sprogmodeller på en omkostningseffektiv måde. Dette kan bruges af både virksomheder og enkeltpersoner, der ønsker at skabe kraftfulde applikationer, der kan forstå og behandle komplekst sprog.
Samlet set lanceringen af dolly 2.0 som den første kommercielt tilgængelige open source er 12B Chat-LLM en væsentlig milepæl for maskinlæringsindustrien. Ved at udnytte MIT-licensen og skabe sit eget datasæt af høj kvalitet, har Databricks gjort kraftfulde sprogmodeller tilgængelige for både virksomheder og enkeltpersoner. Dolly 2.0 står til at revolutionere industrien og er et stort skridt fremad for maskinlæring.
Brugerne venter nu på, at udviklerne kvantiserer Dolly i 4 bit og fremskynder den til at køre på CPU'en, samt et svar fra OpenAssistant, som forventes at levere deres model i løbet af de næste par dage.
- NTIA beder om offentlige kommentarer til mulige regler, der regulere AI-systemer ligesom ChatGPT at hjælpe Biden-administrationen med at sikre, at de fungerer som lovet. NTIA udgav en erklæring om AI ansvarlighedsregler, som kunne forhindre fremtidige uheld og minimere risici fra hypotetiske trusler.
Læs mere om AI:
Ansvarsfraskrivelse
I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.
Om forfatteren
Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab.
Flere artiklerDamir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab.