Novinky Technika
13. dubna 2023

Databricks vydává Dolly 2.0, první komerčně dostupný open-source 12B Chat-LLM

Stručně

Databricks oznámila spuštění Dolly 2.0 jako prvního komerčně dostupného open-source 12B Chat-LLM, který společnostem umožňuje vytvářet výkonné jazykové modely bez investic do drahých GPU clusterů.

Databricks má oznámila, spuštění Dolly 2.0 jako první komerčně dostupné open-source 12B Chat-LLM. Dolly je velkým průlomem pro průmysl strojového učení, který společnostem umožňuje vytvářet výkonné jazykové modely – jako jsou autoregresivní LLM s podporou dialogu – bez nutnosti investovat do drahých GPU clusterů.

Čtěte více: Jak používat ChatGPT (GPT-4) navždy zdarma

Aby Databricks získali svůj open-source jazykový model, potřebovali velkou a vysoce kvalitní datovou sadu. Po počátečním zvažování Alpaky GPT-3 dataset a další open-source datasety, které neumožňují komerční využití, se rozhodli vybudovat vlastní vysoce kvalitní dataset. Za tímto účelem zaměstnávali 5,000 XNUMX lidí a požádali je, aby napsali několik příkladů, které by posloužily k výcviku autoregresivního LLM schopného jednoduše pokračovat v textu a nevést dialog. S pomocí skvělých pobídek, jako jsou bonusy za psaní nejlepších příkladů, dokázali sestavit působivé 15,000 XNUMX ukázkových datových souborů.

Databricks udělal další krok a začlenil EleutherAI's Pythia-12B jazykový model s licencí MIT a přeškolili jej na vlastní datovou sadu, což vedlo k Dolly 2.0. Dolly 2.0 byla vydána pod licencí MIT spolu s doprovodným kódem. Se spuštěním Dolly 2.0 má nyní průmysl strojového učení výkonný nástroj pro vytváření robustních jazykových modelů nákladově efektivním způsobem. Toho mohou využít společnosti i jednotlivci, kteří chtějí vytvářet výkonné aplikace, které dokážou porozumět složitému jazyku a zpracovat jej.

Celkově vzato, spuštění Dolly 2.0 jako první komerčně dostupný open-source 12B Chat-LLM je významným milníkem pro průmysl strojového učení. Využitím licence MIT a vytvořením vlastní vysoce kvalitní datové sady Databricks zpřístupnila výkonné jazykové modely společnostem i jednotlivcům. Dolly 2.0 znamená revoluci v tomto odvětví a je velkým krokem vpřed pro strojové učení.

Uživatelé nyní čekají, až vývojáři kvantují Dolly ve 4 bitech a zrychlí jej běh na CPU, stejně jako odpověď od OpenAssistant, od kterého se očekává, že jejich model poskytne v nejbližších dnech.

  • NTIA žádá veřejnost o vyjádření k případným regulacím, které regulovat systémy AI jako ChatGPT pomoci Bidenově administrativě zajistit, aby fungovaly tak, jak bylo slíbeno. NTIA vydala prohlášení týkající se tvorby pravidel odpovědnosti AI, která by mohla zabránit budoucím nehodám a minimalizovat rizika vyplývající z hypotetických hrozeb.

Přečtěte si více o AI:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Další články
Damir Yalalov
Damir Yalalov

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Institucionální apetit roste směrem k bitcoinovým ETF uprostřed volatility

Zveřejnění prostřednictvím podání 13F odhaluje, že pozoruhodní institucionální investoři fušují do bitcoinových ETF, což podtrhuje rostoucí akceptaci...

Vědět více

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Injective spojuje síly s AltLayer, aby přineslo zabezpečení při opětovném skládání do inEVM
Business Novinky Technika
Injective spojuje síly s AltLayer, aby přineslo zabezpečení při opětovném skládání do inEVM
3
Masa se spojila s Tellerem, aby zavedla MASA Půjčovací fond, umožní USDC půjčování na základně
Trhy Novinky Technika
Masa se spojila s Tellerem, aby zavedla MASA Půjčovací fond, umožní USDC půjčování na základně
3
Velodrome spouští v nadcházejících týdnech beta verzi Superchain a rozšiřuje se o blockchainy OP Stack Layer 2
Trhy Novinky Technika
Velodrome spouští v nadcházejících týdnech beta verzi Superchain a rozšiřuje se o blockchainy OP Stack Layer 2
3
CARV oznamuje partnerství se společností Aethir za účelem decentralizace její datové vrstvy a distribuce odměn
Business Novinky Technika
CARV oznamuje partnerství se společností Aethir za účelem decentralizace její datové vrstvy a distribuce odměn
3
CRYPTOMERIA LABS PTE. LTD.