Novinky Technika
31

Guanaco se ukazuje jako potenciální otevřený zdroj ChatGPT Konkurent

Stručně

Guanaco, chatbot s otevřeným zdrojovým kódem vyvinutý výzkumníky z Washingtonské univerzity, chce konkurovat ChatGPT a zároveň vyžaduje méně času a peněz na školení.

Nová studie však zpochybnila účinnost modelů, jako je Alpaca.

Odhalili to vědci z Washingtonské univerzity guanako, open-source chatbot, jehož cílem je konkurovat výkonu ChatGPT a zároveň výrazně zkracuje čas a zdroje potřebné pro školení. Pojmenován po jihoamerickém příbuzném llamas, Guanaco je postaveno na LLaMA jazykový model a zahrnuje novou metodu jemného ladění zvanou QLoRA.

Guanaco se ukazuje jako potenciální otevřený zdroj ChatGPT Konkurent
Metaverse Post (mpost.io)

Tvůrci Guanaco tvrdí, že dosahuje srovnatelného výkonu jako ChatGPT ale dá se trénovat za jediný den. Tento pozoruhodný výkon umožňuje QLoRA, technika jemného ladění jazykového modelu, která podstatně snižuje množství paměti GPU potřebné pro trénink. Zatímco ChatGPT vyžaduje neuvěřitelných 780 GB GPU paměti pro model s 65 miliardami parametrů vyžaduje nejjednodušší verze Guanaca pouze 5 GB.

S těmito působivými nárůsty efektivity Guanaco a podobné modely s otevřeným zdrojovým kódem zpochybňují představu, že je pro ně nezbytný nákladný výcvik nejmodernější jazykové modely. Vznik Guanaka, Alpaca, a jiné modely tento vlak za zlomek ceny vedl ke spekulacím o budoucnosti drahých modelů, jako je GPT.

Ne všichni však s tímto optimistickým pohledem na open-source modely souhlasí. Nedávná studie provedená Kalifornskou univerzitou zpochybnil o schopnostech modelů, jako jsou alpaky, a vyvolalo otázky o jejich skutečném potenciálu. Zpočátku vědci dospěli k podobnému závěru jako tvůrci Guanaca: když jsou správně vyškolené, mohou open-source modely soupeřit GPT ve schopnostech. Další testy odhalily významné omezení. Tyto modely „Dolly“, jak se jim někdy říká, jsou zběhlé v napodobování řešení problémů, se kterými se setkali během tréninku. Mají však problémy s tím, aby dobře fungovaly v úkolech, kterým nebyly výslovně vystaveny, a zaostávají za pokročilejšími modely.

Toto odhalení naznačuje, že miliony investované do školení GPT a podobné modely možná nebyly marné. Zatímco Guanaco a jeho protějšky vykazují slibné výsledky, stále existují oblasti, kde vynikají sofistikovanější modely. Stojí za zmínku, že výzkum prováděný Kalifornskou univerzitou zpochybňuje převládající představu, že modely s otevřeným zdrojovým kódem mohou plně nahradit drahé modely, jako jsou GPT.

Jak se bude oblast zpracování přirozeného jazyka vyvíjet, bude zajímavé sledovat, jak se Guanaco a další open-source modely chovají proti zavedeným benchmarky jako např ChatGPT. Vysoká míra inovací a nepřetržitý výzkum bezesporu ovlivní budoucnost jazykových modelů a určí, které modely se stanou volbou pro konkrétní aplikace.

  • Dolly 2.0, první komerčně dostupný open-source 12B Chat-LLM, bylo oznámeno od Databricks. To je významný pokrok pro průmysl strojového učení, který umožňuje podnikům vytvářet efektivní jazykové modely bez investic do nákladných GPU clusterů. Databricks zaměstnával 5,000 12 zaměstnanců, aby vytvořili svůj jazykový model s otevřeným zdrojovým kódem, který zahrnoval jazykový model Pythia-2.0B od EleutherAI pod licencí MIT. Dolly 2.0, stejně jako související kód, je k dispozici pod licencí MIT. Dolly XNUMX má potenciál změnit průmysl a je významným krokem vpřed pro strojové učení.

Přečtěte si více o AI:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Další články
Damir Yalalov
Damir Yalalov

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Institucionální apetit roste směrem k bitcoinovým ETF uprostřed volatility

Zveřejnění prostřednictvím podání 13F odhaluje, že pozoruhodní institucionální investoři fušují do bitcoinových ETF, což podtrhuje rostoucí akceptaci...

Vědět více

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Společnost Nexo zahajuje „hon“, aby odměnila uživatele 12 miliony dolarů v tokenech NEXO za zapojení do jejího ekosystému
Trhy Novinky Technika
Společnost Nexo zahajuje „hon“, aby odměnila uživatele 12 miliony dolarů v tokenech NEXO za zapojení do jejího ekosystému
8
Revolut X Exchange Crypto Traders s nulovými poplatky za tvůrce a pokročilou analýzou
Trhy Vývoj Příběhy a recenze Technika
Revolut X Exchange Crypto Traders s nulovými poplatky za tvůrce a pokročilou analýzou
8
Crypto Trading Platform BitMEX uvádí na trh opční obchodování s 0 poplatky a hotovostními pobídkami
Business Trhy Novinky
Crypto Trading Platform BitMEX uvádí na trh opční obchodování s 0 poplatky a hotovostními pobídkami
8
Lisk oficiálně přechází na Ethereum Layer 2 a odhaluje Core v4.0.6
Novinky Technika
Lisk oficiálně přechází na Ethereum Layer 2 a odhaluje Core v4.0.6
8
CRYPTOMERIA LABS PTE. LTD.