Meta představuje otevřený zdroj, který mění hru LLaMa-2-Chat s bezprecedentním výkonem
Stručně
Meta vydala LLaMa-2-chatové modely, velký průlom v open source AI.
Tyto modely s parametry 70B jsou srovnatelné s GPT-3.5 a překonávají referenční hodnoty.
Jemně vyladěné pomocí RLHF nabízejí personalizované ChatGPT ekvivalenty, metriky lidského hodnocení a schopnosti matematického řešení problémů.
Meta nedávno vydal sadu LLaMa-2-chatové modely v různých velikostech. Toto vydání od oddělení LLM GenAI vyvolalo v průmyslu rozruch.
LLaMa-2-Chat je skutečně pozoruhodný úspěch vytvořený talentovaným týmem v oddělení LLM společnosti GenAI. S impozantními parametry čítajícími 70 miliard je tento model srovnatelný a dokonce předčí vysoce uznávané GPT-3.5 na určitých měřítcích.
<strong>Highlights:</strong>
- Komerčně přátelský
- Předtrénováno na 2T tokenech
- Silné skóre MMLU (tj. silné uvažování)
- 4K kontext
- (Rozšiřitelné) RoPE vložky
- Výkon kódování je meh
- SFT/RLHF verze chatu
Skutečnost, že se LLaMa-2-Chat je první model své velikosti, který byl doladěn pomocí RLHF (Reinforcement Learning from Human Feedback), což jej činí ještě pozoruhodnějším. V bezprecedentním kroku Meta učinila tento model zcela zdarma pro komerční použití. Zájemci si mohou vyžádat odkaz ke stažení na jejich oficiálních stránkách.
Jedna z nejvýznamnějších výhod společnosti LLaMa-2-Chat je jeho potenciál vytvářet ChatGPT analogy bez nutnosti sdílení jakýchkoli dat OpenAI. To umožňuje vývojářům a výzkumníkům využít sílu modelu při zachování úplné kontroly nad svými daty. Můžeš download nový model zde.
VELKÉ AI NOVINKY!!!🔥Llama 2 právě vyšel! A Hádej co? Je plně open-source a může být použit pro komerční účely!!! Jsou podporovány parametry 7-70B.
— Aleksa Gordić 🍿🤖 (@gordic_aleksa) Července 18, 2023
Vydávají také vyladěné varianty optimalizované pro případy použití dialogu (LLaMA 2-Chat)!
Papír vypadá velmi podrobně – 76… pic.twitter.com/yZahl7Jzya
Pokud jde o metriky lidského hodnocení, LLaMa-2-Chat stojí rameno na rameni s ChatGPT-3.5 z hlediska kvality. Je pozoruhodné, že předvádí výjimečný výkon v matematických problémech a překonává ostatní modely v této oblasti.
- V únoru, Meta vydala LLaMA model, velký jazykový model navržený pro podporu výzkumníků AI. K dispozici v různých velikostech (parametry 7B, 13B, 33B a 65B), LLaMA umožňuje výzkumníci testovat nové přístupy a prozkoumat nové případy použití. Model je ideální pro dolaďovací úlohy a je postaven na velké sadě neoznačených dat. Navzdory své všestrannosti, LLaMA čelí riziku zaujatosti, toxických komentářů a halucinací. Model je vydáván pod nekomerční licencí zaměřenou na případy použití ve výzkumu a způsobilost pro přístup se posuzuje případ od případu.
- Projekt LLaMa model se 7 miliardami parametrů, dosáhla bleskově rychlého vyvození na MacBooku s čipem M2 Max. Tento úspěch byl umožněn Greganovovou úspěšnou implementací modelové inference na GPU Metal, specializovaném akcelerátoru nalezeném v nejnovějších čipech společnosti Apple. The LLaMa model demonstruje 0% využití CPU a využívá výpočetní výkon všech 38 kovových jader. Tato vize personalizované pomoci a lokalizace umělé inteligence na osobních zařízeních skrývá obrovský potenciál pro budoucnost, kdy se umělá inteligence stane nedílnou součástí lidských životů, poskytuje personalizovanou pomoc a zjednodušuje rutinní úkoly.
Přečtěte si více o AI:
Odmítnutí odpovědnosti
V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.
O autorovi
Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu.
Další článkyDamir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu.