Novinky Technika
Července 18, 2023

Meta představuje otevřený zdroj, který mění hru LLaMa-2-Chat s bezprecedentním výkonem

Stručně

Meta vydala LLaMa-2-chatové modely, velký průlom v open source AI.

Tyto modely s parametry 70B jsou srovnatelné s GPT-3.5 a překonávají referenční hodnoty.

Jemně vyladěné pomocí RLHF nabízejí personalizované ChatGPT ekvivalenty, metriky lidského hodnocení a schopnosti matematického řešení problémů.

Meta nedávno vydal sadu LLaMa-2-chatové modely v různých velikostech. Toto vydání od oddělení LLM GenAI vyvolalo v průmyslu rozruch.

Meta představuje otevřený zdroj, který mění hru LLaMa-2-Chat s bezprecedentním výkonem
Credit: Metaverse Post (mpost.io)

LLaMa-2-Chat je skutečně pozoruhodný úspěch vytvořený talentovaným týmem v oddělení LLM společnosti GenAI. S impozantními parametry čítajícími 70 miliard je tento model srovnatelný a dokonce předčí vysoce uznávané GPT-3.5 na určitých měřítcích.

<strong>Highlights:</strong>

  • Komerčně přátelský
  • Předtrénováno na 2T tokenech
  • Silné skóre MMLU (tj. silné uvažování)
  • 4K kontext
  • (Rozšiřitelné) RoPE vložky
  • Výkon kódování je meh
  • SFT/RLHF verze chatu

Skutečnost, že se LLaMa-2-Chat je první model své velikosti, který byl doladěn pomocí RLHF (Reinforcement Learning from Human Feedback), což jej činí ještě pozoruhodnějším. V bezprecedentním kroku Meta učinila tento model zcela zdarma pro komerční použití. Zájemci si mohou vyžádat odkaz ke stažení na jejich oficiálních stránkách.

Jedna z nejvýznamnějších výhod společnosti LLaMa-2-Chat je jeho potenciál vytvářet ChatGPT analogy bez nutnosti sdílení jakýchkoli dat OpenAI. To umožňuje vývojářům a výzkumníkům využít sílu modelu při zachování úplné kontroly nad svými daty. Můžeš download nový model zde.

Pokud jde o metriky lidského hodnocení, LLaMa-2-Chat stojí rameno na rameni s ChatGPT-3.5 z hlediska kvality. Je pozoruhodné, že předvádí výjimečný výkon v matematických problémech a překonává ostatní modely v této oblasti.

  • V únoru, Meta vydala LLaMA model, velký jazykový model navržený pro podporu výzkumníků AI. K dispozici v různých velikostech (parametry 7B, 13B, 33B a 65B), LLaMA umožňuje výzkumníci testovat nové přístupy a prozkoumat nové případy použití. Model je ideální pro dolaďovací úlohy a je postaven na velké sadě neoznačených dat. Navzdory své všestrannosti, LLaMA čelí riziku zaujatosti, toxických komentářů a halucinací. Model je vydáván pod nekomerční licencí zaměřenou na případy použití ve výzkumu a způsobilost pro přístup se posuzuje případ od případu.
  • Projekt LLaMa model se 7 miliardami parametrů, dosáhla bleskově rychlého vyvození na MacBooku s čipem M2 Max. Tento úspěch byl umožněn Greganovovou úspěšnou implementací modelové inference na GPU Metal, specializovaném akcelerátoru nalezeném v nejnovějších čipech společnosti Apple. The LLaMa model demonstruje 0% využití CPU a využívá výpočetní výkon všech 38 kovových jader. Tato vize personalizované pomoci a lokalizace umělé inteligence na osobních zařízeních skrývá obrovský potenciál pro budoucnost, kdy se umělá inteligence stane nedílnou součástí lidských životů, poskytuje personalizovanou pomoc a zjednodušuje rutinní úkoly.

Přečtěte si více o AI:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Další články
Damir Yalalov
Damir Yalalov

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Hot Stories
Připojte se k našemu zpravodaji.
Novinky

Od zvlnění k velké zelené DAO: Jak kryptoměnové projekty přispívají k charitě

Pojďme prozkoumat iniciativy využívající potenciál digitálních měn pro charitativní účely.

Vědět více

AlphaFold 3, Med-Gemini a další: The Way AI Transforms Healthcare in 2024

Umělá inteligence se ve zdravotnictví projevuje různými způsoby, od odhalování nových genetických korelací až po posílení robotických chirurgických systémů...

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Crypto Exchange Jupiter představí Jupiter Swap V3, Dynamic Slippage, mezi další klíčové aktualizace v nadcházejících týdnech
Trhy Novinky Technika
Crypto Exchange Jupiter představí Jupiter Swap V3, Dynamic Slippage, mezi další klíčové aktualizace v nadcházejících týdnech
Června 14, 2024
Polygon debutuje ve svém Governance Hub a poskytuje jednotné transparentní rozhraní pro komunitní správu
Novinky Technika
Polygon debutuje ve svém Governance Hub a poskytuje jednotné transparentní rozhraní pro komunitní správu 
Června 14, 2024
Binance registruje více než 30 milionů nových uživatelů V roce 2024 překonala aktiva zákazníků milník 100 miliard USD
Trhy Novinky Technika
Binance registruje více než 30 milionů nových uživatelů V roce 2024 překonala aktiva zákazníků milník 100 miliard USD
Června 14, 2024
Amazon podporuje generativní spouštění AI s investicí 230 milionů dolarů, přiděluje 80 milionů dolarů svému druhému programu AWS Generative AI Accelerator
Business Novinky Technika
Amazon podporuje generativní spouštění AI s investicí 230 milionů dolarů, přiděluje 80 milionů dolarů svému druhému programu AWS Generative AI Accelerator
Června 14, 2024
CRYPTOMERIA LABS PTE. LTD.