Novinky Technika
Října 12, 2023

Dnešní velké jazykové modely budou podle výzkumníka na malé modely OpenAI

Hyung Won Chung, uznávaný výzkumník AI, který byl dříve zaměstnán společností Google Brain a v současnosti je členem OpenAI týmu, přednesl podnětný 45minutový projev, ve kterém prozkoumal svět velkých jazykových modelů v roce 2023. Chung má v oboru zkušenosti; byl prvním autorem dokumentu Google „Škálování instrukcí vyladěných jazykových modelů,“, která zkoumá, jak lze velké jazykové modely trénovat, aby se řídily pokyny.

Hyung Won Chung, OpenAI

Chung zdůrazňuje, že svět rozsáhlých jazykových modelů je dynamický. Ve světě LLM se hlavní princip neustále vyvíjí, na rozdíl od tradičních oborů, kde základní předpoklady obvykle zůstávají stabilní. S nadcházející generací modelů se může stát možným to, co je v současnosti považováno za nemožné nebo nepraktické. Zdůrazňuje, že je důležité u většiny tvrzení o schopnostech LLM uvést „prozatím“. Model může vykonávat úkol; prostě to ještě neudělalo.

Velké modely dneška budou za pár let malými modely

Hyung Won Chung, OpenAI

Potřeba pečlivé dokumentace a reprodukovatelnosti v výzkum AI je jednou z nejdůležitějších lekcí, které si lze z Chungovy řeči vzít. Je důležité důkladně dokumentovat probíhající práci, jak se pole vyvíjí. Tato strategie zaručuje, že experimenty mohou být rychle replikovány a znovu navštěvovány, což výzkumníkům umožňuje stavět na dřívější práci. Prostřednictvím této praxe se uznává, že se v budoucnu mohou vyvinout schopnosti, které nebyly praktické během počátečního výzkumu.

Chung věnuje část své přednášky objasnění složitosti dat a paralelismu modelů. Pro ty, kteří se chtějí ponořit hlouběji do technických aspektů umělé inteligence, poskytuje tato část cenné poznatky o vnitřním fungování těchto technik paralelismu. Pochopení těchto mechanismů je pro optimalizaci klíčové modelářský výcvik ve velkém měřítku.

Chung předpokládá, že současná cílová funkce, maximální pravděpodobnost, používaná pro předškolení LLM, je úzkým hrdlem, pokud jde o dosažení skutečně masivních měřítek, jako je 10,000 XNUMXkrát větší kapacita GPT-4. Jak strojové učení postupuje, manuálně navržené ztrátové funkce jsou stále více omezující.

Chung naznačuje, že další paradigma ve vývoji AI zahrnuje funkce učení prostřednictvím samostatných algoritmů. Tento přístup, i když je v plenkách, je příslibem škálovatelnosti nad rámec současných omezení. Zdůrazňuje také pokračující úsilí, jako je posílení učení z lidské zpětné vazby (RLHF) s modelováním pravidel, jako kroky tímto směrem, i když je třeba překonat problémy.

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Další články
Damir Yalalov
Damir Yalalov

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Institucionální apetit roste směrem k bitcoinovým ETF uprostřed volatility

Zveřejnění prostřednictvím podání 13F odhaluje, že pozoruhodní institucionální investoři fušují do bitcoinových ETF, což podtrhuje rostoucí akceptaci...

Vědět více

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Posun Donalda Trumpa ke kryptoměnám: od oponenta k obhájci a co to znamená pro americký trh s kryptoměnami
Business Trhy Příběhy a recenze Technika
Posun Donalda Trumpa ke kryptoměnám: od oponenta k obhájci a co to znamená pro americký trh s kryptoměnami
10
Layer3 spustí letos v létě token L3 a přidělí komunitě 51 % celkové dodávky
Trhy Novinky Technika
Layer3 spustí letos v létě token L3 a přidělí komunitě 51 % celkové dodávky
10
Poslední varování Edwarda Snowdena pro vývojáře bitcoinů: „Udělejte ze soukromí prioritu na úrovni protokolu nebo riskujte jeho ztrátu
Trhy Bezpečnost Wiki Vývoj Příběhy a recenze Technika
Poslední varování Edwarda Snowdena pro vývojáře bitcoinů: „Udělejte ze soukromí prioritu na úrovni protokolu nebo riskujte jeho ztrátu
10
Optimismem poháněná síť Ethereum Layer 2 Network Mint spustí svou hlavní síť 15. května
Novinky Technika
Optimismem poháněná síť Ethereum Layer 2 Network Mint spustí svou hlavní síť 15. května
10
CRYPTOMERIA LABS PTE. LTD.