Novinová správa Technológia
Októbra 12, 2023

Dnešné veľké jazykové modely budú podľa výskumníka na malé modely OpenAI

Hyung Won Chung, uznávaný výskumník AI, ktorý bol predtým zamestnaný v Google Brain a v súčasnosti je členom OpenAI tím, predniesol podnetný 45-minútový prejav, v ktorom preskúmal svet veľkých jazykových modelov v roku 2023. Chung má skúsenosti v tejto oblasti; bol prvým autorom článku Google „Škálovanie inštrukcií doladených jazykových modelov,“, ktorá skúma, ako možno veľké jazykové modely trénovať na dodržiavanie pokynov.

Hyung Won Chung, OpenAI

Chung zdôrazňuje, že svet rozsiahlych jazykových modelov je dynamický. Vo svete LLM sa hlavný princíp neustále vyvíja, na rozdiel od tradičných oblastí, kde základné predpoklady zvyčajne zostávajú stabilné. S prichádzajúcou generáciou modelov sa môže stať možným to, čo sa v súčasnosti považuje za nemožné alebo nepraktické. Zdôrazňuje význam uvádzania väčšiny tvrdení o schopnostiach LLM výrazom „zatiaľ“. Model môže vykonávať úlohu; len to ešte neurobilo.

Dnešné veľké modely budú o pár rokov malými modelmi

Hyung Won Chung, OpenAI

Potreba dôkladnej dokumentácie a reprodukovateľnosti v výskum AI je jedným z najdôležitejších ponaučení z Chungovho prejavu. Je dôležité dôkladne zdokumentovať prebiehajúcu prácu, ako sa oblasť vyvíja. Táto stratégia zaručuje, že experimenty môžu byť rýchlo replikované a prehodnotené, čo umožňuje výskumníkom stavať na predchádzajúcej práci. Prostredníctvom tejto praxe sa uznáva, že v budúcnosti sa môžu vyvinúť schopnosti, ktoré neboli praktické počas počiatočného výskumu.

Chung venuje časť svojej prednášky objasneniu zložitosti údajov a paralelizmu modelov. Pre tých, ktorí majú záujem hlbšie sa ponoriť do technických aspektov AI, táto časť poskytuje cenné informácie o vnútornom fungovaní týchto techník paralelizmu. Pochopenie týchto mechanizmov je kľúčové pre optimalizáciu modelársky výcvik vo veľkom meradle.

Chung predpokladá, že súčasná cieľová funkcia, maximálna pravdepodobnosť, ktorá sa používa na predbežné školenie LLM, je prekážkou, pokiaľ ide o dosiahnutie skutočne masívneho rozsahu, ako je 10,000 XNUMX-násobok kapacity GPT-4. Ako strojové učenie postupuje, manuálne navrhnuté stratové funkcie sú čoraz obmedzujúcejšie.

Chung naznačuje, že ďalšia paradigma vo vývoji AI zahŕňa funkcie učenia prostredníctvom samostatných algoritmov. Tento prístup, aj keď je v plienkach, je prísľubom škálovateľnosti nad rámec súčasných obmedzení. Zdôrazňuje tiež prebiehajúce úsilie, ako napríklad posilnenie učenia sa z ľudskej spätnej väzby (RLHF) s modelovaním pravidiel, ako kroky týmto smerom, aj keď výzvy, ktoré je ešte potrebné prekonať.

Vylúčenie zodpovednosti

V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.

O autorovi

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Ďalšie články
Damir Yalalov
Damir Yalalov

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Hot Stories
Pridajte sa k nášmu newsletteru.
Novinky

Inštitucionálny apetít rastie smerom k bitcoinovým ETF uprostred volatility

Zverejnenia prostredníctvom podaní 13F odhaľujú pozoruhodných inštitucionálnych investorov, ktorí sa venujú bitcoinovým ETF, čo podčiarkuje rastúcu akceptáciu ...

vedieť viac

Prichádza deň odsúdenia: Osud CZ visí v rovnováhe, pretože americký súd zvažuje žalobu ministerstva spravodlivosti

Changpeng Zhao dnes čaká na americkom súde v Seattli odsúdenie.

vedieť viac
Pripojte sa k našej komunite inovatívnych technológií
Čítaj viac
Čítaj viac
Posun Donalda Trumpa ku kryptomenám: od oponenta k advokátovi a čo to znamená pre americký trh s kryptomenami
firmy trhy Príbehy a recenzie Technológia
Posun Donalda Trumpa ku kryptomenám: od oponenta k advokátovi a čo to znamená pre americký trh s kryptomenami
Môže 10, 2024
Layer3 na spustenie tokenu L3 toto leto, pričom komunite pridelí 51 % celkovej ponuky
trhy Novinová správa Technológia
Layer3 na spustenie tokenu L3 toto leto, pričom komunite pridelí 51 % celkovej ponuky
Môže 10, 2024
Posledné varovanie Edwarda Snowdena pre vývojárov bitcoínov: „Urobte zo súkromia prioritu na úrovni protokolu alebo riskujte jeho stratu
trhy zabezpečenia Wiki Softvér Príbehy a recenzie Technológia
Posledné varovanie Edwarda Snowdena pre vývojárov bitcoínov: „Urobte zo súkromia prioritu na úrovni protokolu alebo riskujte jeho stratu
Môže 10, 2024
Optimizmom poháňaná sieť Ethereum Layer 2 Mint spustí svoju hlavnú sieť 15. mája
Novinová správa Technológia
Optimizmom poháňaná sieť Ethereum Layer 2 Mint spustí svoju hlavnú sieť 15. mája
Môže 10, 2024
CRYPTOMERIA LABS PTE. LTD.