Tudósítást Technológia
Október 12, 2023

Egy kutató szerint a mai nagy nyelvi modellek kis modellek lesznek OpenAI

Hyung Won Chung, egy kiváló mesterségesintelligencia-kutató, aki korábban a Google Brain alkalmazottja volt, jelenleg pedig a Google Brain tagja. OpenAI csapat elgondolkodtató, 45 perces beszédet tartott, amelyben a nagy nyelvi modellek világát tárta fel 2023-ban. Chung tapasztalattal rendelkezik ezen a területen; ő volt a Google újság első szerzője.Méretezési utasításokkal finomhangolt nyelvi modellek,”, amely azt vizsgálja, hogyan lehet nagy nyelvi modelleket betanítani az utasítások követésére.

Hyung Won Chung, OpenAI

Chung hangsúlyozza, hogy a kiterjedt nyelvi modellek világa dinamikus. Az LLM-ek világában a vezérelv folyamatosan fejlődik, ellentétben a hagyományos területekkel, ahol az alapvető feltételezések jellemzően stabilak maradnak. A modellek közelgő generációjával lehetségessé válhat az, amit jelenleg lehetetlennek vagy kivitelezhetetlennek gondolnak. Hangsúlyozza annak jelentőségét, hogy az LLM-képességekkel kapcsolatos legtöbb állítást az „egyelőre” szóval előzze meg. A modell végrehajthat egy feladatot; csak még nem tette meg.

A mai nagy modellek csak néhány év múlva lesznek kicsik

Hyung Won Chung, OpenAI

Az aprólékos dokumentáció és a reprodukálhatóság igénye AI kutatás Chung beszédének egyik legfontosabb tanulsága. Kulcsfontosságú a folyamatban lévő munka alapos dokumentálása, ahogy a terület fejlődik. Ez a stratégia garantálja, hogy a kísérletek gyorsan megismételhetők és újra megtekinthetők, lehetővé téve a kutatók számára, hogy a korábbi munkákra építsenek. Ezzel a gyakorlattal elismert, hogy a jövőben olyan képességek is kifejlődhetnek, amelyek a kezdeti kutatás során nem voltak praktikusak.

Chung előadásának egy részét az adatok és a modellpárhuzamosság bonyolultságának tisztázásának szenteli. Azok számára, akik szeretnének mélyebbre ásni az AI technikai vonatkozásait, ez a rész értékes betekintést nyújt e párhuzamossági technikák belső működésébe. Ezeknek a mechanizmusoknak a megértése elengedhetetlen az optimalizáláshoz nagyszabású modellképzés.

Chung azt állítja, hogy az LLM-előképzéshez használt jelenlegi célfüggvény, a Maximum Likelihood szűk keresztmetszetet jelent, ha valóban masszív léptéket kell elérni, például 10,000 XNUMX-szeres kapacitást. GPT-4. A gépi tanulás előrehaladtával a manuálisan tervezett veszteségfunkciók egyre korlátozóbbakká válnak.

Chung azt javasolja, hogy a mesterséges intelligencia fejlesztésének következő paradigmája magában foglalja a funkciók tanulását különálló algoritmusokon keresztül. Ez a megközelítés, bár gyerekcipőben jár, a jelenlegi korlátokon túlmutató méretezhetőség ígéretét hordozza magában. Kiemeli továbbá a folyamatban lévő erőfeszítéseket, mint például az emberi visszajelzésekből való tanulás megerősítését (RLHF) a szabálymodellezéssel, mint lépéseket ebbe az irányba, bár a kihívásokat még le kell küzdeni.

A felelősség megtagadása

Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.

A szerzőről

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

További cikkek
Damir Jalalov
Damir Jalalov

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

A volatilitás közepette nő az intézményi étvágy a Bitcoin ETF-ek felé

A 13F bejelentéseken keresztül közzétett információk jelentős intézményi befektetőket tárnak fel a Bitcoin ETF-ek iránt, ami alátámasztja a ...

Tudjon meg többet

Elérkezett az ítélethirdetés napja: CZ sorsa egyensúlyban van, mivel az Egyesült Államok bírósága mérlegeli a DOJ kérelmét

Changpeng Zhao ítéletet vár ma egy seattle-i amerikai bíróságon.

Tudjon meg többet
Csatlakozzon innovatív technológiai közösségünkhöz
KATT ide
Tovább
Az Espresso Systems együttműködik a Polygon Labs-szal az AggLayer fejlesztésében a Rollup interoperabilitás javítása érdekében
üzleti Tudósítást Technológia
Az Espresso Systems együttműködik a Polygon Labs-szal az AggLayer fejlesztésében a Rollup interoperabilitás javítása érdekében
May 9, 2024
A ZKP-alapú infrastruktúra protokoll A ZKBase bemutatja az ütemtervet, a Testnet májusban történő elindítását tervezi
Tudósítást Technológia
A ZKP-alapú infrastruktúra protokoll A ZKBase bemutatja az ütemtervet, a Testnet májusban történő elindítását tervezi
May 9, 2024
BLOCKCHANCE és CONF3RENCE Egyesüljön Németország legnagyobbjain Web3 Konferencia Dortmundban
üzleti piacok szoftver Történetek és vélemények Technológia
BLOCKCHANCE és CONF3RENCE Egyesüljön Németország legnagyobbjain Web3 Konferencia Dortmundban
May 9, 2024
A NuLink elindul a Bybiten Web3 IDO platform. Az előfizetési szakasz május 13-ig meghosszabbodik
piacok Tudósítást Technológia
A NuLink elindul a Bybiten Web3 IDO platform. Az előfizetési szakasz május 13-ig meghosszabbodik
May 9, 2024
CRYPTOMERIA LABS PTE. KFT.