Tudósítást Technológia
Március 30, 2023

OpenFlamingo: Új nyílt forráskódú kép-szöveg keretrendszer a Meta AI-től és a LAION-tól

Röviden

Az OpenFlamingo a DeepMind Flamingo modelljének nyílt forráskódú változata, amely a LLaMA nagy nyelvi modell.

A fejlesztők egy olyan multimodális rendszer létrehozását remélik, amely képes kezelni a látásnyelvi kihívásokat és egyenlő GPT-4ereje és alkalmazkodóképessége a vizuális és szövegbevitel kezelésében.

A DeepMind Flamingo modelljének nyílt forráskódú verziója, OpenFlamingo, most jelent meg. Az OpenFlamingo alapvetően egy keretrendszer, amely lehetővé teszi a méretes multimodális modellek (LMM) képzését és értékelését. Az OpenFlamingo a tetejére épül LLaMA Meta AI által kifejlesztett nagy nyelvi modell.

OpenFlamingo: A Meta AI és a LAION új, nyílt forráskódú kép-szöveg keretrendszere
Bővebben: Hogyan használjuk Midjourney Forever ingyen: 5 egyszerű lépés

A fejlesztők hozzájárulása ehhez az első kiadáshoz a következő:

  • Egy méretes multimodális adatkészlet, amely szöveges és vizuális szekvenciákat kombinál.
  • Egy viszonyítási alap a kontextuson belüli tanulás értékeléséhez olyan tevékenységek esetében, mint a látás és a nyelv.
  • A mi előzetes verziója LLaMA-alapú OpenFlamingo-9B modell.

Az OpenFlamingo révén a fejlesztők egy olyan multimodális rendszer létrehozását remélik, amely képes megbirkózni a különféle látásnyelvi kihívásokkal. A végső cél az egyenlőség GPT-4ereje és alkalmazkodóképessége a vizuális és szövegbevitel kezelésében. E cél elérése érdekében a fejlesztők a DeepMind Flamingo modelljének nyílt forráskódú változatát fejlesztik, amely egy LMM, amely képes feldolgozni és érvelni a képeket, videókat és szöveget. A fejlesztők elkötelezettek a teljesen nyílt forráskódú modellek fejlesztése mellett, mert úgy gondolják, hogy az átláthatóság kulcsfontosságú az együttműködés elősegítésében, a fejlődés felgyorsításában és a legmodernebb LMM-ekhez való hozzáférés demokratizálásában.

Állatfelismerés

Ők biztosítják az OpenFlamingo-9B modellünk kezdeti ellenőrző pontját. Bár a modell még nincs teljesen optimalizálva, a projekt ígéretét mutatja. A fejlesztők jobb LMM-eket képezhetnek, ha együttműködnek és közösségi visszajelzést kapnak. Felkérik a nyilvánosságot, hogy adjanak véleményt és bővítsék az adattárat, hogy részt vegyenek a fejlesztési folyamatban.

Tárgyak számlálása

A megvalósítás nagyon hasonlít a Flamingóéhoz. A flamingó modelleket nagyméretű webes adatkészletekre kell képezni, átlapolt szöveggel és grafika hogy felvértezzük őket a kontextuson belüli néhány felvételes tanulási készségekkel. Ugyanaz az architektúra, amelyet az eredeti Flamingo-tanulmány (Perceiver resamplers, cross-attention layers) javasolt, az OpenFlamingo-ban valósul meg. De mivel a Flamingo képzési adatai nem hozzáférhetők a nagyközönség számára, a fejlesztők nyílt forráskódú adatkészleteket használnak a modellek betanításához. Az újonnan közzétett OpenFlamingo-9B ellenőrzőpont kifejezetten a LAION-10B 2 millió mintájára és az új Multimodal C5 adatkészletből származó 4 millió mintára lett kiképezve.

A fejlesztők egy ellenőrző pontot is mellékelnek a befejezetlen LMM OpenFlamingo-9B-ből, amely LLaMA 7B és CLIP ViT/L-14, a kiadás részeként. Annak ellenére, hogy ez a koncepció még fejlesztés alatt áll, a közösség már most sokat profitálhat belőle.

A kezdéshez nézze meg a GitHub forrás és demó.

Tudjon meg többet az AI-ról:

A felelősség megtagadása

Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.

A szerzőről

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

További cikkek
Damir Jalalov
Damir Jalalov

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

A volatilitás közepette nő az intézményi étvágy a Bitcoin ETF-ek felé

A 13F bejelentéseken keresztül közzétett információk jelentős intézményi befektetőket tárnak fel a Bitcoin ETF-ek iránt, ami alátámasztja a ...

Tudjon meg többet

Elérkezett az ítélethirdetés napja: CZ sorsa egyensúlyban van, mivel az Egyesült Államok bírósága mérlegeli a DOJ kérelmét

Changpeng Zhao ítéletet vár ma egy seattle-i amerikai bíróságon.

Tudjon meg többet
Csatlakozzon innovatív technológiai közösségünkhöz
KATT ide
Tovább
A Nexo elindítja a „vadászatot”, hogy a felhasználókat 12 millió dolláros NEXO tokennel jutalmazza az ökoszisztéma iránti elkötelezettségért
piacok Tudósítást Technológia
A Nexo elindítja a „vadászatot”, hogy a felhasználókat 12 millió dolláros NEXO tokennel jutalmazza az ökoszisztéma iránti elkötelezettségért
May 8, 2024
A Revolut Revolut X Exchange Woos Crypto Traders szolgáltatása nulla gyártói díjjal és fejlett elemzéssel
piacok szoftver Történetek és vélemények Technológia
A Revolut Revolut X Exchange Woos Crypto Traders szolgáltatása nulla gyártói díjjal és fejlett elemzéssel
May 8, 2024
A kriptográfiai kereskedési platform, a BitMEX bemutatja az opciós kereskedést 0 díjjal és készpénzes ösztönzőkkel
üzleti piacok Tudósítást
A kriptográfiai kereskedési platform, a BitMEX bemutatja az opciós kereskedést 0 díjjal és készpénzes ösztönzőkkel
May 8, 2024
A Lisk hivatalosan áttér az Ethereum Layer 2-re, és bemutatja a Core v4.0.6-ot
Tudósítást Technológia
A Lisk hivatalosan áttér az Ethereum Layer 2-re, és bemutatja a Core v4.0.6-ot
May 8, 2024
CRYPTOMERIA LABS PTE. KFT.