Tudósítást
November 06, 2022

ERNIE-ViLG 2.0: A Baidu új szöveg-kép modellje jobban teljesít, mint a Dalle-2 és Stable Diffusion

Röviden

Mind a Dalle-2, mind Stable Diffusion jelentősen felülmúlta az ERNIE-ViLG 2.0

ERNIE-ViLG 2.0 egy szöveg-kép modell, amely jobb teljesítményt nyújt, mint a Dalle-2 és Stable Diffusion, a jelenleg elérhető két legnépszerűbb szöveg-képmodell. Az új modellt a Baidu kutatóinak csapata tervezte és képezte ki, és az eredmények lélegzetelállítóak.

Az új szöveg-kép-modell, az ERNIE-ViLG 2.0 felülmúlja a Dalle-2-t és a Stable Diffusion
Az ERNIE-ViLG 2.0 által készített kép

Az eredmények azt mutatták, hogy az ERNIE-ViLG 2.0 jelentősen felülmúlta a Dalle-2 és Stable Diffusion. Ez jelentős eredmény, és az ERNIE keretrendszer erejét mutatja. A Metaverse Post csapat összehasonlította az ERNIE-ViLG 2.0-val Stable Diffusion lent:

ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0

Ezek az eredmények erősen alátámasztják azt a hipotézist, hogy az ERNIE-ViLG 2.0 hatékonyabb szöveg-kép rendszer, mint mind a Dalle-2, mind a Stable Diffusion.

Az Unet architektúra a Stable Diffusion alapul vett, de változtatásokkal:

  • Zajtalanító szakértők keveréke: Egy helyett 10 neurális hálózat létezik, amelyek mindegyike csak bizonyos diffúziós lépésekért felelős.
  • Szövegismeret: Automatikusan átsúlyozta a szavakat a lekérdezésben, hogy a kulcsszavak nagyobb súlyt kapjanak.
  • Vizuális tudás: A betanítás során a közbülső generációs eredményeken észleltek tárgyakat, és megnövelték a veszteségfüggvény súlyát az objektumokkal rendelkező területeken.

Ennek eredményeként a világ legnagyobb szöveg-kép modell 24 milliárd (az SD-nél 10-szer nagyobb) paraméterrel jött ki a modell betanításához.

A korábbi modellekhez képest az ERNIE-ViLG 2.0 jelentősen felülmúlja őket a képminőség és a kép-szöveg egyeztetés tekintetében, ha egyidejűleg tesztelik a ViLG-300 kétnyelvű készüléken. azonnali személy állítja be.

Az utasításokat a rendszer egyszerűen lefordítja kínairól angolra HuggingFace nyilvános demó, mielőtt elküldik az AI-ba. Ebből sok funkció fakad.

  • ERNIE nem ismer nemzetközi közéleti személyiségeket. Például ERNIE nem ismeri Arnold Schwarzeneggert. Biztosan vannak helyi kedvencei Kínában.
  • Ennek eredményeként a hírességek neveinek felhívásokban való használatának módszere drámai módon javítja a arcok sikertelen.
  • Némi torzításra számíthatsz a kínai fordítás miatt, így ha nem beszélsz kínaiul, meglepetéseket tartogathatsz számodra.
  • Nem is tud semmit Greg Rutkowskiról.

Olvassa el a kapcsolódó cikkeket:

A felelősség megtagadása

Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.

A szerzőről

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

További cikkek
Damir Jalalov
Damir Jalalov

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

A volatilitás közepette nő az intézményi étvágy a Bitcoin ETF-ek felé

A 13F bejelentéseken keresztül közzétett információk jelentős intézményi befektetőket tárnak fel a Bitcoin ETF-ek iránt, ami alátámasztja a ...

Tudjon meg többet

Elérkezett az ítélethirdetés napja: CZ sorsa egyensúlyban van, mivel az Egyesült Államok bírósága mérlegeli a DOJ kérelmét

Changpeng Zhao ítéletet vár ma egy seattle-i amerikai bíróságon.

Tudjon meg többet
Csatlakozzon innovatív technológiai közösségünkhöz
KATT ide
Tovább
Az Injective egyesíti erőit az AltLayerrel, hogy biztonságot nyújtson az inEVM számára
üzleti Tudósítást Technológia
Az Injective egyesíti erőit az AltLayerrel, hogy biztonságot nyújtson az inEVM számára
May 3, 2024
A Masa a Tellerrel együttműködve bevezeti a MASA hitelintézetet, amely lehetővé teszi az USDC hitelfelvételt.
piacok Tudósítást Technológia
A Masa a Tellerrel együttműködve bevezeti a MASA hitelintézetet, amely lehetővé teszi az USDC hitelfelvételt.
May 3, 2024
A Velodrome a következő hetekben elindítja a Superchain béta verzióját, és az OP Stack Layer 2 blokkláncaira is kiterjed
piacok Tudósítást Technológia
A Velodrome a következő hetekben elindítja a Superchain béta verzióját, és az OP Stack Layer 2 blokkláncaira is kiterjed
May 3, 2024
A CARV partnerséget hirdet az Aethirrel adatrétegének decentralizálása és a jutalmak elosztása érdekében
üzleti Tudósítást Technológia
A CARV partnerséget hirdet az Aethirrel adatrétegének decentralizálása és a jutalmak elosztása érdekében
May 3, 2024
CRYPTOMERIA LABS PTE. KFT.