Naujienų ataskaita
Lapkritis 06, 2022

ERNIE-ViLG 2.0: naujasis Baidu teksto į vaizdą modelis lenkia Dalle-2 ir Stable Diffusion

Trumpai

Tiek Dalle-2, tiek Stable Diffusion buvo gerokai pranašesni už ERNIE-ViLG 2.0

ERNIE-ViLG 2.0 yra teksto į vaizdą modelis, kuris siūlo geresnį našumą nei Dalle-2 ir Stable Diffusion, du šiuo metu populiariausi teksto į vaizdą modeliai. Naująjį modelį sukūrė ir apmokė Baidu tyrėjų komanda, o rezultatai yra kvapą gniaužiantys.

Naujasis teksto į vaizdą modelis ERNIE-ViLG 2.0 lenkia Dalle-2 ir Stable Diffusion
ERNIE-ViLG 2.0 sukurtas vaizdas

Rezultatai parodė, kad ERNIE-ViLG 2.0 gerokai pranoko Dalle-2 ir Stable Diffusion. Tai reikšmingas pasiekimas ir parodo ERNIE sistemos galią. The Metaverse Post komanda palygino ERNIE-ViLG 2.0 su Stable Diffusion žemiau:

ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0

Šie rezultatai tvirtai patvirtina hipotezę, kad ERNIE-ViLG 2.0 yra efektyvesnis teksto į vaizdą sistema nei Dalle-2 ir Stable Diffusion.

Unet architektūra iš Stable Diffusion yra laikomas pagrindu, bet su pakeitimais:

  • Triukšmo šalinimo ekspertų mišinys: Vietoj vieno yra 10 neuroninių tinklų, kurių kiekvienas yra atsakingas tik už tam tikrus sklaidos veiksmus.
  • Tekstinės žinios: Automatiškai persvarstė užklausos žodžius, kad raktiniai žodžiai būtų svarbesni.
  • Vizualinės žinios: Treniruotės metu objektai buvo aptikti pagal tarpinės kartos rezultatus, o praradimo funkcijos svoris regionuose, kuriuose yra objektai, buvo padidintas.

Dėl to didžiausias pasaulyje tekstas į vaizdą modelis modeliui parengti pasirodė 24 milijardai parametrų (10 kartų didesni nei SD).

Palyginti su ankstesniais modeliais, ERNIE-ViLG 2.0 juos gerokai pranoksta vaizdo kokybe ir vaizdo ir teksto suderinimu, kai tuo pačiu metu buvo išbandytas dvikalbiame ViLG-300 greitai nustatytas asmens.

Raginimai tiesiog automatiškai išverčiami iš kinų į anglų kalbą ApkabinantisVeidas vieša demonstracija prieš siunčiant į AI. Iš to kyla daug funkcijų.

  • ERNIE nepažįsta tarptautinių visuomenės veikėjų. Pavyzdžiui, ERNIE nepažįsta Arnoldo Schwarzeneggerio. Jis tikrai turi vietinių mėgstamiausių Kinijoje.
  • Dėl to įžymybių vardų naudojimo būdas ragina labai pagerinti vaizdo kokybę. veidai nepavyksta.
  • Galite tikėtis tam tikrų iškraipymų dėl vertimo iš kinų kalbos, todėl, jei nekalbate kinų kalba, jūsų gali laukti netikėtumų.
  • Tai net nieko nežino apie Gregą Rutkowskį.

Skaityti susijusius straipsnius:

Atsakomybės neigimas

Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.

Apie autorių

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Daugiau straipsnių
Damiras Jalalovas
Damiras Jalalovas

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Ateina nuosprendžio paskelbimo diena: CZ likimas subalansuotas, nes JAV teismas svarsto DOJ prašymą

Changpeng Zhao šiandien laukia nuosprendžio JAV teisme Sietle.

Žinoti daugiau

Samourai piniginės įkūrėjai apkaltinti palengvinę 2 mlrd. USD „Darknet“ sandorius

„Samourai Wallet“ įkūrėjų nuogąstavimai yra reikšmingas pramonės nuosmukis, pabrėžiantis nuolatinį ...

Žinoti daugiau
Prisijunkite prie mūsų naujoviškų technologijų bendruomenės
Skaityti daugiau
Skaityti daugiau
„Ankr“ bendradarbiauja su AI „Blockchain“ platformos „Talus“ tinklu, siekdamas atrakinti „Bitcoin“ likvidumą AI
Atsakingas verslas Naujienų ataskaita Technologija
„Ankr“ bendradarbiauja su AI „Blockchain“ platformos „Talus“ tinklu, siekdamas atrakinti „Bitcoin“ likvidumą AI
Gali 1, 2024
„Binance Labs“ palaiko judėjimo laboratorijas, kad palengvintų „Facebook“ judėjimo integraciją visose blokų grandinėse
Atsakingas verslas Naujienų ataskaita Technologija
„Binance Labs“ palaiko judėjimo laboratorijas, kad palengvintų „Facebook“ judėjimo integraciją visose blokų grandinėse
Gali 1, 2024
BRICS Nations Eye Stablecoin prekybos sprendimas
Atsakingas verslas rinkos Istorijos ir apžvalgos Technologija
BRICS Nations Eye Stablecoin prekybos sprendimas
Gali 1, 2024
Bitcoin L2 Network BOB integruojasi su LayerZero, kad pagerintų funkcionalumą
Atsakingas verslas Naujienų ataskaita Technologija
Bitcoin L2 Network BOB integruojasi su LayerZero, kad pagerintų funkcionalumą
Gali 1, 2024
CRYPTOMERIA LABS PTE. LTD.