Naujienų ataskaita
Lapkritis 06, 2022

ERNIE-ViLG 2.0: naujasis Baidu teksto į vaizdą modelis lenkia Dalle-2 ir Stable Diffusion

Trumpai

Tiek Dalle-2, tiek Stable Diffusion buvo gerokai pranašesni už ERNIE-ViLG 2.0

ERNIE-ViLG 2.0 yra teksto į vaizdą modelis, kuris siūlo geresnį našumą nei Dalle-2 ir Stable Diffusion, du šiuo metu populiariausi teksto į vaizdą modeliai. Naująjį modelį sukūrė ir apmokė Baidu tyrėjų komanda, o rezultatai yra kvapą gniaužiantys.

Naujasis teksto į vaizdą modelis ERNIE-ViLG 2.0 lenkia Dalle-2 ir Stable Diffusion
ERNIE-ViLG 2.0 sukurtas vaizdas

Rezultatai parodė, kad ERNIE-ViLG 2.0 gerokai pranoko Dalle-2 ir Stable Diffusion. Tai reikšmingas pasiekimas ir parodo ERNIE sistemos galią. The Metaverse Post komanda palygino ERNIE-ViLG 2.0 su Stable Diffusion žemiau:

ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0

Šie rezultatai tvirtai patvirtina hipotezę, kad ERNIE-ViLG 2.0 yra efektyvesnis teksto į vaizdą sistema nei Dalle-2 ir Stable Diffusion.

Unet architektūra iš Stable Diffusion yra laikomas pagrindu, bet su pakeitimais:

  • Triukšmo šalinimo ekspertų mišinys: Vietoj vieno yra 10 neuroninių tinklų, kurių kiekvienas yra atsakingas tik už tam tikrus sklaidos veiksmus.
  • Tekstinės žinios: Automatiškai persvarstė užklausos žodžius, kad raktiniai žodžiai būtų svarbesni.
  • Vizualinės žinios: Treniruotės metu objektai buvo aptikti pagal tarpinės kartos rezultatus, o praradimo funkcijos svoris regionuose, kuriuose yra objektai, buvo padidintas.

Dėl to didžiausias pasaulyje tekstas į vaizdą modelis modeliui parengti pasirodė 24 milijardai parametrų (10 kartų didesni nei SD).

Palyginti su ankstesniais modeliais, ERNIE-ViLG 2.0 juos gerokai pranoksta vaizdo kokybe ir vaizdo ir teksto suderinimu, kai tuo pačiu metu buvo išbandytas dvikalbiame ViLG-300 greitai nustatytas asmens.

Raginimai tiesiog automatiškai išverčiami iš kinų į anglų kalbą ApkabinantisVeidas vieša demonstracija prieš siunčiant į AI. Iš to kyla daug funkcijų.

  • ERNIE nepažįsta tarptautinių visuomenės veikėjų. Pavyzdžiui, ERNIE nepažįsta Arnoldo Schwarzeneggerio. Jis tikrai turi vietinių mėgstamiausių Kinijoje.
  • Dėl to įžymybių vardų naudojimo būdas ragina labai pagerinti vaizdo kokybę. veidai nepavyksta.
  • Galite tikėtis tam tikrų iškraipymų dėl vertimo iš kinų kalbos, todėl, jei nekalbate kinų kalba, jūsų gali laukti netikėtumų.
  • Tai net nieko nežino apie Gregą Rutkowskį.

Skaityti susijusius straipsnius:

Atsakomybės neigimas

Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.

Apie autorių

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Daugiau straipsnių
Damiras Jalalovas
Damiras Jalalovas

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Institucinis apetitas Bitcoin ETF atžvilgiu auga dėl nepastovumo

13F paraiškų atskleidimas atskleidžia žymius institucinius investuotojus, kurie naudojasi Bitcoin ETF, o tai rodo, kad vis labiau pritariama...

Žinoti daugiau

Ateina nuosprendžio paskelbimo diena: CZ likimas subalansuotas, nes JAV teismas svarsto DOJ prašymą

Changpeng Zhao šiandien laukia nuosprendžio JAV teisme Sietle.

Žinoti daugiau
Prisijunkite prie mūsų naujoviškų technologijų bendruomenės
Skaityti daugiau
Skaityti daugiau
Injective sujungia jėgas su AltLayer, kad padidintų inEVM saugumą
Atsakingas verslas Naujienų ataskaita Technologija
Injective sujungia jėgas su AltLayer, kad padidintų inEVM saugumą
Gali 3, 2024
„Masa“ bendradarbiauja su „Teller“, kad pristatytų MASA skolinimo fondą, leidžiantį skolintis USDC pagrindu
rinkos Naujienų ataskaita Technologija
„Masa“ bendradarbiauja su „Teller“, kad pristatytų MASA skolinimo fondą, leidžiantį skolintis USDC pagrindu
Gali 3, 2024
„Velodrome“ ateinančiomis savaitėmis pristato „Superchain“ beta versiją ir išplečiama visose „OP Stack Layer 2 Blockchains“
rinkos Naujienų ataskaita Technologija
„Velodrome“ ateinančiomis savaitėmis pristato „Superchain“ beta versiją ir išplečiama visose „OP Stack Layer 2 Blockchains“
Gali 3, 2024
CARV praneša apie partnerystę su Aethir, kad decentralizuotų savo duomenų sluoksnį ir paskirstytų atlygį
Atsakingas verslas Naujienų ataskaita Technologija
CARV praneša apie partnerystę su Aethir, kad decentralizuotų savo duomenų sluoksnį ir paskirstytų atlygį
Gali 3, 2024
CRYPTOMERIA LABS PTE. LTD.