Vijesti
Studenog 06, 2022

ERNIE-ViLG 2.0: novi model pretvaranja teksta u sliku tvrtke Baidu nadmašuje Dalle-2 i Stable Diffusion

Ukratko

I Dalle-2 i Stable Diffusion značajno su nadmašili ERNIE-ViLG 2.0

ERNIE-ViLG 2.0 je model teksta u sliku koji nudi bolje performanse od Dalle-2 i Stable Diffusion, dva najpopularnija trenutno dostupna modela teksta u sliku. Novi model dizajnirao je i obučavao tim istraživača iz Baidua, a rezultati oduzimaju dah.

Novi model teksta u sliku ERNIE-ViLG 2.0 nadmašuje Dalle-2 i Stable Diffusion
Slika koju je izradio ERNIE-ViLG 2.0

Rezultati su pokazali da je ERNIE-ViLG 2.0 značajno nadmašio Dalle-2 i Stable Diffusion. Ovo je značajno postignuće i pokazuje snagu okvira ERNIE. The Metaverse Post tim je usporedio ERNIE-ViLG 2.0 sa Stable Diffusion u nastavku:

ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0

Ovi rezultati snažno podupiru hipotezu da je ERNIE-ViLG 2.0 učinkovitiji sustav tekst-u-sliku nego i Dalle-2 i Stable Diffusion.

Unet arhitektura iz Stable Diffusion uzima se kao osnova, ali uz izmjene:

  • Mješavina stručnjaka za uklanjanje šuma: Postoji 10 neuronskih mreža umjesto samo jedne, a svaka je odgovorna samo za određene korake difuzije.
  • Tekstualno znanje: Automatski ponovno vaganje riječi u upitu kako bi ključne riječi dobile veću težinu.
  • Vizualno znanje: Tijekom treninga, objekti su otkriveni na rezultatima međugeneracije, a težina funkcije gubitka na regijama s objektima je povećana.

Kao rezultat toga, najveći na svijetu model teksta u sliku izašao s 24 milijarde parametara (10 puta veći od SD-a) za treniranje modela.

U usporedbi s ranijim modelima, ERNIE-ViLG 2.0 uvelike ih nadmašuje u pogledu kvalitete slike i podudaranja slike i teksta kada se istovremeno testira na dvojezičnom ViLG-300 brz postavila osoba.

Upiti se jednostavno automatski prevode s kineskog na engleski u HuggingFace javni demo prije slanja u AI. Mnogo značajki proizlazi iz ovoga.

  • ERNIE ne poznaje međunarodne javne osobe. Na primjer, ERNIE ne poznaje Arnolda Schwarzeneggera. Zasigurno ima lokalne favorite u Kini.
  • Kao rezultat toga, metoda korištenja imena slavnih u upitima dramatično poboljšava kvalitetu lica ne uspije.
  • Možete očekivati ​​neke distorzije zbog prijevoda s kineskog, tako da bi vas mogla čekati neka iznenađenja ako ne govorite kineski.
  • Čak ne zna ništa o Gregu Rutkowskom.

Pročitajte povezane članke:

Izjava o odricanju od odgovornosti

U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.

O autoru

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Više članaka
Damir Yalalov
Damir Yalalov

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Institucionalni apetit raste prema Bitcoin ETF-ovima usred volatilnosti

Objave putem 13F prijava otkrivaju značajne institucionalne ulagače koji se upuštaju u Bitcoin ETF-ove, naglašavajući sve veće prihvaćanje ...

Znati više

Stiže dan izricanja presude: CZ-ova sudbina visi na ravnoteži dok američki sud razmatra izjavu DOJ-a

Changpeng Zhao danas će se suočiti s kaznom na američkom sudu u Seattleu.

Znati više
Pridružite se našoj zajednici inovativnih tehnologija
opširnije
Čitaj više
Injective udružuje snage s AltLayerom kako bi unio sigurnost ponovnog postavljanja na inEVM
posao Vijesti Tehnologija
Injective udružuje snage s AltLayerom kako bi unio sigurnost ponovnog postavljanja na inEVM
Neka 3, 2024
Masa se udružuje s Tellerom kako bi uveli MASA Lending Pool, omogućujući USDC posuđivanje na bazi
tržišta Vijesti Tehnologija
Masa se udružuje s Tellerom kako bi uveli MASA Lending Pool, omogućujući USDC posuđivanje na bazi
Neka 3, 2024
Velodrome lansira Superchain Beta verziju u nadolazećim tjednima i proširuje se na OP Stack Layer 2 Blockchains
tržišta Vijesti Tehnologija
Velodrome lansira Superchain Beta verziju u nadolazećim tjednima i proširuje se na OP Stack Layer 2 Blockchains
Neka 3, 2024
CARV najavljuje partnerstvo s Aethirom za decentralizaciju svog podatkovnog sloja i distribuciju nagrada
posao Vijesti Tehnologija
CARV najavljuje partnerstvo s Aethirom za decentralizaciju svog podatkovnog sloja i distribuciju nagrada
Neka 3, 2024
CRYPTOMERIA LABS PTE. LTD.