Buletin de stiri
Noiembrie 06, 2022

ERNIE-ViLG 2.0: Noul model text-to-image de la Baidu îl depășește pe Dalle-2 și Stable Diffusion

Pe scurt

Atât Dalle-2 cât și Stable Diffusion au fost semnificativ depășiți de ERNIE-ViLG 2.0

ERNIE-ViLG 2.0 este un model text-to-image care oferă performanțe mai bune decât Dalle-2 și Stable Diffusion, două dintre cele mai populare modele text-to-image disponibile în prezent. Noul model a fost conceput și antrenat de o echipă de cercetători de la Baidu, iar rezultatele sunt uluitoare.

Noul model text-to-image ERNIE-ViLG 2.0 îl depășește pe Dalle-2 și Stable Diffusion
Imaginea creată de ERNIE-ViLG 2.0

Rezultatele au demonstrat că ERNIE-ViLG 2.0 a depășit semnificativ Dalle-2 și Stable Diffusion. Aceasta este o realizare semnificativă și demonstrează puterea cadrului ERNIE. The Metaverse Post echipa a comparat ERNIE-ViLG 2.0 cu Stable Diffusion de mai jos:

ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0

Aceste rezultate oferă un sprijin puternic pentru ipoteza că ERNIE-ViLG 2.0 este mai eficient sistem text-to-image decât Dalle-2 și Stable Diffusion.

Arhitectura Unet din Stable Diffusion este luată ca bază, dar cu modificări:

  • Un amestec de experți în eliminarea zgomotului: Există 10 rețele neuronale în loc de doar una, fiecare fiind responsabilă doar pentru anumiți pași de difuzie.
  • Cunoștințe textuale: S-a reponderat automat cuvintele din interogare, astfel încât cuvintele cheie să aibă mai multă greutate.
  • Cunoștințe vizuale: În timpul antrenamentului, obiectele au fost detectate pe rezultatele generației intermediare, iar ponderea funcției de pierdere pe regiunile cu obiecte a fost crescută.

Drept urmare, cel mai mare din lume model text-to-image a apărut cu 24 de miliarde de parametri (de 10 ori mai mari decât SD) pentru a antrena modelul.

În comparație cu modelele anterioare, ERNIE-ViLG 2.0 le depășește cu mult în ceea ce privește calitatea imaginii și potrivirea imagine-text atunci când este testat simultan pe ViLG-300 bilingv. prompt stabilit de o persoană.

Solicitările sunt traduse pur și simplu din chineză în engleză automat în Față îmbrățișată demonstrație publică înainte de a fi trimisă în AI. Din aceasta decurg o mulțime de caracteristici.

  • ERNIE nu cunoaște personalități publice internaționale. De exemplu, ERNIE nu-l cunoaște pe Arnold Schwarzenegger. Cu siguranță are favorite locale în China.
  • Ca rezultat, metoda de utilizare a numelor de celebrități în solicitări pentru a crește dramatic calitatea fete eșuează.
  • Vă puteți aștepta la o oarecare distorsiune din cauza traducerii din chineză, așa că s-ar putea să vă aștepte câteva surprize dacă nu vorbiți chineză.
  • Nici măcar nu știe nimic despre Greg Rutkowski.

Citiți articole conexe:

Declinare a responsabilităţii

În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.

Despre autor

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Mai multe articole
Damir Yalalov
Damir Yalalov

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Apetitul instituțional crește față de ETF-urile Bitcoin pe fondul volatilității

Dezvăluirile prin dosarele 13F dezvăluie investitori instituționali de seamă care se amestecă în ETF-uri Bitcoin, subliniind o acceptare tot mai mare a...

Aflați mai multe

Sosește ziua sentinței: soarta lui CZ este în echilibru, în timp ce tribunalul american ia în considerare pledoaria DOJ

Changpeng Zhao este pe cale de a fi condamnat astăzi într-un tribunal american din Seattle.

Aflați mai multe
Alăturați-vă comunității noastre tehnologice inovatoare
Citeste mai mult
Află mai multe
Injective își unește forțele cu AltLayer pentru a aduce securitatea refacerii în EVM
Afaceri Buletin de stiri Tehnologia
Injective își unește forțele cu AltLayer pentru a aduce securitatea refacerii în EVM
3 Mai, 2024
Masa face echipă cu Teller pentru a introduce grupul de împrumuturi MASA, care permite împrumuturile USDC pe bază
pieţe Buletin de stiri Tehnologia
Masa face echipă cu Teller pentru a introduce grupul de împrumuturi MASA, care permite împrumuturile USDC pe bază
3 Mai, 2024
Velodrome lansează versiunea Beta a Superchain în săptămânile următoare și se extinde în blockchainurile OP Stack Layer 2
pieţe Buletin de stiri Tehnologia
Velodrome lansează versiunea Beta a Superchain în săptămânile următoare și se extinde în blockchainurile OP Stack Layer 2
3 Mai, 2024
CARV anunță parteneriat cu Aethir pentru a-și descentraliza stratul de date și a distribui recompense
Afaceri Buletin de stiri Tehnologia
CARV anunță parteneriat cu Aethir pentru a-și descentraliza stratul de date și a distribui recompense
3 Mai, 2024
CRYPTOMERIA LABS PTE. LTD.