Vijesti
Studenog 06, 2022

ERNIE-ViLG 2.0: novi model pretvaranja teksta u sliku tvrtke Baidu nadmašuje Dalle-2 i Stable Diffusion

Ukratko

I Dalle-2 i Stable Diffusion značajno su nadmašili ERNIE-ViLG 2.0

ERNIE-ViLG 2.0 je model teksta u sliku koji nudi bolje performanse od Dalle-2 i Stable Diffusion, dva najpopularnija trenutno dostupna modela teksta u sliku. Novi model dizajnirao je i obučavao tim istraživača iz Baidua, a rezultati oduzimaju dah.

Novi model teksta u sliku ERNIE-ViLG 2.0 nadmašuje Dalle-2 i Stable Diffusion
Slika koju je izradio ERNIE-ViLG 2.0

Rezultati su pokazali da je ERNIE-ViLG 2.0 značajno nadmašio Dalle-2 i Stable Diffusion. Ovo je značajno postignuće i pokazuje snagu okvira ERNIE. The Metaverse Post tim je usporedio ERNIE-ViLG 2.0 sa Stable Diffusion u nastavku:

ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0

Ovi rezultati snažno podupiru hipotezu da je ERNIE-ViLG 2.0 učinkovitiji sustav tekst-u-sliku nego i Dalle-2 i Stable Diffusion.

Unet arhitektura iz Stable Diffusion uzima se kao osnova, ali uz izmjene:

  • Mješavina stručnjaka za uklanjanje šuma: Postoji 10 neuronskih mreža umjesto samo jedne, a svaka je odgovorna samo za određene korake difuzije.
  • Tekstualno znanje: Automatski ponovno vaganje riječi u upitu kako bi ključne riječi dobile veću težinu.
  • Vizualno znanje: Tijekom treninga, objekti su otkriveni na rezultatima međugeneracije, a težina funkcije gubitka na regijama s objektima je povećana.

Kao rezultat toga, najveći na svijetu model teksta u sliku izašao s 24 milijarde parametara (10 puta veći od SD-a) za treniranje modela.

U usporedbi s ranijim modelima, ERNIE-ViLG 2.0 uvelike ih nadmašuje u pogledu kvalitete slike i podudaranja slike i teksta kada se istovremeno testira na dvojezičnom ViLG-300 brz postavila osoba.

Upiti se jednostavno automatski prevode s kineskog na engleski u HuggingFace javni demo prije slanja u AI. Mnogo značajki proizlazi iz ovoga.

  • ERNIE ne poznaje međunarodne javne osobe. Na primjer, ERNIE ne poznaje Arnolda Schwarzeneggera. Zasigurno ima lokalne favorite u Kini.
  • Kao rezultat toga, metoda korištenja imena slavnih u upitima dramatično poboljšava kvalitetu lica ne uspije.
  • Možete očekivati ​​neke distorzije zbog prijevoda s kineskog, tako da bi vas mogla čekati neka iznenađenja ako ne govorite kineski.
  • Čak ne zna ništa o Gregu Rutkowskom.

Pročitajte povezane članke:

Izjava o odricanju od odgovornosti

U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.

O autoru

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Više članaka
Damir Yalalov
Damir Yalalov

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Hot Stories

BRICS Nations Eye Stablecoin Trade Solution

by Viktorija Palčik
Neka 01, 2024
Pridružite se našem biltenu.
Najnovije vijesti

Stiže dan izricanja presude: CZ-ova sudbina visi na ravnoteži dok američki sud razmatra izjavu DOJ-a

Changpeng Zhao danas će se suočiti s kaznom na američkom sudu u Seattleu.

Znati više

Osnivači novčanika Samourai optuženi za omogućavanje 2 milijarde dolara u poslovima Darkneta

Uhićenje osnivača Samourai Walleta predstavlja značajno nazadovanje u industriji, naglašavajući upornu ...

Znati više
Pridružite se našoj zajednici inovativnih tehnologija
opširnije
Čitaj više
Ankr surađuje s AI Blockchain platformom Talus Network kako bi otključao Bitcoin likvidnost za AI
posao Vijesti Tehnologija
Ankr surađuje s AI Blockchain platformom Talus Network kako bi otključao Bitcoin likvidnost za AI
Neka 1, 2024
Binance Labs podržava Movement Labs kako bi olakšao Facebookovu integraciju Move preko Blockchaina
posao Vijesti Tehnologija
Binance Labs podržava Movement Labs kako bi olakšao Facebookovu integraciju Move preko Blockchaina
Neka 1, 2024
BRICS Nations Eye Stablecoin Trade Solution
posao tržišta Priče i recenzije Tehnologija
BRICS Nations Eye Stablecoin Trade Solution
Neka 1, 2024
Bitcoin L2 mreža BOB integrira se s LayerZero za poboljšanu funkcionalnost
posao Vijesti Tehnologija
Bitcoin L2 mreža BOB integrira se s LayerZero za poboljšanu funkcionalnost
Neka 1, 2024
CRYPTOMERIA LABS PTE. LTD.