ERNIE-ViLG 2.0: novi model pretvaranja teksta u sliku tvrtke Baidu nadmašuje Dalle-2 i Stable Diffusion
Ukratko
I Dalle-2 i Stable Diffusion značajno su nadmašili ERNIE-ViLG 2.0
ERNIE-ViLG 2.0 je model teksta u sliku koji nudi bolje performanse od Dalle-2 i Stable Diffusion, dva najpopularnija trenutno dostupna modela teksta u sliku. Novi model dizajnirao je i obučavao tim istraživača iz Baidua, a rezultati oduzimaju dah.
Rezultati su pokazali da je ERNIE-ViLG 2.0 značajno nadmašio Dalle-2 i Stable Diffusion. Ovo je značajno postignuće i pokazuje snagu okvira ERNIE. The Metaverse Post tim je usporedio ERNIE-ViLG 2.0 sa Stable Diffusion u nastavku:
Ovi rezultati snažno podupiru hipotezu da je ERNIE-ViLG 2.0 učinkovitiji sustav tekst-u-sliku nego i Dalle-2 i Stable Diffusion.
Unet arhitektura iz Stable Diffusion uzima se kao osnova, ali uz izmjene:
- Mješavina stručnjaka za uklanjanje šuma: Postoji 10 neuronskih mreža umjesto samo jedne, a svaka je odgovorna samo za određene korake difuzije.
- Tekstualno znanje: Automatski ponovno vaganje riječi u upitu kako bi ključne riječi dobile veću težinu.
- Vizualno znanje: Tijekom treninga, objekti su otkriveni na rezultatima međugeneracije, a težina funkcije gubitka na regijama s objektima je povećana.
Kao rezultat toga, najveći na svijetu model teksta u sliku izašao s 24 milijarde parametara (10 puta veći od SD-a) za treniranje modela.
Upiti se jednostavno automatski prevode s kineskog na engleski u HuggingFace javni demo prije slanja u AI. Mnogo značajki proizlazi iz ovoga.
- ERNIE ne poznaje međunarodne javne osobe. Na primjer, ERNIE ne poznaje Arnolda Schwarzeneggera. Zasigurno ima lokalne favorite u Kini.
- Kao rezultat toga, metoda korištenja imena slavnih u upitima dramatično poboljšava kvalitetu lica ne uspije.
- Možete očekivati neke distorzije zbog prijevoda s kineskog, tako da bi vas mogla čekati neka iznenađenja ako ne govorite kineski.
- Čak ne zna ništa o Gregu Rutkowskom.
Pročitajte povezane članke:
Izjava o odricanju od odgovornosti
U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.
O autoru
Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta.
Više članakaDamir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta.