ERNIE-ViLG 2.0: el nou model de text a imatge de Baidu supera a Dalle-2 i Stable Diffusion
En breu
Tant Dalle-2 com Stable Diffusion van ser significativament superiors a ERNIE-ViLG 2.0
ERNIE-ViLG 2.0 és un model de text a imatge que ofereix un millor rendiment que Dalle-2 i Stable Diffusion, dos dels models de text a imatge més populars disponibles actualment. El nou model va ser dissenyat i entrenat per un equip d'investigadors de Baidu, i els resultats són impressionants.
Els resultats van demostrar que ERNIE-ViLG 2.0 va superar significativament el rendiment de Dalle-2 i Stable Diffusion. Aquest és un assoliment important i demostra el poder del marc ERNIE. El Metaverse Post equip va comparar ERNIE-ViLG 2.0 amb Stable Diffusion a continuació:
Aquests resultats donen un fort suport a la hipòtesi que ERNIE-ViLG 2.0 és més eficaç sistema de text a imatge que Dalle-2 i Stable Diffusion.
L'arquitectura Unet des de Stable Diffusion es pren com a base, però amb canvis:
- Una barreja d'experts en denoising: Hi ha 10 xarxes neuronals en lloc d'una, cadascuna de les quals és responsable només de determinats passos de difusió.
- Coneixements textuals: S'han tornat a ponderar automàticament les paraules de la consulta perquè les paraules clau tinguin més pes.
- Coneixement visual: Durant l'entrenament, es van detectar objectes en resultats de generació intermèdia i es va augmentar el pes de la funció de pèrdua a les regions amb objectes.
Com a resultat, el més gran del món model text a imatge va sortir amb 24 mil milions de paràmetres (10 vegades més grans que SD) per entrenar el model.
Les sol·licituds simplement es tradueixen del xinès a l'anglès automàticament al Cara abraçada demostració pública abans de ser enviada a l'IA. D'això surten moltes característiques.
- ERNIE no coneix personalitats públiques internacionals. Per exemple, ERNIE no coneix a Arnold Schwarzenegger. Sens dubte, té els favorits locals a la Xina.
- Com a resultat, el mètode d'utilitzar noms de celebritats en les indicacions per augmentar dràsticament la qualitat de cares falla.
- Podeu esperar una mica de distorsió a causa de la traducció del xinès, de manera que potser us esperen algunes sorpreses si no parleu xinès.
- Ni tan sols sap res de Greg Rutkowski.
Llegeix articles relacionats:
renúncia
En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.
About The Autor
Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet.
més articlesDamir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet.