Informe de notícies
Novembre 06, 2022

ERNIE-ViLG 2.0: el nou model de text a imatge de Baidu supera a Dalle-2 i Stable Diffusion

En breu

Tant Dalle-2 com Stable Diffusion van ser significativament superiors a ERNIE-ViLG 2.0

ERNIE-ViLG 2.0 és un model de text a imatge que ofereix un millor rendiment que Dalle-2 i Stable Diffusion, dos dels models de text a imatge més populars disponibles actualment. El nou model va ser dissenyat i entrenat per un equip d'investigadors de Baidu, i els resultats són impressionants.

El nou model de text a imatge ERNIE-ViLG 2.0 supera Dalle-2 i Stable Diffusion
La imatge creada per ERNIE-ViLG 2.0

Els resultats van demostrar que ERNIE-ViLG 2.0 va superar significativament el rendiment de Dalle-2 i Stable Diffusion. Aquest és un assoliment important i demostra el poder del marc ERNIE. El Metaverse Post equip va comparar ERNIE-ViLG 2.0 amb Stable Diffusion a continuació:

ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0

Aquests resultats donen un fort suport a la hipòtesi que ERNIE-ViLG 2.0 és més eficaç sistema de text a imatge que Dalle-2 i Stable Diffusion.

L'arquitectura Unet des de Stable Diffusion es pren com a base, però amb canvis:

  • Una barreja d'experts en denoising: Hi ha 10 xarxes neuronals en lloc d'una, cadascuna de les quals és responsable només de determinats passos de difusió.
  • Coneixements textuals: S'han tornat a ponderar automàticament les paraules de la consulta perquè les paraules clau tinguin més pes.
  • Coneixement visual: Durant l'entrenament, es van detectar objectes en resultats de generació intermèdia i es va augmentar el pes de la funció de pèrdua a les regions amb objectes.

Com a resultat, el més gran del món model text a imatge va sortir amb 24 mil milions de paràmetres (10 vegades més grans que SD) per entrenar el model.

En comparació amb els models anteriors, ERNIE-ViLG 2.0 els supera molt en termes de qualitat d'imatge i de concordança d'imatge a text quan es prova simultàniament al ViLG-300 bilingüe. Prompt establert per una persona.

Les sol·licituds simplement es tradueixen del xinès a l'anglès automàticament al Cara abraçada demostració pública abans de ser enviada a l'IA. D'això surten moltes característiques.

  • ERNIE no coneix personalitats públiques internacionals. Per exemple, ERNIE no coneix a Arnold Schwarzenegger. Sens dubte, té els favorits locals a la Xina.
  • Com a resultat, el mètode d'utilitzar noms de celebritats en les indicacions per augmentar dràsticament la qualitat de cares falla.
  • Podeu esperar una mica de distorsió a causa de la traducció del xinès, de manera que potser us esperen algunes sorpreses si no parleu xinès.
  • Ni tan sols sap res de Greg Rutkowski.

Llegeix articles relacionats:

renúncia

En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.

About The Autor

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet. 

més articles
Damir Yalalov
Damir Yalalov

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet. 

Hot Stories
Uneix-te al nostre butlletí.
Últimes notícies

Arriba el dia de la sentència: el destí de CZ està en equilibri mentre el tribunal nord-americà considera la petició del DOJ

Changpeng Zhao està a punt d'enfrontar-se avui a la sentència en un tribunal dels Estats Units a Seattle.

saber Més

Fundadors de Samourai Wallet acusats de facilitar 2 milions de dòlars en ofertes de Darknet

L'aprehensió dels fundadors de Samourai Wallet representa un revés notable per a la indústria, subratllant la persistent ...

saber Més
Uneix-te a la nostra comunitat tecnològica innovadora
Més...
Llegeix més
Ankr col·labora amb AI Blockchain Platform Talus Network per desbloquejar Bitcoin Liquidity per a AI
Negocis Informe de notícies Tecnologia
Ankr col·labora amb AI Blockchain Platform Talus Network per desbloquejar Bitcoin Liquidity per a AI
Pot 1, 2024
Binance Labs admet Movement Labs per facilitar la integració de Move de Facebook a través de Blockchains
Negocis Informe de notícies Tecnologia
Binance Labs admet Movement Labs per facilitar la integració de Move de Facebook a través de Blockchains
Pot 1, 2024
Solució de comerç de monedes estables de BRICS Nations Eye
Negocis mercats Històries i ressenyes Tecnologia
Solució de comerç de monedes estables de BRICS Nations Eye
Pot 1, 2024
Bitcoin L2 Network BOB s'integra amb LayerZero per a una funcionalitat millorada
Negocis Informe de notícies Tecnologia
Bitcoin L2 Network BOB s'integra amb LayerZero per a una funcionalitat millorada
Pot 1, 2024
CRYPTOMERIA LABS PTE. LTD.