ERNIE-ViLG 2.0 : Le nouveau modèle texte-image de Baidu surpasse Dalle-2 et Stable Diffusion
En bref
Dalle-2 et Stable Diffusion ont été largement surperformés par ERNIE-ViLG 2.0
ERNIE-ViLG 2.0 est un modèle texte-image qui offre de meilleures performances que Dalle-2 et Stable Diffusion, deux des modèles de conversion de texte en image les plus populaires actuellement disponibles. Le nouveau modèle a été conçu et formé par une équipe de chercheurs de Baidu, et les résultats sont à couper le souffle.
Les résultats ont démontré qu'ERNIE-ViLG 2.0 surpassait significativement Dalle-2 et Stable Diffusion. Il s’agit d’une réalisation importante qui démontre la puissance du cadre ERNIE. Le Metaverse Post L'équipe a comparé ERNIE-ViLG 2.0 avec Stable Diffusion ci-dessous :
Ces résultats appuient fortement l'hypothèse selon laquelle ERNIE-ViLG 2.0 est une solution plus efficace système de texte en image que Dalle-2 et Stable Diffusion.
L'architecture Unet de Stable Diffusion est pris comme base, mais avec des modifications :
- Un mélange d'experts en débruitage : Il existe 10 réseaux de neurones au lieu d'un seul, chacun n'étant responsable que de certaines étapes de diffusion.
- Connaissance textuelle : A repondéré automatiquement les mots dans la requête afin que les mots clés aient plus de poids.
- Connaissance visuelle : Pendant la formation, des objets ont été détectés sur les résultats de génération intermédiaires et le poids de la fonction de perte sur les régions avec des objets a été augmenté.
En conséquence, le plus grand du monde modèle texte-image est sorti avec 24 milliards de paramètres (10 fois plus grands que SD) pour former le modèle.
Les invites sont simplement traduites du chinois vers l'anglais automatiquement dans le Étreindre démo publique avant d'être envoyé dans l'IA. De nombreuses fonctionnalités en découlent.
- ERNIE ne connaît pas de personnalités publiques internationales. Par exemple, ERNIE ne connaît pas Arnold Schwarzenegger. Il a certainement des favoris locaux en Chine.
- En conséquence, la méthode consistant à utiliser des noms de célébrités dans les invites permet d'améliorer considérablement la qualité de l'information. visages échoue.
- Vous pouvez vous attendre à une certaine distorsion à cause de la traduction du chinois, donc il pourrait y avoir des surprises pour vous si vous ne parlez pas chinois.
- Il ne sait même rien de Greg Rutkowski.
Lire des articles connexes:
Clause de non-responsabilité
En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.
A propos de l'auteur
Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet.
Plus d'articlesDamir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet.