Rapport de nouvelles Technologie
22 novembre 2023

Des chercheurs du MIT et de Google présentent StableRep, un modèle d'IA pour renforcer la production d'images

En bref

Les informaticiens du MIT et de Google ont dévoilé StableRep, un modèle d'IA qui transforme les invites textuelles en images précises à l'aide de Stable Diffusion.

Des chercheurs du MIT et de Google présentent un programme d'IA, améliorant la production d'images à partir d'invites

MIT et de Google des informaticiens ont dévoilé StableRep, un modèle d'IA conçu pour transformer des légendes écrites descriptives en images correspondantes précises à l'aide d'images générées par Stable Diffusion. Cet outil vise à améliorer la capacité des réseaux de neurones à générer des images basées sur des descriptions textuelles.

Selon les chercheurs, les images synthétiques peuvent aider les modèles d’IA à apprendre les représentations visuelles avec plus de précision que les photographies réelles.

StableRep vise à permettre aux chercheurs de gérer le processus algorithmique d'apprentissage automatique en entraînant un modèle sur une multitude d'images générées par Stable Diffusion en réponse à la même invite. Ainsi, le modèle apprendra une gamme plus large de représentations visuelles, defidéterminer quelles images correspondent étroitement aux invites données.

Les chercheurs envisagent l’émergence d’un écosystème de modèles d’IA, dont certains seront formés sur des données réelles ou synthétiques. Actuellement, les efforts se concentrent sur l’apprentissage du modèle pour en apprendre davantage sur les concepts de haut niveau grâce à la compréhension contextuelle et à la variabilité, au lieu de simplement lui fournir des données.

StableRep aidera les développeurs et les moteurs d'IA 

Au cœur de modèles texte-image réside leur capacité à lier des objets avec des mots. Lorsqu'ils sont présentés avec une invite de saisie de texte, ces modèles doivent générer une image qui correspond étroitement à la description fournie. Pour y parvenir, ils doivent acquérir une compréhension des représentations visuelles d’objets du monde réel.

Selon un récent papier pré-imprimé sur arXiv, StableRep surpasse SimCLR et CLIP en termes de représentations apprises en utilisant le même ensemble d'invites textuelles et d'images réelles correspondantes sur des ensembles de données à grande échelle, en s'appuyant uniquement sur des images synthétiques. 

L'article poursuit : « Lorsque nous introduisons davantage la supervision du langage, StableRep formé avec 20 millions d'images synthétiques atteint une meilleure précision que CLIP formé avec 50 millions d'images réelles. »

SimCLR et CLIP sont des algorithmes d'apprentissage automatique utilisés pour générer des images à partir d'invites textuelles.

Cette approche innovante permet aux développeurs d'IA de former des réseaux de neurones avec moins d'images synthétiques que d'images réelles tout en obtenant de meilleurs résultats. L'émergence de méthodes de type StableRep suggère un avenir dans lequel les modèles texte-image pourraient être formés principalement sur des données synthétiques, réduisant ainsi la dépendance à l'égard d'images réelles et prenant en charge les moteurs d'IA face aux limitations des ressources en ligne disponibles.

Clause de non-responsabilité 

En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.

A propos de l'auteur

Alisa, journaliste dévouée au MPost, se spécialise dans les crypto-monnaies, les preuves sans connaissance, les investissements et le vaste domaine de Web3. Avec un œil attentif sur les tendances et technologies émergentes, elle propose une couverture complète pour informer et impliquer les lecteurs dans le paysage en constante évolution de la finance numérique.

Plus d'articles
Alice Davidson
Alice Davidson

Alisa, journaliste dévouée au MPost, se spécialise dans les crypto-monnaies, les preuves sans connaissance, les investissements et le vaste domaine de Web3. Avec un œil attentif sur les tendances et technologies émergentes, elle propose une couverture complète pour informer et impliquer les lecteurs dans le paysage en constante évolution de la finance numérique.

Hot Stories
Rejoignez notre newsletter.
Dernières infos

De Ripple au Big Green DAO : comment les projets de crypto-monnaie contribuent à la charité

Explorons les initiatives exploitant le potentiel des monnaies numériques pour des causes caritatives.

En savoir plus

AlphaFold 3, Med-Gemini et autres : la façon dont l'IA transforme les soins de santé en 2024

L'IA se manifeste de diverses manières dans le domaine des soins de santé, de la découverte de nouvelles corrélations génétiques à l'autonomisation des systèmes chirurgicaux robotisés...

En savoir plus
Rejoignez notre communauté technologique innovante
En savoir plus
En savoir plus
Top 10 des outils d'IA gratuits pour la création de contenu, le montage vidéo et bien plus encore
AI Wiki Digérer Éducation Lifestyle Logiciels Technologie
Top 10 des outils d'IA gratuits pour la création de contenu, le montage vidéo et bien plus encore
14 mai 2024
La Commission des valeurs mobilières de Hong Kong met en garde contre les escroqueries Deepfake ciblant l'industrie de la cryptographie : implications pour la sécurité des investisseurs
Lifestyle Sécurité Wiki Logiciels Histoires et critiques Technologie
La Commission des valeurs mobilières de Hong Kong met en garde contre les escroqueries Deepfake ciblant l'industrie de la cryptographie : implications pour la sécurité des investisseurs
14 mai 2024
Ripple et Evmos collaborent sur le développement de la sidechain XRP Ledger EVM avec la technologie EvmOS
La Brochure Rapport de nouvelles Technologie
Ripple et Evmos collaborent sur le développement de la sidechain XRP Ledger EVM avec la technologie EvmOS
14 mai 2024
5ireChain lance « Testnet Thunder : GA » incitatif pour les tests de résistance du réseau et invite les utilisateurs à participer Airdrop Programme de fidélité
Rapport de nouvelles Technologie
5ireChain lance « Testnet Thunder : GA » incitatif pour les tests de résistance du réseau et invite les utilisateurs à participer Airdrop Programme de fidélité
14 mai 2024
CRYPTOMERIA LABS PTE. LTD.