Rapport de nouvelles Technologie
24 janvier 2023

StyleGAN-T : La génération de texte à image la plus rapide qui produit des résultats en moins de 0.1 seconde

En bref

StyleGAN-T est un nouveau GAN pour la génération de tex2image.

Ce GAN produit de bons résultats et est même assez rapide (0.1 sec pour une image 512x512).

La nouvelle architecture est basée sur StyleGAN-XL, mais elle réévalue les conceptions du générateur et du discriminateur.

Vous avez sûrement remarqué que les GAN ne sont plus abordés lorsque le sujet de la génération d'images est abordé. Après des modèles de diffusion comme Stable Diffusion ont émergé, les GAN se sont en quelque sorte retirés en arrière-plan. En effet, ils sont difficiles à entraîner et trébuchent fréquemment. Le seul avantage des GAN était que, contrairement aux modèles de diffusion, ils produisent une image en une seule passe (une «passe avant») au lieu de plusieurs passes.

StyleGAN-T : La génération de texte à image la plus rapide en moins de 0.1 seconde

Mais maintenant, un nouveau joueur du GAN est entré sur le terrain : StyleGAN-T. Ce GAN pour la génération tex-to-image produit rapidement de bons résultats, car il ne prend que 0.1 seconde pour une image 512 × 512. La nouvelle architecture est basée sur StyleGAN-XL, mais elle réévalue les conceptions du générateur et du discriminateur et utilise CLIP pour l'alignement des invites de texte et les graphiques générés.

Article connexe: VToonify : un modèle d'IA en temps réel pour générer des vidéos de portraits artistiques

En général, StyleGAN-T crée désormais du texte en image plus rapidement et avec plus de précision que les autres GAN. Cependant, le GAN est toujours horrible et la qualité du modèle SD pleine taille est évidemment hors de question. Mais tout cela dépendra de la capacité à produire des images de très haute qualité à partir de texte en moins d’une seconde par an. De plus, il se situera quelque part entre le GAN et le modèle de diffusion.

Architecture StyleGAN-T
Architecture StyleGAN-T

En savoir plus sur l'IA :

Clause de non-responsabilité 

En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.

A propos de l'auteur

Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet. 

Plus d'articles
Damir Yalalov
Damir Yalalov

Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet. 

Le jour de la détermination de la peine arrive : le sort de CZ est en jeu alors que le tribunal américain examine le plaidoyer du DOJ

Changpeng Zhao est sur le point d'être condamné aujourd'hui par un tribunal américain à Seattle.

En savoir plus

Les fondateurs de Samourai Wallet accusés d'avoir facilité 2 milliards de dollars de transactions sur le Darknet

L'appréhension des fondateurs de Samourai Wallet représente un revers notable pour l'industrie, soulignant la persistance...

En savoir plus
Rejoignez notre communauté technologique innovante
En savoir plus
En savoir plus
Pantera Capital investit dans la blockchain TON et exprime sa confiance dans le potentiel de Telegram pour élargir l'accessibilité de la cryptographie
La Brochure Rapport de nouvelles Technologie
Pantera Capital investit dans la blockchain TON et exprime sa confiance dans le potentiel de Telegram pour élargir l'accessibilité de la cryptographie
2 mai 2024
Mitosis lève 7 millions de dollars auprès d'Amber Group et de Foresight Ventures pour faire progresser son protocole de liquidité modulaire
La Brochure Rapport de nouvelles Technologie
Mitosis lève 7 millions de dollars auprès d'Amber Group et de Foresight Ventures pour faire progresser son protocole de liquidité modulaire
2 mai 2024
Galxe s'associe à Jambo pour étendre l'accessibilité mondiale à Web3
La Brochure Rapport de nouvelles Technologie
Galxe s'associe à Jambo pour étendre l'accessibilité mondiale à Web3
2 mai 2024
Med-Gemini de Google s'apprête à donner une longueur d'avance à GPT-4 Avec ses performances supérieures dans le domaine de la santé
AI Wiki Actualité Logiciels Technologie
Med-Gemini de Google s'apprête à donner une longueur d'avance à GPT-4 Avec ses performances supérieures dans le domaine de la santé
2 mai 2024
CRYPTOMERIA LABS PTE. LTD.