Rapport de nouvelles Technologie
16 février 2023

ControlNet vous aide à faire des mains parfaites avec Stable Diffusion 1.5

En bref

ControlNet est un moyen facile d'affiner Stable Diffusion.

Il peut être utilisé pour développer des modèles pour un meilleur contrôle SD.

ControlNet est open-source et peut être utilisé en conjonction avec des interfaces Web pour atteindre Stable Diffusion.

La seule chose avec laquelle les générateurs d'IA texte-image ont du mal, ce sont les mains. Alors que les images sont généralement impressionnantes, les mains le sont moins, avec des doigts superflus, des articulations étrangement pliées et un manque évident de compréhension de ce à quoi les mains sont censées ressembler de la part de l'IA. Cependant, cela ne doit pas être le cas, car le nouveau produit ControlNet est là pour vous aider. Stable Diffusion créer des mains parfaites et réalistes.

ControlNet est une nouvelle technologie qui vous permet d'utiliser un croquis, un contour, une profondeur ou une carte normale pour guider les neurones en fonction de Stable Diffusion 1.5. Cela signifie que vous pouvez maintenant avoir des mains presque parfaites sur n'importe quel modèle 1.5 personnalisé tant que vous avez les bons conseils. ControlNet peut être considéré comme un outil révolutionnaire, permettant aux utilisateurs d'avoir un contrôle ultime sur leurs conceptions.

Pour obtenir des mains impeccables, utilisez l'extension A1111 avec ControlNet, en particulier le module Depth. Ensuite, prenez quelques selfies en gros plan de vos mains et téléchargez-les dans l'onglet txt2img de l'interface utilisateur ControlNet. Créez ensuite une simple invite de création de rêves, telle que "illustration fantastique, homme viking montrant les mains en gros plan", et expérimentez la puissance de ControlNet. L'expérimentation avec le module Depth, l'extension A1111 et l'onglet txt2img de l'interface utilisateur ControlNet donnera des mains magnifiques et réalistes.

Poste recommandé: Shutterstock récompense les artistes qui contribuent aux modèles d'IA générative

ControlNet convertit lui-même l'image qui lui est donnée en profondeur, en normales ou en croquis afin de pouvoir l'utiliser ultérieurement comme modèle. Mais, bien sûr, vous pouvez directement télécharger votre propre carte de profondeur ou croquis. Cela permet une flexibilité maximale lors de la création d'une scène 3D, vous permettant de vous concentrer sur le style et la qualité de l'image finale.

Nous vous suggérons fortement de regarder l'excellent Tutoriel ControlNet que Aitrepreneur vient de publier.

ControlNet améliore considérablement le contrôle sur Stable Diffusioncapacités d'image à image de

Bien que Stable Diffusion peut créer des images à partir de texte, il peut également créer des graphiques à partir de modèles. Ce pipeline d'image à image est fréquemment utilisé pour améliorer les photos générées ou créez de nouvelles images à partir de rien à l'aide de modèles.

Tandis que Stable Diffusion 2.0 offre la possibilité d'utiliser les données de profondeur d'une image comme modèle, le contrôle de ce processus est assez restreint. Cette approche n'est pas prise en charge par la version antérieure, 1.5, qui est encore couramment utilisée en raison du nombre énorme de modèles personnalisés, entre autres raisons.

Les poids de chaque bloc de Stable Diffusion sont copiés par ControlNet dans une variante entraînable et une variante verrouillée. La forme bloquée conserve les capacités du modèle de diffusion prêt pour la production, tandis que la variante entraînable peut apprendre de nouvelles conditions pour la synthèse d'images en affinant avec de minuscules ensembles de données.

Contrôle sur Stable DiffusionLes capacités d'image à image de sont grandement améliorées par ControlNet

Stable Diffusion fonctionne avec tous les modèles ControlNet et offre considérablement plus de contrôle sur l'IA générative. L'équipe fournit des échantillons de plusieurs variations de personnes dans des poses fixes, ainsi que diverses photos d'intérieur basées sur la disposition spatiale du modèle et des variations d'images d'oiseaux.

En savoir plus sur l'IA :

Clause de non-responsabilité 

En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.

A propos de l'auteur

Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet. 

Plus d'articles
Damir Yalalov
Damir Yalalov

Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet. 

Le jour de la détermination de la peine arrive : le sort de CZ est en jeu alors que le tribunal américain examine le plaidoyer du DOJ

Changpeng Zhao est sur le point d'être condamné aujourd'hui par un tribunal américain à Seattle.

En savoir plus

Les fondateurs de Samourai Wallet accusés d'avoir facilité 2 milliards de dollars de transactions sur le Darknet

L'appréhension des fondateurs de Samourai Wallet représente un revers notable pour l'industrie, soulignant la persistance...

En savoir plus
Rejoignez notre communauté technologique innovante
En savoir plus
En savoir plus
Pantera Capital investit dans la blockchain TON et exprime sa confiance dans le potentiel de Telegram pour élargir l'accessibilité de la cryptographie
La Brochure Rapport de nouvelles Technologie
Pantera Capital investit dans la blockchain TON et exprime sa confiance dans le potentiel de Telegram pour élargir l'accessibilité de la cryptographie
2 mai 2024
Mitosis lève 7 millions de dollars auprès d'Amber Group et de Foresight Ventures pour faire progresser son protocole de liquidité modulaire
La Brochure Rapport de nouvelles Technologie
Mitosis lève 7 millions de dollars auprès d'Amber Group et de Foresight Ventures pour faire progresser son protocole de liquidité modulaire
2 mai 2024
Galxe s'associe à Jambo pour étendre l'accessibilité mondiale à Web3
La Brochure Rapport de nouvelles Technologie
Galxe s'associe à Jambo pour étendre l'accessibilité mondiale à Web3
2 mai 2024
Med-Gemini de Google s'apprête à donner une longueur d'avance à GPT-4 Avec ses performances supérieures dans le domaine de la santé
AI Wiki Actualité Logiciels Technologie
Med-Gemini de Google s'apprête à donner une longueur d'avance à GPT-4 Avec ses performances supérieures dans le domaine de la santé
2 mai 2024
CRYPTOMERIA LABS PTE. LTD.