AI Wiki
06 mars 2023

Comment générer une animation de morphing d'image avec ControlNet

En raison d'une expérience antérieure conduired, nous avons eu l'idée d'utiliser le ControlNet pour le morphing. Ce n'est qu'alors que nous sommes passés à l'utilisation du modèle depth2img, qui peut créer une image à partir d'une carte de profondeur, plutôt que le ControlNet. Et le ControlNet peut fonctionner non seulement en profondeur. Ce poste a plus d'informations sur la technique.

Comment générer une animation de morphing d'image avec ControlNet

Je vous explique rapidement la procédure. L'option de force de débruitage, qui impacte le nombre d'étapes lors de la génération, nous est disponible si nous générons une image dans img2img. Par exemple, avec des pas = 30 et une force de débruitage = 0.5, il ne restera que 15 pas à créer. Ce raisonnement peut être appliqué à l'animation de la morph. Vous pouvez transformer n'importe quelle image ; les portraits ne sont pas les seuls que l'on puisse faire.

Prenez la photo originale. Activez le ControlNet tout en laissant la zone d'image vide. Choisissez la graine à -1 pour générer des tests aléatoires ; le nombre de lots influence leur quantité. Vous pouvez tester les paramètres de guidage, le poids de la carte reçue et le mode ControlNet. Si vous aimez la génération, faites-la glisser avec la souris vers img2img, puis répétez le processus en recherchant l'image que la deuxième image deviendra éventuellement. Au fur et à mesure que chaque image est terminée, la question de savoir comment créer une animation émerge. (Pour commencer, n'oubliez pas de régler le nombre de lots sur 1 pour éviter de créer des photos supplémentaires.)

Nous allons utiliser une solution intrigante pour le moment, mais je parlerai de ses défauts plus tard.

Le tracé XYZ sera utilisé ; vous devez le choisir dans la liste Script. Cela nous permettra de créer non seulement l'image finale, mais également la transition à partir de l'image source.

X valeurs dans nous mettons dans la ligne qui lit:

0.0.296.0.39.0.459.0.515.0.563.0.606.0.644.0.68.0.713.0.743.0.772.0.799.0.825.0.85.0.874.0.897.0.919.0.94.0.961.

Cela signifie qu'au début de la génération, nous recevrons 21 images au lieu d'une seule (le nombre de valeurs séparées par des virgules). Pourquoi cette ligne est-elle là ? Par exemple, il peut apparaître différemment.

Ce format simplifie la compréhension : vous demandez 20 images à l'automatisation et lui demandez de démontrer comment le débruitage aura un impact sur le résultat pour des valeurs allant de 0 à 1. L'inconvénient de la deuxième option est qu'elle entraîne un changement linéaire des valeurs. , en raison des caractéristiques du débruitage, il ne semble pas être un morphing réaliste. Les nombres proches de zéro n'ont presque aucun effet sur le résultat. et à des niveaux supérieurs à 0.5, , il commence à influencer très sensiblement.

Il en résulte que la première ligne est une courbe du type x.4, soit x majoré de 0.4. Une fonction droite et linéaire et une courbe, qui produiront une sortie plus précise, sont contrastées dans l'image. Vous pouvez utiliser un mélangeur pour créer une telle chaîne.

Vous devez choisir le nombre d'images pour la transition avant de créer votre ligne. Il est modifiable dans les paramètres du projet.

Vous devez effectuer plusieurs étapes afin d'obtenir une ligne. Tout d'abord, expérimentez avec la forme de la courbe. Pour ce faire, sélectionnez "Supprimer les images clés" dans le menu contextuel du paramètre d'animation.

Voici la formule pour obtenir la courbe; le paramètre est devenu bleu, indiquant que le pilote y travaille.

Vous pouvez jouer avec la valeur ici. 4. Mais évitez de descendre trop bas. frame/21 indique un décalage de valeur de 0 à 1 de l'image 0 à l'image 21. Seules les valeurs comprises entre 1 et 20 images sont conservées.

Néanmoins, les clés ne sont pas le conducteur. Ils doivent d'abord être préparés. Pour ce faire, cliquez sur Objet> Animation> Bake Action dans la fenêtre 3d, puis cliquez sur OK.

Cependant, cela affectera toutes les clés possibles de l'objet, et elles doivent être supprimées. Sélectionnez tout sauf la première ligne et appuyez sur X sur le clavier (la souris doit se trouver sous la liste).

Et maintenant, pour obtenir la ligne sur le côté gauche de l'écran, cliquez sur jouer et ouvrez la fenêtre de la console.

Vous avez une chaîne qui peut être copiée.

Maintenant, pour créer l'animation, vous devez effectuer ce processus séparément pour chaque position d'image créée au début, puis l'assembler en animation dans un éditeur vidéo.

Oui, le processus n'est pas encore automatisé, mais vous pouvez tout personnaliser entièrement par vous-même. Vous pouvez modifier le modèle de génération et le modèle et le mode ControlNet, activer ou désactiver le prétraitement, ou tout autre élément de votre choix. L'essentiel est de ne pas perdre de bons résultats, puis de tout répéter correctement pour créer une animation.

Inconvénients de la technologie - vous ne devriez pas jeter beaucoup de bases pour la transition. Nous avons écrit plus haut que le débruitage affecte le nombre de pas. Il peut s'avérer que la sortie dupliquera les images car plusieurs valeurs de débruitage seront comprises dans le même nombre d'étapes. Leur nombre peut être observé dans la console automatique.

Cette technologie peut être utilisée en conjonction avec des retardateurs d'interpolation, c'est-à-dire envoyer l'animation pour compléter les images manquantes ; cela donnera des changements plus fluides.

Source originale

Lire plus d'articles connexes:

Mots clés:

Clause de non-responsabilité 

En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.

A propos de l'auteur

Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet. 

Plus d'articles
Damir Yalalov
Damir Yalalov

Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet. 

L’appétit institutionnel augmente pour les ETF Bitcoin dans un contexte de volatilité

Les divulgations via les dépôts 13F révèlent que des investisseurs institutionnels notables se sont lancés dans les ETF Bitcoin, soulignant une acceptation croissante de...

En savoir plus

Le jour de la détermination de la peine arrive : le sort de CZ est en jeu alors que le tribunal américain examine le plaidoyer du DOJ

Changpeng Zhao est sur le point d'être condamné aujourd'hui par un tribunal américain à Seattle.

En savoir plus
Rejoignez notre communauté technologique innovante
En savoir plus
En savoir plus
Med-Gemini de Google s'apprête à donner une longueur d'avance à GPT-4 Avec ses performances supérieures dans le domaine de la santé
AI Wiki Actualité Logiciels Technologie
Med-Gemini de Google s'apprête à donner une longueur d'avance à GPT-4 Avec ses performances supérieures dans le domaine de la santé
2 mai 2024
La renaissance de l’IA dans le développement de jeux en 2024
AI Wiki Métaverse Wiki Éducation Marchés Logiciels Technologie
La renaissance de l’IA dans le développement de jeux en 2024
1 mai 2024
Défis possibles liés à l’intégration de l’IA dans les contrats intelligents tout en équilibrant innovation et sécurité
AI Wiki Sécurité Wiki Logiciels Histoires et critiques Technologie
Défis possibles liés à l’intégration de l’IA dans les contrats intelligents tout en équilibrant innovation et sécurité
29 avril 2024
Les pièces d'IA font des vagues dans le monde de la cryptographie : performances, cas d'utilisation et prochaines étapes
AI Wiki Crypto Wiki Histoires et critiques Technologie
Les pièces d'IA font des vagues dans le monde de la cryptographie : performances, cas d'utilisation et prochaines étapes
26 avril 2024
CRYPTOMERIA LABS PTE. LTD.