So erzeugen Sie eine Bildmorphing-Animation mit ControlNet
Aufgrund eines früheren Experiments führend hatten wir die Idee, das ControlNet zum Morphen zu verwenden. Erst dann wechselten wir zur Verwendung des Depth2img-Modells, das anstelle von ControlNet ein Bild aus einer Tiefenkarte erstellen kann. Und das ControlNet kann nicht nur in der Tiefe funktionieren. Dieser Beitrag hat mehr Informationen über die Technik.
Ich gebe Ihnen einen kurzen Überblick über das Verfahren. Die Denoising-Stärke-Option, die sich auf die Anzahl der Schritte während der Generierung auswirkt, steht uns zur Verfügung, wenn wir ein Bild in img2img generieren. Beispiel: Bei Steps = 30 und Entrauschungsstärke = 0.5 bleiben nur noch 15 Steps zu erstellen. Diese Argumentation kann auf das Animieren des Morphs angewendet werden. Sie können jedes Bild morphen; Porträts sind nicht die einzigen, die gemacht werden können.
Nehmen Sie das Originalbild. Aktivieren Sie das ControlNet, während Sie das Bildfeld leer lassen. Wählen Sie Seed als -1, um zufällige Tests zu generieren; Chargenanzahl beeinflusst ihre Menge. Sie können mit den Führungsparametern, dem Gewicht der empfangenen Karte und dem ControlNet-Modus experimentieren. Wenn Ihnen die Generierung gefällt, ziehen Sie sie mit der Maus auf img2img und wiederholen Sie den Vorgang, indem Sie nach dem Bild suchen, das das zweite Bild schließlich werden wird. Wenn jedes Bild fertig ist, stellt sich die Frage, wie man eine Animation erstellt. (Denken Sie am Anfang daran, die Stapelanzahl auf 1 zu setzen, um das Erstellen zusätzlicher Fotos zu vermeiden.)
Wir werden jetzt eine faszinierende Lösung verwenden, aber ich werde später über ihre Mängel sprechen.
Der XYZ-Plot wird verwendet; Sie müssen es aus der Skriptliste auswählen. Dadurch können wir nicht nur das endgültige Bild, sondern auch den Übergang vom Quellbild erstellen.
X-Werte in wir geben die Zeile ein, die lautet:
0.0.296.0.39.0.459.0.515.0.563.0.606.0.644.0.68.0.713.0.743.0.772.0.799.0.825.0.85.0.874.0.897.0.919.0.94.0.961
Das bedeutet, dass wir zu Beginn der Generierung 21 Bilder statt nur einem erhalten (die Anzahl der durch Kommas getrennten Werte). Warum ist diese Zeile da? Beispielsweise kann es anders aussehen.
Dieses Format macht es einfacher zu verstehen: Sie fordern 20 Bilder vom Automaten an und bitten ihn, zu demonstrieren, wie sich die Entrauschung auf das Ergebnis für Werte im Bereich von 0 bis 1 auswirkt. Der Nachteil der zweiten Option besteht darin, dass sie zu einer linearen Änderung der Werte führt , aufgrund der Eigenschaften der Rauschunterdrückung scheint es kein realistisches Morphing zu sein. Zahlen nahe Null haben fast keinen Einfluss auf das Ergebnis. und bei Werten über 0.5 beginnt es sehr merklich zu beeinflussen.
Als Ergebnis ist die erste Zeile eine Kurve vom Typ x.4 oder x um 0.4 erhöht. Eine gerade, lineare Funktion und eine gekrümmte Funktion, die eine genauere Ausgabe erzeugt, werden im Bild kontrastiert. Sie können einen Mixer verwenden, um eine solche Zeichenfolge zu erstellen.
Sie müssen die Anzahl der Frames für den Übergang auswählen, bevor Sie Ihre Linie erstellen. Es kann in den Projekteinstellungen bearbeitet werden.
Sie müssen mehrere Schritte ausführen, um eine Linie zu erhalten. Experimentieren Sie zunächst mit der Form der Kurve. Wählen Sie dazu im Kontextmenü des Animationsparameters „Delete Keyframes“.
Hier ist die Formel zum Erhalten der Kurve; Der Parameter wurde blau, was anzeigt, dass der Treiber darin arbeitet.
Hier können Sie mit dem Wert herumspielen. 4. Vermeiden Sie es jedoch, zu tief zu gehen. frame/21 bezeichnet eine Werteverschiebung von 0 nach 1 bei Frame 0 bis Frame 21. Es bleiben nur Werte zwischen 1 und 20 Frames übrig.
Trotzdem sind die Schlüssel nicht der Treiber. Sie müssen erst vorbereitet werden. Klicken Sie dazu im 3D-Fenster auf Objekt > Animation > Bake-Aktion und dann auf OK.
Dies wirkt sich jedoch auf alle möglichen Schlüssel des Objekts aus und sollte gelöscht werden. Wählen Sie alles außer der ersten Zeile aus und drücken Sie X auf der Tastatur (die Maus sollte sich unter der Liste befinden).
Und jetzt, um die Zeile auf der linken Seite des Bildschirms zu erhalten, klicken Sie auf Play und öffnen Sie das Konsolenfenster.
Habe eine Zeichenfolge, die kopiert werden kann.
Um nun die Animation zu erstellen, müssen Sie diesen Vorgang für jede Bildposition, die zu Beginn erstellt wurde, separat durchführen und sie dann in einem Videoeditor zu einer Animation zusammensetzen.
Ja, der Prozess ist noch nicht automatisiert, aber Sie können alles vollständig für sich selbst anpassen. Sie können das Generierungsmodell und das ControlNet-Modell und den Modus ändern, den Vorprozess aktivieren oder deaktivieren oder alles andere, was Sie möchten. Die Hauptsache ist, gute Ergebnisse nicht zu verlieren und dann alles richtig zu wiederholen, um eine Animation zu erstellen.
Nachteile der Technologie – Sie sollten nicht viel Vorarbeit für den Übergang leisten. Wir haben oben geschrieben, dass die Rauschunterdrückung die Anzahl der Schritte beeinflusst. Es kann sich herausstellen, dass die Ausgabe Bilder dupliziert, da mehrere Rauschunterdrückungswerte innerhalb derselben Anzahl von Schritten liegen. Ihre Anzahl kann in der automatischen Konsole beobachtet werden.
Diese Technologie kann in Verbindung mit Interpolator-Verzögerern verwendet werden, d. h. Senden der Animation zum Vervollständigen der fehlenden Frames; Dies führt zu sanfteren Änderungen.
Lesen Sie weitere verwandte Artikel:
Haftungsausschluss
Im Einklang mit der Richtlinien des Trust-ProjektsBitte beachten Sie, dass die auf dieser Seite bereitgestellten Informationen nicht als Rechts-, Steuer-, Anlage-, Finanz- oder sonstige Beratung gedacht sind und nicht als solche interpretiert werden sollten. Es ist wichtig, nur so viel zu investieren, wie Sie sich leisten können, zu verlieren, und im Zweifelsfall eine unabhängige Finanzberatung einzuholen. Für weitere Informationen empfehlen wir einen Blick auf die Allgemeinen Geschäftsbedingungen sowie die Hilfe- und Supportseiten des Herausgebers oder Werbetreibenden. MetaversePost ist einer genauen, unvoreingenommenen Berichterstattung verpflichtet, die Marktbedingungen können sich jedoch ohne Vorankündigung ändern.
Über den Autor
Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein.
Weitere ArtikelDamir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein.