AI Wiki
06. März 2023

So erzeugen Sie eine Bildmorphing-Animation mit ControlNet

Aufgrund eines früheren Experiments führend hatten wir die Idee, das ControlNet zum Morphen zu verwenden. Erst dann wechselten wir zur Verwendung des Depth2img-Modells, das anstelle von ControlNet ein Bild aus einer Tiefenkarte erstellen kann. Und das ControlNet kann nicht nur in der Tiefe funktionieren. Dieser Beitrag hat mehr Informationen über die Technik.

So erzeugen Sie eine Bildmorphing-Animation mit ControlNet

Ich gebe Ihnen einen kurzen Überblick über das Verfahren. Die Denoising-Stärke-Option, die sich auf die Anzahl der Schritte während der Generierung auswirkt, steht uns zur Verfügung, wenn wir ein Bild in img2img generieren. Beispiel: Bei Steps = 30 und Entrauschungsstärke = 0.5 bleiben nur noch 15 Steps zu erstellen. Diese Argumentation kann auf das Animieren des Morphs angewendet werden. Sie können jedes Bild morphen; Porträts sind nicht die einzigen, die gemacht werden können.

Nehmen Sie das Originalbild. Aktivieren Sie das ControlNet, während Sie das Bildfeld leer lassen. Wählen Sie Seed als -1, um zufällige Tests zu generieren; Chargenanzahl beeinflusst ihre Menge. Sie können mit den Führungsparametern, dem Gewicht der empfangenen Karte und dem ControlNet-Modus experimentieren. Wenn Ihnen die Generierung gefällt, ziehen Sie sie mit der Maus auf img2img und wiederholen Sie den Vorgang, indem Sie nach dem Bild suchen, das das zweite Bild schließlich werden wird. Wenn jedes Bild fertig ist, stellt sich die Frage, wie man eine Animation erstellt. (Denken Sie am Anfang daran, die Stapelanzahl auf 1 zu setzen, um das Erstellen zusätzlicher Fotos zu vermeiden.)

Wir werden jetzt eine faszinierende Lösung verwenden, aber ich werde später über ihre Mängel sprechen.

Der XYZ-Plot wird verwendet; Sie müssen es aus der Skriptliste auswählen. Dadurch können wir nicht nur das endgültige Bild, sondern auch den Übergang vom Quellbild erstellen.

X-Werte in wir geben die Zeile ein, die lautet:

0.0.296.0.39.0.459.0.515.0.563.0.606.0.644.0.68.0.713.0.743.0.772.0.799.0.825.0.85.0.874.0.897.0.919.0.94.0.961

Das bedeutet, dass wir zu Beginn der Generierung 21 Bilder statt nur einem erhalten (die Anzahl der durch Kommas getrennten Werte). Warum ist diese Zeile da? Beispielsweise kann es anders aussehen.

Dieses Format macht es einfacher zu verstehen: Sie fordern 20 Bilder vom Automaten an und bitten ihn, zu demonstrieren, wie sich die Entrauschung auf das Ergebnis für Werte im Bereich von 0 bis 1 auswirkt. Der Nachteil der zweiten Option besteht darin, dass sie zu einer linearen Änderung der Werte führt , aufgrund der Eigenschaften der Rauschunterdrückung scheint es kein realistisches Morphing zu sein. Zahlen nahe Null haben fast keinen Einfluss auf das Ergebnis. und bei Werten über 0.5 beginnt es sehr merklich zu beeinflussen.

Als Ergebnis ist die erste Zeile eine Kurve vom Typ x.4 oder x um 0.4 erhöht. Eine gerade, lineare Funktion und eine gekrümmte Funktion, die eine genauere Ausgabe erzeugt, werden im Bild kontrastiert. Sie können einen Mixer verwenden, um eine solche Zeichenfolge zu erstellen.

Sie müssen die Anzahl der Frames für den Übergang auswählen, bevor Sie Ihre Linie erstellen. Es kann in den Projekteinstellungen bearbeitet werden.

Sie müssen mehrere Schritte ausführen, um eine Linie zu erhalten. Experimentieren Sie zunächst mit der Form der Kurve. Wählen Sie dazu im Kontextmenü des Animationsparameters „Delete Keyframes“.

Hier ist die Formel zum Erhalten der Kurve; Der Parameter wurde blau, was anzeigt, dass der Treiber darin arbeitet.

Hier können Sie mit dem Wert herumspielen. 4. Vermeiden Sie es jedoch, zu tief zu gehen. frame/21 bezeichnet eine Werteverschiebung von 0 nach 1 bei Frame 0 bis Frame 21. Es bleiben nur Werte zwischen 1 und 20 Frames übrig.

Trotzdem sind die Schlüssel nicht der Treiber. Sie müssen erst vorbereitet werden. Klicken Sie dazu im 3D-Fenster auf Objekt > Animation > Bake-Aktion und dann auf OK.

Dies wirkt sich jedoch auf alle möglichen Schlüssel des Objekts aus und sollte gelöscht werden. Wählen Sie alles außer der ersten Zeile aus und drücken Sie X auf der Tastatur (die Maus sollte sich unter der Liste befinden).

Und jetzt, um die Zeile auf der linken Seite des Bildschirms zu erhalten, klicken Sie auf Play und öffnen Sie das Konsolenfenster.

Habe eine Zeichenfolge, die kopiert werden kann.

Um nun die Animation zu erstellen, müssen Sie diesen Vorgang für jede Bildposition, die zu Beginn erstellt wurde, separat durchführen und sie dann in einem Videoeditor zu einer Animation zusammensetzen.

Ja, der Prozess ist noch nicht automatisiert, aber Sie können alles vollständig für sich selbst anpassen. Sie können das Generierungsmodell und das ControlNet-Modell und den Modus ändern, den Vorprozess aktivieren oder deaktivieren oder alles andere, was Sie möchten. Die Hauptsache ist, gute Ergebnisse nicht zu verlieren und dann alles richtig zu wiederholen, um eine Animation zu erstellen.

Nachteile der Technologie – Sie sollten nicht viel Vorarbeit für den Übergang leisten. Wir haben oben geschrieben, dass die Rauschunterdrückung die Anzahl der Schritte beeinflusst. Es kann sich herausstellen, dass die Ausgabe Bilder dupliziert, da mehrere Rauschunterdrückungswerte innerhalb derselben Anzahl von Schritten liegen. Ihre Anzahl kann in der automatischen Konsole beobachtet werden.

Diese Technologie kann in Verbindung mit Interpolator-Verzögerern verwendet werden, d. h. Senden der Animation zum Vervollständigen der fehlenden Frames; Dies führt zu sanfteren Änderungen.

Ursprüngliche Quelle

Lesen Sie weitere verwandte Artikel:

Stichworte:

Haftungsausschluss

Im Einklang mit der Richtlinien des Trust-ProjektsBitte beachten Sie, dass die auf dieser Seite bereitgestellten Informationen nicht als Rechts-, Steuer-, Anlage-, Finanz- oder sonstige Beratung gedacht sind und nicht als solche interpretiert werden sollten. Es ist wichtig, nur so viel zu investieren, wie Sie sich leisten können, zu verlieren, und im Zweifelsfall eine unabhängige Finanzberatung einzuholen. Für weitere Informationen empfehlen wir einen Blick auf die Allgemeinen Geschäftsbedingungen sowie die Hilfe- und Supportseiten des Herausgebers oder Werbetreibenden. MetaversePost ist einer genauen, unvoreingenommenen Berichterstattung verpflichtet, die Marktbedingungen können sich jedoch ohne Vorankündigung ändern.

Über den Autor

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Weitere Artikel
Damir Jalalow
Damir Jalalow

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Angesichts der Volatilität wächst der institutionelle Appetit auf Bitcoin-ETFs

Offenlegungen in 13F-Anmeldungen zeigen, dass namhafte institutionelle Anleger sich mit Bitcoin-ETFs beschäftigen, was die wachsende Akzeptanz von ... unterstreicht.

Weitere Informationen

Der Tag der Verurteilung steht vor der Tür: Das Schicksal von CZ bleibt ungewiss, während das US-Gericht den Plädoyer des DOJ prüft

Changpeng Zhao steht heute vor einer Verurteilung vor einem US-Gericht in Seattle.

Weitere Informationen
Treten Sie unserer innovativen Tech-Community bei
Weiterlesen
Lesen Sie weiter
Googles Med-Gemini ist bereit, einen Vorsprung zu verschaffen GPT-4 Mit seiner überlegenen Leistung im Gesundheitswesen
AI Wiki Aktuelles Software Technologie
Googles Med-Gemini ist bereit, einen Vorsprung zu verschaffen GPT-4 Mit seiner überlegenen Leistung im Gesundheitswesen
2. Mai 2024
Die KI-Renaissance in der Spieleentwicklung im Jahr 2024
AI Wiki Metaverse Wiki Bildungswesen Märkte Software Technologie
Die KI-Renaissance in der Spieleentwicklung im Jahr 2024
1. Mai 2024
Mögliche Herausforderungen bei der Integration von KI in intelligente Verträge bei gleichzeitiger Balance zwischen Innovation und Sicherheit
AI Wiki Sicherheit Wiki Software Geschichten und Rezensionen Technologie
Mögliche Herausforderungen bei der Integration von KI in intelligente Verträge bei gleichzeitiger Balance zwischen Innovation und Sicherheit
29. April 2024
KI-Münzen schlagen in der Kryptowelt Wellen: Leistung, Anwendungsfälle und was als nächstes kommt
AI Wiki Crypto Wiki Geschichten und Rezensionen Technologie
KI-Münzen schlagen in der Kryptowelt Wellen: Leistung, Anwendungsfälle und was als nächstes kommt
26. April 2024