AI Wiki
06 Marzo 2023

Come generare un'animazione di Image Morphing con ControlNet

A causa di un precedente esperimento condurred, abbiamo avuto l'idea di utilizzare ControlNet per il morphing. Solo allora siamo passati all'utilizzo del modello depth2img, che può creare un'immagine da una mappa di profondità, piuttosto che da ControlNet. E ControlNet può funzionare non solo in profondità. Questo post ha più informazioni sulla tecnica.

Come generare un'animazione di Image Morphing con ControlNet

Ti darò una rapida carrellata della procedura. L'opzione di riduzione del rumore, che influisce sul numero di passaggi durante la generazione, è disponibile se generiamo un'immagine in img2img. Ad esempio, con passi = 30 e forza di denoising = 0.5, rimarranno solo 15 passi da creare. Questo ragionamento può essere applicato all'animazione del morph. Puoi trasformare qualsiasi immagine; i ritratti non sono gli unici che si possono fare.

Scatta la foto originale. Attivare ControlNet lasciando vuota la casella dell'immagine. Scegli seed come -1 per generare test casuali; il conteggio dei lotti ne influenza la quantità. Puoi sperimentare i parametri di guida, il peso della carta ricevuta e la modalità ControlNet. Se ti piace la generazione, trascinala con il mouse su img2img e poi ripeti il ​​processo, cercando l'immagine che alla fine diventerà la seconda immagine. Man mano che ogni immagine viene completata, emerge la domanda su come creare un'animazione. (Per iniziare, ricorda di impostare il conteggio batch su 1 per evitare di creare foto extra.)

Utilizzeremo una soluzione intrigante in questo momento, ma parlerò dei suoi difetti più tardi.

Verrà utilizzato il grafico XYZ; devi sceglierlo dall'elenco Script. Ci consentirà di creare non solo l'immagine finale ma anche la transizione dall'immagine sorgente.

I valori X in mettiamo nella riga che recita:

0.0.296.0.39.0.459.0.515.0.563.0.606.0.644.0.68.0.713.0.743.0.772.0.799.0.825.0.85.0.874.0.897.0.919.0.94.0.961

Ciò significa che quando inizia la generazione, riceveremo 21 immagini invece di una sola (il numero di valori separati da virgole). Perché c'è questa linea? Ad esempio, può apparire in modo diverso.

Questo formato semplifica la comprensione: richiedi 20 immagini dall'automazione e chiedi di dimostrare in che modo il denoising influirà sul risultato per valori compresi tra 0 e 1. Lo svantaggio della seconda opzione è che si traduce in un cambiamento lineare nei valori , a causa delle caratteristiche del denoise, non sembra essere un morphing realistico. I numeri vicini allo zero non hanno quasi alcun effetto sul risultato. ea livelli superiori a 0.5, , inizia a influenzare in modo molto evidente.

Di conseguenza, la prima linea è una curva del tipo x.4 o x elevato di 0.4. Nell'immagine vengono contrastate una funzione diritta e lineare e una curva, che produrrà un output più accurato. Puoi usare un frullatore per creare una tale stringa.

Devi scegliere la quantità di fotogrammi per la transizione prima di creare la tua linea. È modificabile nelle impostazioni del progetto.

È necessario eseguire più passaggi per ottenere una linea. Innanzitutto, sperimenta la forma della curva. Per ottenere ciò, seleziona "Elimina fotogrammi chiave" dal menu contestuale del parametro di animazione.

Ecco la formula per ottenere la curva; il parametro diventa blu, a indicare che il driver sta operando al suo interno.

Puoi giocherellare con il valore qui. 4. Ma evita di scendere troppo in basso. frame/21 denota uno spostamento di valore da 0 a 1 dal fotogramma 0 al fotogramma 21. Rimangono solo i valori compresi tra 1 e 20 fotogrammi.

Tuttavia, le chiavi non sono il driver. Devono essere prima preparati. Per fare ciò, fai clic su Oggetto> Animazione> Bake Action nella finestra 3d e quindi fai clic su OK.

Tuttavia, ciò influirà su tutte le possibili chiavi dell'oggetto e dovrebbero essere eliminate. Seleziona tutto tranne la prima riga e premi X sulla tastiera (il mouse dovrebbe trovarsi sotto l'elenco).

E ora, per ottenere la linea sul lato sinistro dello schermo, fai clic su Riproduci e apri la finestra della console.

Ho una stringa che può essere copiata.

Ora per realizzare l'animazione, devi eseguire questo processo separatamente per ogni posizione dell'immagine che è stata creata all'inizio e poi assemblarla nell'animazione in un editor video.

Sì, il processo non è ancora automatizzato, ma puoi personalizzare completamente tutto per te. È possibile modificare il modello di generazione e il modello e la modalità ControlNet, abilitare o disabilitare il preprocesso o qualsiasi altra cosa si desideri. L'importante è non perdere buoni risultati e poi ripetere tutto correttamente per creare l'animazione.

Svantaggi della tecnologia: non dovresti gettare molte basi per la transizione. Abbiamo scritto sopra che il denoise influisce sul numero di passi. È possibile che l'output duplichi le immagini poiché diversi valori di riduzione del rumore saranno all'interno dello stesso numero di passaggi. Il loro numero può essere osservato nella console automatica.

Questa tecnologia può essere utilizzata in combinazione con i rallentatori dell'interpolatore, ovvero l'invio dell'animazione per completare i fotogrammi mancanti; questo darà cambiamenti più fluidi.

Fonte originale

Leggi altri articoli correlati:

Negazione di responsabilità

In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.

Circa l'autore

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Altri articoli
Damir Jalalov
Damir Jalalov

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Cresce l’appetito istituzionale verso gli ETF Bitcoin in un contesto di volatilità

Le informazioni fornite tramite la documentazione 13F rivelano importanti investitori istituzionali che si dilettano negli ETF Bitcoin, sottolineando una crescente accettazione di...

Per saperne di più

Arriva il giorno della sentenza: il destino di CZ è in bilico mentre la Corte degli Stati Uniti considera l'appello del Dipartimento di Giustizia

Changpeng Zhao è pronto ad affrontare oggi la sentenza in un tribunale americano a Seattle.

Per saperne di più
Unisciti alla nostra comunità tecnologica innovativa
Scopri di più
Per saperne di più
Med-Gemini di Google è pronto a dare un vantaggio GPT-4 Con le sue prestazioni superiori nel settore sanitario
AI Wiki Notizie Software Tecnologia
Med-Gemini di Google è pronto a dare un vantaggio GPT-4 Con le sue prestazioni superiori nel settore sanitario
2 Maggio 2024
Il Rinascimento dell’IA nello sviluppo di giochi nel 2024
AI Wiki metaverse Wiki Istruzione Mercati Software Tecnologia
Il Rinascimento dell’IA nello sviluppo di giochi nel 2024
1 Maggio 2024
Possibili sfide legate all’integrazione dell’intelligenza artificiale nei contratti intelligenti bilanciando innovazione e sicurezza
AI Wiki Sicurezza Wiki Software Storie e recensioni Tecnologia
Possibili sfide legate all’integrazione dell’intelligenza artificiale nei contratti intelligenti bilanciando innovazione e sicurezza
29 aprile 2024
Le monete AI fanno scalpore nel mondo delle criptovalute: prestazioni, casi d'uso e cosa verrà dopo
AI Wiki Crypto Wiki Storie e recensioni Tecnologia
Le monete AI fanno scalpore nel mondo delle criptovalute: prestazioni, casi d'uso e cosa verrà dopo
26 aprile 2024
LABORATORI DI CRITTOMERIA PTE. srl.