AI Wiki
06. března 2023

Jak generovat animaci morfování obrazu pomocí ControlNet

Kvůli dřívějšímu experimentu dirigovatd, měli jsme nápad použít ControlNet pro morphing. Teprve poté jsme přešli na používání modelu depth2img, který dokáže vytvořit obrázek z hloubkové mapy, spíše než ControlNet. A ControlNet může fungovat nejen do hloubky. Tento příspěvek má více informací o technice.

Jak generovat animaci morfování obrazu pomocí ControlNet

Dám vám rychlý přehled postupu. Možnost síly odšumování, která ovlivňuje počet kroků při generování, máme k dispozici, pokud vygenerujeme obrázek v img2img. Například s kroky = 30 a sílou potlačení šumu = 0.5 zbývá k vytvoření pouze 15 kroků. Toto uvažování lze aplikovat na animaci morfy. Můžete morphovat jakýkoli obrázek; portréty nejsou jediné, které lze dělat.

Pořiďte původní obrázek. Aktivujte ControlNet a nechte pole obrázku prázdné. Chcete-li generovat náhodné testy, zvolte seed na -1; počet šarží ovlivňuje jejich množství. Můžete experimentovat s parametry navádění, hmotností přijaté karty a režimem ControlNet. Pokud se vám generování líbí, přetáhněte jej myší na img2img a poté proces opakujte a hledejte obrázek, kterým se nakonec stane druhý obrázek. Když je každý obrázek dokončen, vyvstává otázka, jak vytvořit animaci. (Pro začátek nezapomeňte nastavit počet dávek na 1, abyste se vyhnuli vytváření dalších fotografií.)

Právě teď využijeme zajímavé řešení, ale o jeho nedostatcích se zmíním později.

Bude použit graf XYZ; musíte jej vybrat ze seznamu skriptů. Umožní nám vytvořit nejen výsledný obrázek, ale i přechod ze zdrojového obrázku.

Hodnoty X vložíme do řádku, který zní:

0.0.296.0.39.0.459.0.515.0.563.0.606.0.644.0.68.0.713.0.743.0.772.0.799.0.825.0.85.0.874.0.897.0.919.0.94.0.961.

To znamená, že když začne generování, místo jednoho (počet hodnot oddělených čárkami) obdržíme 21 obrázků. Proč je tam tato čára? Může například vypadat jinak.

Tento formát usnadňuje pochopení: od automatu požadujete 20 obrázků a požádáte ho, aby ukázal, jak potlačení šumu ovlivní výsledek u hodnot v rozmezí od 0 do 1. Nevýhodou druhé možnosti je, že vede k lineární změně hodnot. , kvůli vlastnostem odšumování se nezdá být realistickým morfováním. Čísla téměř nula nemají na výsledek téměř žádný vliv. a při úrovních větších než 0.5, začíná velmi znatelně ovlivňovat.

Výsledkem je, že první řádek je křivka typu x.4 nebo x zvýšená o 0.4. Přímá, lineární funkce a zakřivená funkce, která vytvoří přesnější výstup, jsou v obraze kontrastovány. K vytvoření takového řetězce můžete použít mixér.

Před vytvořením čáry musíte zvolit počet snímků pro přechod. Je editovatelný v nastavení projektu.

Chcete-li získat řádek, musíte provést několik kroků. Nejprve experimentujte s tvarem křivky. Chcete-li toho dosáhnout, vyberte v kontextové nabídce parametru animace možnost „Odstranit klíčové snímky“.

Zde je vzorec pro získání křivky; parametr zmodral, což znamená, že v něm ovladač pracuje.

Zde si můžete pohrát s hodnotou. 4. Ale vyvarujte se toho, abyste šli příliš nízko. snímek/21 označuje posun hodnoty z 0 na 1 ve snímku 0 na snímek 21. Zbývají pouze hodnoty mezi 1 a 20 snímky.

Nicméně klíče nejsou ovladačem. Nejprve se musí připravit. Chcete-li to provést, klikněte na Objekt > Animace > Akce pečení ve 3D okně a poté klikněte na OK.

To však ovlivní všechny možné klíče objektu a měly by být odstraněny. Vyberte vše kromě prvního řádku a stiskněte X na klávesnici (myš by měla být umístěna pod seznamem).

A nyní, abyste získali řádek na levé straně obrazovky, klikněte na play a otevřete okno konzoly.

Mám řetězec, který lze zkopírovat.

Nyní, abyste vytvořili animaci, musíte tento proces provést samostatně pro každou pozici obrázku, která byla vytvořena na začátku, a poté ji sestavit do animace v některém video editoru.

Ano, proces ještě není automatizovaný, ale vše si můžete plně přizpůsobit sami. Můžete změnit model generování a model a režim ControlNet, povolit nebo zakázat předzpracování nebo cokoli jiného, ​​co chcete. Hlavní je neztratit dobré výsledky a pak vše správně zopakovat pro vytvoření animace.

Nevýhody technologie — neměli byste klást mnoho základů pro přechod. Výše jsme psali, že odšumování ovlivňuje počet kroků. Může se stát, že výstup bude duplikovat obrázky, protože několik hodnot odšumování bude ve stejném počtu kroků. Jejich počet lze sledovat v automatické konzole.

Tuto technologii lze použít ve spojení s retardéry interpolátoru, tedy odesláním animace k doplnění chybějících snímků; to zajistí hladší změny.

Původní zdroj

Přečtěte si další související články:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Další články
Damir Yalalov
Damir Yalalov

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Institucionální apetit roste směrem k bitcoinovým ETF uprostřed volatility

Zveřejnění prostřednictvím podání 13F odhaluje, že pozoruhodní institucionální investoři fušují do bitcoinových ETF, což podtrhuje rostoucí akceptaci...

Vědět více

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Med-Gemini od Googlu se chystá dát náskok GPT-4 S vynikajícím výkonem ve zdravotnictví
AI Wiki Novinky Vývoj Technika
Med-Gemini od Googlu se chystá dát náskok GPT-4 S vynikajícím výkonem ve zdravotnictví
2
AI Renaissance ve vývoji her v roce 2024
AI Wiki Metaverse Wiki Vzdělání Trhy Vývoj Technika
AI Renaissance ve vývoji her v roce 2024
1
Možné výzvy integrace umělé inteligence do chytrých smluv při vyvážení inovací a bezpečnosti
AI Wiki Bezpečnost Wiki Vývoj Příběhy a recenze Technika
Možné výzvy integrace umělé inteligence do chytrých smluv při vyvážení inovací a bezpečnosti
29. dubna 2024
Umělé mince vytvářející vlny ve světě kryptoměn: Výkon, případy použití a co dál
AI Wiki Crypto Wiki Příběhy a recenze Technika
Umělé mince vytvářející vlny ve světě kryptoměn: Výkon, případy použití a co dál
26. dubna 2024
CRYPTOMERIA LABS PTE. LTD.