Novinky Technika
Února 16, 2023

ControlNet vám pomůže vytvořit dokonalé ruce Stable Diffusion 1.5

Stručně

ControlNet je snadný způsob, jak doladit Stable Diffusion.

Lze jej použít k vývoji modelů pro lepší ovládání SD.

ControlNet je open-source a lze jej použít ve spojení s WebUI Stable Diffusion.

Jedinou věcí, se kterou se generátory umělé inteligence pro převod textu na obrázek potýkaly, jsou ruce. Zatímco obrázky jsou obecně působivé, ruce už méně, s nadbytečnými prsty, podivně ohnutými klouby a jasným nepochopením toho, jak mají ruce ze strany AI vypadat. To však nemusí platit, protože nový produkt ControlNet je tu, aby vám pomohl Stable Diffusion vytvořit dokonalé, realisticky vypadající ruce.

ControlNet je nová technologie, která vám umožňuje používat náčrt, obrys, hloubku nebo normální mapu k vedení neuronů na základě Stable Diffusion 1.5. To znamená, že nyní můžete mít téměř dokonalé ruce na jakémkoli vlastním modelu 1.5, pokud máte správné vedení. ControlNet lze považovat za revoluční nástroj, který uživatelům umožňuje mít maximální kontrolu nad svými návrhy.

Pro dosažení bezchybných rukou použijte rozšíření A1111 s ControlNet, konkrétně modul Depth. Poté pořiďte několik detailních selfie svých rukou a nahrajte je na kartu txt2img uživatelského rozhraní ControlNet. Poté vytvořte jednoduchou výzvu pro tvarování snů, například „fantasy artwork, Viking man showing hands closeup“, a experimentujte se silou ControlNet. Experimentování s modulem Depth, rozšířením A1111 a záložkou ControlNet UIs txt2img vyústí v krásné a realisticky vypadající ruce.

Doporučený příspěvek: Shutterstock odměňuje umělce, kteří přispívají ke generativním modelům umělé inteligence

ControlNet sám převede obraz, který je mu dán, na hloubku, normály nebo náčrt, takže jej lze později použít jako model. Ale samozřejmě můžete přímo nahrát vlastní hloubkovou mapu nebo náčrtky. To umožňuje maximální flexibilitu při vytváření 3D scény a umožňuje vám soustředit se na styl a kvalitu výsledného obrazu.

Důrazně doporučujeme, abyste se podívali na vynikající Výukový program ControlNet který Aitrepreneur nedávno zveřejnil.

ControlNet výrazně zlepšuje kontrolu nad Stable Diffusion's image-to-image schopnosti

Ačkoli Stable Diffusion umí vytvářet obrázky z textu, umí také vytvářet grafiku ze šablon. Tento kanál pro převod obrazu na obrázek se často používá vylepšit vygenerované fotografie nebo vytvářet nové obrázky od začátku pomocí šablon.

Zatímco Stable Diffusion 2.0 nabízí možnost použít data hloubky z obrázku jako šablonu, kontrola nad tímto procesem je dosti omezená. Tento přístup není podporován dřívější verzí 1.5, která se stále běžně používá, mimo jiné kvůli obrovskému počtu vlastních modelů.

Váhy každého bloku od Stable Diffusion jsou zkopírovány ControlNet do trénovatelné varianty a uzamčené varianty. Blokovaná forma zachovává možnosti modelu difúze připraveného pro výrobu, zatímco trénovatelná varianta se může naučit nové podmínky pro syntézu obrazu doladěním pomocí malých souborů dat.

Kontrola nad Stable DiffusionSchopnosti přenosu obrazu na obrázek jsou výrazně vylepšeny pomocí ControlNet

Stable Diffusion funguje se všemi modely ControlNet a nabízí podstatně větší kontrolu nad generativní AI. Tým poskytuje ukázky několika variací lidí ve fixních pózách, stejně jako různé interiérové ​​fotografie na základě prostorového uspořádání modelu a variací ptačích snímků.

Přečtěte si více o AI:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Další články
Damir Yalalov
Damir Yalalov

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více

Zakladatelé peněženky Samourai byli obviněni z usnadňování 2 miliard dolarů v obchodech Darknet

Obavy zakladatelů Peněženky Samourai představují pro průmysl významnou překážku, která podtrhuje přetrvávající ...

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Pantera Capital investuje do blockchainu TON, vyjadřuje důvěru v potenciál Telegramu rozšířit dostupnost kryptoměn
Business Novinky Technika
Pantera Capital investuje do blockchainu TON, vyjadřuje důvěru v potenciál Telegramu rozšířit dostupnost kryptoměn
2
Mitosis získává finanční prostředky ve výši 7 milionů USD od Amber Group a Foresight Ventures, aby podpořila svůj modulární protokol likvidity
Business Novinky Technika
Mitosis získává finanční prostředky ve výši 7 milionů USD od Amber Group a Foresight Ventures, aby podpořila svůj modulární protokol likvidity
2
Galxe spolupracuje se společností Jambo, aby rozšířila globální dostupnost Web3
Business Novinky Technika
Galxe spolupracuje se společností Jambo, aby rozšířila globální dostupnost Web3
2
Med-Gemini od Googlu se chystá dát náskok GPT-4 S vynikajícím výkonem ve zdravotnictví
AI Wiki Novinky Vývoj Technika
Med-Gemini od Googlu se chystá dát náskok GPT-4 S vynikajícím výkonem ve zdravotnictví
2
CRYPTOMERIA LABS PTE. LTD.