ControlNet hjälper dig att göra perfekta händer med Stable Diffusion 1.5
I korthet
ControlNet är ett enkelt sätt att finjustera Stable Diffusion.
Den kan användas för att utveckla modeller för bättre SD-kontroll.
ControlNet är öppen källkod och kan användas tillsammans med WebUIs för att uppnå Stable Diffusion.
Det enda text-till-bild AI-generatorer har kämpat med är händerna. Även om bilder generellt sett är imponerande, är händerna mindre så, med överflödiga fingrar, konstigt böjda leder och en tydlig brist på förståelse för hur händer ska se ut från AI:s sida. Detta behöver dock inte vara fallet, eftersom den nya ControlNet-produkten är här för att hjälpa till Stable Diffusion skapa perfekta händer som ser realistiskt ut.
ControlNet är en ny teknik som låter dig använda en skiss, kontur, djup eller normal karta för att styra neuroner baserat på Stable Diffusion 1.5. Det betyder att du nu kan ha nästan perfekta händer på vilken anpassad 1.5-modell som helst så länge du har rätt vägledning. ControlNet kan ses som ett revolutionerande verktyg som låter användare ha ultimat kontroll över sin design.
För att uppnå felfria händer, använd A1111-förlängningen med ControlNet, speciellt djupmodulen. Ta sedan några närbilder av dina händer och ladda upp dem till ControlNet UI:s txt2img-flik. Skapa sedan en enkel uppmaning om att skapa drömmar, till exempel "fantasikonstverk, vikingaman visar händer närbild" och experimentera med kraften i ControlNet. Experiment med djupmodulen, A1111-tillägget och ControlNet UI:s txt2img-fliken kommer att resultera i vackra och realistiska händer.
Rekommenderat inlägg: Shutterstock belönar artister som bidrar till generativa AI-modeller |
ControlNet konverterar själv bilden som den ges till djup, normaler eller en skiss så att den senare kan användas som modell. Men du kan naturligtvis ladda upp din egen djupkarta eller skisser direkt. Detta möjliggör maximal flexibilitet när du skapar en 3D-scen, vilket gör att du kan fokusera på stilen och kvaliteten på den slutliga bilden.
Vi rekommenderar starkt att du tittar på det utmärkta Handledning för ControlNet som Aitrepreneur nyligen har publicerat.
ControlNet förbättrar avsevärt kontrollen över Stable Diffusions bild-till-bild-funktioner
Även Stable Diffusion kan skapa bilder från text, det kan också skapa grafik från mallar. Denna bild-till-bild pipeline är ofta van vid förbättra genererade foton eller skapa nya bilder från grunden med hjälp av mallar.
Medan Stable Diffusion 2.0 erbjuder möjligheten att använda djupdata från en bild som mall, kontroll över denna process är ganska begränsad. Detta tillvägagångssätt stöds inte av den tidigare versionen, 1.5, som fortfarande används ofta på grund av det enorma antalet anpassade modeller, bland annat.
Varje blocks vikter från Stable Diffusion kopieras av ControlNet till en träningsbar variant och en låst variant. Den blockerade formen behåller kapaciteten hos den produktionsklara diffusionsmodellen, medan den träningsbara varianten kan lära sig nya förutsättningar för bildsyntes genom att finjustera med små datamängder.
Stable Diffusion fungerar med alla ControlNet-modeller och erbjuder betydligt mer kontroll över den generativa AI. Teamet ger prover på flera varianter av människor i fasta poser, samt olika interiörfoton baserade på modellens rumsliga arrangemang och variationer av fågelbilder.
Läs mer om AI:
Villkor
I linje med den Riktlinjer för Trust Project, vänligen notera att informationen på den här sidan inte är avsedd att vara och inte ska tolkas som juridisk, skattemässig, investerings-, finansiell eller någon annan form av rådgivning. Det är viktigt att bara investera det du har råd att förlora och att söka oberoende finansiell rådgivning om du har några tvivel. För ytterligare information föreslår vi att du hänvisar till villkoren samt hjälp- och supportsidorna som tillhandahålls av utfärdaren eller annonsören. MetaversePost är engagerad i korrekt, opartisk rapportering, men marknadsförhållandena kan ändras utan föregående meddelande.
Om författaren
Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet.
fler artiklarDamir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet.