ControlNet pomaga tworzyć doskonałe dłonie Stable Diffusion 1.5
W skrócie
ControlNet to łatwy sposób na precyzyjne dostrojenie Stable Diffusion.
Można go wykorzystać do opracowania modeli dla lepszej kontroli SD.
ControlNet jest oprogramowaniem typu open source i może być używany w połączeniu z interfejsami WebUI Stable Diffusion.
Jedyną rzeczą, z którą borykają się generatory AI przetwarzające tekst na obraz, są ręce. Podczas gdy obrazy są ogólnie imponujące, ręce są mniej, ze zbędnymi palcami, dziwnie wygiętymi stawami i wyraźnym brakiem zrozumienia, jak dłonie powinny wyglądać ze strony AI. Jednak nie musi tak być, ponieważ nowy produkt ControlNet jest tutaj, aby pomóc Stable Diffusion stworzyć idealne, realistycznie wyglądające dłonie.
ControlNet to nowa technologia, która pozwala na użycie szkicu, konturu, mapy głębokości lub mapy normalnych do kierowania neuronami na podstawie Stable Diffusion 1.5. Oznacza to, że możesz teraz mieć prawie idealne ręce na każdym niestandardowym modelu 1.5, o ile masz odpowiednie wskazówki. ControlNet można uważać za rewolucyjne narzędzie, które pozwala użytkownikom na pełną kontrolę nad swoimi projektami.
Aby uzyskać nieskazitelne ręce, użyj rozszerzenia A1111 z ControlNet, w szczególności z modułem Depth. Następnie zrób kilka zbliżeń swoich dłoni i prześlij je do zakładki txt2img interfejsu ControlNet. Następnie utwórz prostą zachętę do kształtowania snów, taką jak „dzieło sztuki fantasy, człowiek wiking pokazujący zbliżenie rąk” i eksperymentuj z mocą ControlNet. Eksperymentowanie z modułem Depth, rozszerzeniem A1111 i zakładką ControlNet UIs txt2img zaowocuje pięknymi i realistycznie wyglądającymi dłońmi.
Polecany post: Shutterstock nagradza artystów, którzy przyczyniają się do tworzenia generatywnych modeli sztucznej inteligencji |
ControlNet sam konwertuje otrzymany obraz na głębokość, normalne lub szkic, aby później można go było użyć jako modelu. Ale oczywiście możesz bezpośrednio przesłać własną mapę głębi lub szkice. Pozwala to na maksymalną elastyczność podczas tworzenia sceny 3D, umożliwiając skupienie się na stylu i jakości ostatecznego obrazu.
Zdecydowanie zalecamy przyjrzenie się doskonałemu Samouczek ControlNet które niedawno opublikował Aitrepreneur.
ControlNet znacznie poprawia kontrolę nad Stable DiffusionMożliwości przetwarzania obrazu w obraz
Chociaż Stable Diffusion może tworzyć obrazy z tekstu, może również tworzyć grafiki z szablonów. Ten potok obrazu do obrazu jest często używany do ulepszyć wygenerowane zdjęcia lub twórz nowe obrazy od podstaw, korzystając z szablonów.
Kompletujemy wszystkie dokumenty (wymagana jest kopia paszportu i XNUMX zdjęcia) potrzebne do Stable Diffusion 2.0 oferuje możliwość wykorzystania danych głębi z obrazu jako szablonu, kontrola nad tym procesem jest dość ograniczona. Takie podejście nie jest obsługiwane przez wcześniejszą wersję 1.5, która jest nadal powszechnie używana, między innymi ze względu na ogromną liczbę niestandardowych modeli.
Waga każdego bloku od Stable Diffusion są kopiowane przez ControlNet do wariantu nadającego się do szkolenia i wariantu zablokowanego. Zablokowana forma zachowuje możliwości gotowego do produkcji modelu dyfuzyjnego, podczas gdy wariant nadający się do szkolenia może nauczyć się nowych warunków syntezy obrazu poprzez dostrajanie za pomocą niewielkich zestawów danych.
Stable Diffusion współpracuje ze wszystkimi modelami ControlNet i oferuje znacznie większą kontrolę nad generatywną sztuczną inteligencją. Zespół dostarcza próbki kilku odmian ludzi w stałych pozach, a także różne zdjęcia wnętrz oparte na układzie przestrzennym modelu i wariacjach wizerunków ptaków.
Przeczytaj więcej o sztucznej inteligencji:
Odpowiedzialność
Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.
O autorze
Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym.
Więcej artykułówDamir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym.