Raport aktualności Technologia
16 lutego 2023 r.

ControlNet pomaga tworzyć doskonałe dłonie Stable Diffusion 1.5

W skrócie

ControlNet to łatwy sposób na precyzyjne dostrojenie Stable Diffusion.

Można go wykorzystać do opracowania modeli dla lepszej kontroli SD.

ControlNet jest oprogramowaniem typu open source i może być używany w połączeniu z interfejsami WebUI Stable Diffusion.

Jedyną rzeczą, z którą borykają się generatory AI przetwarzające tekst na obraz, są ręce. Podczas gdy obrazy są ogólnie imponujące, ręce są mniej, ze zbędnymi palcami, dziwnie wygiętymi stawami i wyraźnym brakiem zrozumienia, jak dłonie powinny wyglądać ze strony AI. Jednak nie musi tak być, ponieważ nowy produkt ControlNet jest tutaj, aby pomóc Stable Diffusion stworzyć idealne, realistycznie wyglądające dłonie.

ControlNet to nowa technologia, która pozwala na użycie szkicu, konturu, mapy głębokości lub mapy normalnych do kierowania neuronami na podstawie Stable Diffusion 1.5. Oznacza to, że możesz teraz mieć prawie idealne ręce na każdym niestandardowym modelu 1.5, o ile masz odpowiednie wskazówki. ControlNet można uważać za rewolucyjne narzędzie, które pozwala użytkownikom na pełną kontrolę nad swoimi projektami.

Aby uzyskać nieskazitelne ręce, użyj rozszerzenia A1111 z ControlNet, w szczególności z modułem Depth. Następnie zrób kilka zbliżeń swoich dłoni i prześlij je do zakładki txt2img interfejsu ControlNet. Następnie utwórz prostą zachętę do kształtowania snów, taką jak „dzieło sztuki fantasy, człowiek wiking pokazujący zbliżenie rąk” i eksperymentuj z mocą ControlNet. Eksperymentowanie z modułem Depth, rozszerzeniem A1111 i zakładką ControlNet UIs txt2img zaowocuje pięknymi i realistycznie wyglądającymi dłońmi.

Polecany post: Shutterstock nagradza artystów, którzy przyczyniają się do tworzenia generatywnych modeli sztucznej inteligencji

ControlNet sam konwertuje otrzymany obraz na głębokość, normalne lub szkic, aby później można go było użyć jako modelu. Ale oczywiście możesz bezpośrednio przesłać własną mapę głębi lub szkice. Pozwala to na maksymalną elastyczność podczas tworzenia sceny 3D, umożliwiając skupienie się na stylu i jakości ostatecznego obrazu.

Zdecydowanie zalecamy przyjrzenie się doskonałemu Samouczek ControlNet które niedawno opublikował Aitrepreneur.

ControlNet znacznie poprawia kontrolę nad Stable DiffusionMożliwości przetwarzania obrazu w obraz

Chociaż Stable Diffusion może tworzyć obrazy z tekstu, może również tworzyć grafiki z szablonów. Ten potok obrazu do obrazu jest często używany do ulepszyć wygenerowane zdjęcia lub twórz nowe obrazy od podstaw, korzystając z szablonów.

Kompletujemy wszystkie dokumenty (wymagana jest kopia paszportu i XNUMX zdjęcia) potrzebne do Stable Diffusion 2.0 oferuje możliwość wykorzystania danych głębi z obrazu jako szablonu, kontrola nad tym procesem jest dość ograniczona. Takie podejście nie jest obsługiwane przez wcześniejszą wersję 1.5, która jest nadal powszechnie używana, między innymi ze względu na ogromną liczbę niestandardowych modeli.

Waga każdego bloku od Stable Diffusion są kopiowane przez ControlNet do wariantu nadającego się do szkolenia i wariantu zablokowanego. Zablokowana forma zachowuje możliwości gotowego do produkcji modelu dyfuzyjnego, podczas gdy wariant nadający się do szkolenia może nauczyć się nowych warunków syntezy obrazu poprzez dostrajanie za pomocą niewielkich zestawów danych.

Kontrola Stable DiffusionMożliwości przetwarzania obrazu do obrazu są znacznie ulepszone przez ControlNet

Stable Diffusion współpracuje ze wszystkimi modelami ControlNet i oferuje znacznie większą kontrolę nad generatywną sztuczną inteligencją. Zespół dostarcza próbki kilku odmian ludzi w stałych pozach, a także różne zdjęcia wnętrz oparte na układzie przestrzennym modelu i wariacjach wizerunków ptaków.

Przeczytaj więcej o sztucznej inteligencji:

Odpowiedzialność

Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.

O autorze

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Więcej artykułów
Damir Jałałow
Damir Jałałow

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Hot Stories
Dołącz do naszego newslettera.
Najnowsze wieści

Nadchodzi dzień wyroku: los CZ wisi na włosku, gdy amerykański sąd rozpatruje skargę Departamentu Sprawiedliwości

Changpeng Zhao stanie dziś przed amerykańskim sądem w Seattle wyrokiem skazującym.

Dowiedz się więcej

Założyciele portfela Samourai oskarżeni o ułatwianie transakcji o wartości 2 miliardów dolarów w Darknet

Zaniepokojenie założycieli Samourai Wallet stanowi wyraźną porażkę dla branży, podkreślając utrzymujące się...

Dowiedz się więcej
Dołącz do naszej innowacyjnej społeczności technologicznej
Czytaj więcej
Czytaj więcej
Pantera Capital inwestuje w TON Blockchain i wyraża zaufanie w potencjał Telegramu w zakresie zwiększania dostępności kryptowalut
Biznes Raport aktualności Technologia
Pantera Capital inwestuje w TON Blockchain i wyraża zaufanie w potencjał Telegramu w zakresie zwiększania dostępności kryptowalut
2 maja 2024 r.
Mitosis pozyskuje fundusze o wartości 7 mln dolarów od Amber Group i przedsięwzięć Foresight w celu udoskonalenia swojego modułowego protokołu płynności
Biznes Raport aktualności Technologia
Mitosis pozyskuje fundusze o wartości 7 mln dolarów od Amber Group i przedsięwzięć Foresight w celu udoskonalenia swojego modułowego protokołu płynności
2 maja 2024 r.
Galxe współpracuje z Jambo, aby rozszerzyć globalną dostępność Web3
Biznes Raport aktualności Technologia
Galxe współpracuje z Jambo, aby rozszerzyć globalną dostępność Web3
2 maja 2024 r.
Med-Gemini firmy Google gotowy dać przewagę GPT-4 Dzięki doskonałej wydajności w opiece zdrowotnej
AI Wiki Aktualności Tworzenie Technologia
Med-Gemini firmy Google gotowy dać przewagę GPT-4 Dzięki doskonałej wydajności w opiece zdrowotnej
2 maja 2024 r.
CRYPTOMERIA LABS PTE. SP. Z O.O.