Buletin de stiri Tehnologia
16 Februarie 2023

ControlNet vă ajută să faceți mâini perfecte Stable Diffusion 1.5

Pe scurt

ControlNet este o modalitate ușoară de a regla fin Stable Diffusion.

Poate fi folosit pentru a dezvolta modele pentru un control mai bun SD.

ControlNet este open-source și poate fi utilizat împreună cu WebUI pentru a realiza Stable Diffusion.

Singurul lucru cu care s-au luptat generatoarele AI text-to-image sunt mâinile. În timp ce imaginile sunt în general impresionante, mâinile sunt mai puțin așa, cu degete de prisos, articulații ciudat îndoite și o lipsă clară de înțelegere a cum ar trebui să arate mâinile din partea AI. Cu toate acestea, acest lucru nu trebuie să fie cazul, deoarece noul produs ControlNet este aici pentru a vă ajuta Stable Diffusion creați mâini perfecte, cu aspect realist.

ControlNet este o nouă tehnologie care vă permite să utilizați o schiță, un contur, o adâncime sau o hartă normală pentru a ghida neuronii pe baza Stable Diffusion 1.5. Acest lucru înseamnă că acum puteți avea mâini aproape perfecte pe orice model personalizat 1.5 atâta timp cât aveți îndrumarea potrivită. ControlNet poate fi considerat un instrument revoluționar, care permite utilizatorilor să aibă controlul suprem asupra design-urilor lor.

Pentru a obține mâini impecabile, utilizați extensia A1111 cu ControlNet, în special modulul Adâncime. Apoi, faceți câteva selfie-uri cu mâinile dvs. și încărcați-le în fila txt2img a interfeței de utilizare ControlNet. Apoi creați un mesaj simplu de modelare a viselor, cum ar fi „operă de artă fantezie, bărbat viking care arată mâinile în prim-plan” și experimentați cu puterea ControlNet. Experimentarea cu modulul Depth, extensia A1111 și fila txt2img a interfeței de utilizare ControlNet va avea ca rezultat mâini frumoase și cu aspect realist.

Postare recomandată: Shutterstock recompensează artiștii care contribuie la modele generative de inteligență artificială

ControlNet însuși convertește imaginea care i-a fost dată în adâncime, în valori normale sau într-o schiță, astfel încât ulterior să poată fi folosită ca model. Dar, desigur, puteți încărca direct propria hartă sau schițe de adâncime. Acest lucru permite flexibilitate maximă atunci când creați o scenă 3D, permițându-vă să vă concentrați pe stilul și calitatea imaginii finale.

Vă sugerăm cu tărie să vă uitați la excelent Tutorial ControlNet pe care Aitrepreneur l-a publicat recent.

ControlNet îmbunătățește foarte mult controlul asupra Stable Diffusioncapabilitățile imagine-la-imagine ale lui

Cu toate ca Stable Diffusion poate crea imagini din text, poate crea și grafică din șabloane. Această conductă imagine-la-imagine este frecvent folosită îmbunătățirea fotografiilor generate sau produceți imagini noi de la zero folosind șabloane.

In timp ce Stable Diffusion 2.0 oferă capacitatea de a utiliza datele de adâncime dintr-o imagine ca șablon, controlul asupra acestui proces este destul de limitat. Această abordare nu este susținută de versiunea anterioară, 1.5, care este încă folosită în mod obișnuit datorită numărului enorm de modele personalizate, printre alte motive.

Greutățile fiecărui bloc de la Stable Diffusion sunt copiate de ControlNet într-o variantă antrenabilă și într-o variantă blocată. Forma blocată păstrează capacitățile modelului de difuzie pregătit pentru producție, în timp ce varianta antrenabilă poate învăța condiții noi pentru sinteza imaginii prin reglarea fină cu seturi de date mici.

Controlul asupra Stable DiffusionCapacitățile imagine-la-imagine ale lui sunt mult îmbunătățite de ControlNet

Stable Diffusion funcționează cu toate modelele ControlNet și oferă un control considerabil mai mare asupra IA generativă. Echipa oferă mostre din mai multe variante de oameni în ipostaze fixe, precum și diverse fotografii de interior bazate pe aranjarea spațială a modelului și variațiile imaginilor cu păsări.

Citiți mai multe despre AI:

Declinare a responsabilităţii

În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.

Despre autor

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Mai multe articole
Damir Yalalov
Damir Yalalov

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

De la Ripple la Big Green DAO: Cum contribuie proiectele de criptomonede la caritate

Să explorăm inițiativele care valorifică potențialul monedelor digitale pentru cauze caritabile.

Aflați mai multe

AlphaFold 3, Med-Gemini și alții: modul în care AI transformă asistența medicală în 2024

Inteligența artificială se manifestă în diferite moduri în asistența medicală, de la descoperirea de noi corelații genetice până la abilitarea sistemelor chirurgicale robotizate...

Aflați mai multe
Alăturați-vă comunității noastre tehnologice inovatoare
Citeste mai mult
Află mai multe
RWA-urile tokenizate reduc decalajul dintre acestea DeFi și TradFi
Opinie Liste de top Afaceri pieţe Software Tehnologia
RWA-urile tokenizate reduc decalajul dintre acestea DeFi și TradFi
24 Iunie, 2024
Nivelul actual de corecție al Bitcoin este încă sub medie, spune analistul criptografic Rekt Capital
pieţe Buletin de stiri Tehnologia
Nivelul actual de corecție al Bitcoin este încă sub medie, spune analistul criptografic Rekt Capital
24 Iunie, 2024
Codul de indexare al protocolului SRC cu sursă deschisă pentru dezvoltatori de bază, inclusiv standardele de jetoane SRC-20, SRC-721 și SRC-101
Buletin de stiri Software Tehnologia
Codul de indexare al protocolului SRC cu sursă deschisă pentru dezvoltatori de bază, inclusiv standardele de jetoane SRC-20, SRC-721 și SRC-101
24 Iunie, 2024
Ascensiunea și căderea ambițiilor publicitare ale Oracle: un vis de 2 miliarde de dolari se prăbușește
Opinie Afaceri Stil de viață pieţe Tehnologia
Ascensiunea și căderea ambițiilor publicitare ale Oracle: un vis de 2 miliarde de dolari se prăbușește
24 Iunie, 2024
CRYPTOMERIA LABS PTE. LTD.