Buletin de stiri Tehnologia
Iulie 27, 2023

Stability AI Lansează Stable Diffusion XL 1.0 pentru a produce rapid imagini de 1 megapixel

Pe scurt

Stability AI a lansat cel mai recent produs al său, SDXL 1.0, un instrument de generare text-to-image cu o calitate îmbunătățită a imaginii și o interfață ușor de utilizat.

Cu 3.5 miliarde de parametri, poate produce imagini de 1 megapixel în diferite rapoarte de aspect.

Modelul este conceput pentru a eficientiza text-to-image proces de generare și include funcții de reglare fină, cum ar fi ControlNet, derivate din cercetarea Universității Stanford.

SDXL 1.0 este optimizat pentru GPU-uri pentru consumatori cu o capacitate VRAM de 8 GB și este la fel de eficient și pe instanțe cloud la prețuri rezonabile.

Software-ul oferă o reglare fină îmbunătățită, permițând generarea de LoRA personalizate sau puncte de control cu ​​supraîncărcare de date redusă.

Comunitatea AI se poate aștepta la actualizări în viitorul apropiat, iar SDXL 1.0 poate genera concepte avansate, cum ar fi detalii complicate sau compoziții spațiale complexe.

Instrumentul este open-source accesibil pe GitHub, promovând transparența și colaborarea în cadrul comunității.

Stable Diffusion XL 1.0 (SDXL 1.0), cel mai nou produs de la Stability AI, a fost eliberat în sfârșit. Acest instrument, care este poziționat ca cea mai recentă dezvoltare în generarea text-to-image, se remarcă prin calitatea îmbunătățită a imaginii și interfața prietenoasă cu utilizatorul.

Stability AI Lansează Stable Diffusion XL 1.0 pentru a produce rapid imagini de 1 megapixel
Credit: stability.ai
Legate de: Stocurile NVIDIA au crescut cu 26% după câștigurile puternice din primul trimestru conduse de cererea în creștere pentru GPU-uri AI

În timp ce mulți din industria AI își continuă îmbunătățirea platformelor, Stability AILansarea recentă a lui SDXL 1.0 arată un progres promițător. Impresionanții 3.5 miliarde de parametri ai modelului îi permit să producă rapid Imagini de 1 megapixel în diferite raporturi de aspect. Joe Penna, directorul de învățare automată aplicată la Stability AI, a subliniat capacitățile modelului într-o conversație cu TechCrunch. El a subliniat modul în care poate fi personalizat și modul în care puteți ajusta conceptele și stilurile de imagine utilizând indicii de bază de procesare a limbajului natural. Cu ajutorul acestor caracteristici, sarcinile utilizatorilor pot fi simplificate, respectând în același timp instrucțiuni clare pentru a crea modele complexe.

Stability AI pare să fi abordat provocările predominante în sectorul AI, în special în ceea ce privește generarea de text. În mod remarcabil, multe modele de ultimă oră text-to-image sunt adesea insuficiente atunci când au sarcina de a genera text lizibil, în special în stiluri complicate precum caligrafia. Cu toate acestea, SDXL 1.0 a demonstrat competența în generarea avansată de text.

Ceea ce diferențiază în continuare SDXL 1.0 este poziționarea sa competitivă față de alți concurenți majori, cum ar fi Midjourney și Firefly de la Adobe serviciu. Noul model subliniază procese îmbunătățite de rafinare a imaginii, rezultând culori mai bogate, iluminare superioară și contrast îmbunătățit. În plus, includerea unei funcții de reglare fină facilitează generarea de imagini personalizate.

Dezvoltarea SDXL 1.0 a beneficiat de o abordare simplificată de antrenament, beneficiind de baza mare de parametri, poziționându-l ca o bază ideală pentru diverse instrumente și capabilități. Elaborând atributele sale, Emad Mostaque, CEO al Stability AI, a declarat că SDXL 1.0 a fost meticulos creat pentru a eficientiza generarea text-to-image proces. Acest lucru a fost îmbogățit în continuare cu ControlNet, derivat din cercetarea Universității Stanford, facilitând capabilități îmbunătățite de reglare fină și compoziție.

O caracteristică demnă de remarcat a modelului SDXL 1.0 este designul său centrat pe utilizator. Spre deosebire de solicitări lungi pentru a obține rezultate dorite, modelul permite utilizatorilor să emită directive complexe în mai multe părți, captând succint intenția cu mai puține cuvinte decât modelele anterioare. De acum, acest model inovator este accesibil prin mai multe platforme, inclusiv serviciile Amazon Bedrock și Amazon SageMaker Jumpstart.

Performanță îmbunătățită pe GPU-uri pentru consumatori și funcții avansate de reglare fină

Imagine generată SDXL 1.0
Imagine generată SDXL 1.0
Legate de: Stability AI strânge 101 milioane USD, închide evaluarea la 1 miliard USD

Proiectat având în vedere compatibilitatea, SDXL 1.0 este optimizat pentru GPU-uri de consum cu o capacitate VRAM de 8 GB și este la fel de eficient și pe instanțe cloud la prețuri rezonabile.

Caracteristici și compatibilitate:

Lansarea SDXL 1.0 demonstrează angajamentul Stability de a asigura soluții AI eficiente și accesibile pentru utilizatori. Una dintre concluziile cheie din anunț este capacitatea software-ului de a funcționa fără probleme pe GPU-uri standard pentru consumatori. Pentru utilizatori, aceasta înseamnă potențialul de performanță optimă fără a fi nevoie de hardware de vârf sau specializat.

Îmbunătățiri ale reglajului fin:

Stabilitatea a încorporat caracteristici în SDXL 1.0 care simplifică procesul de reinstruire a modelului pentru seturi de date unice. Modelul actual permite generarea de LoRA personalizate sau puncte de control cu ​​supraîncărcare de date redusă, ceea ce deschide calea pentru adaptări mai eficiente și mai rapide ale modelului la nevoi specifice. În plus, există un indiciu către viitor ca Stability AI echipa este în plină dezvoltare a controalelor avansate pentru structuri, stiluri și compoziții specifice sarcinilor. Mai exact, T2I/ControlNet, care este specializat pentru SDXL, este la orizont. În timp ce aceste progrese rămân în faza pre-beta, comunitatea AI și utilizatorii pot anticipa actualizări în viitorul apropiat.

Redarea conceptelor avansate:

SDXL 1.0 își prezintă capacitatea de a genera concepte care anterior erau provocatoare pentru modelele de imagine. Aceasta include redarea detaliilor complicate, cum ar fi mâinile și textul, sau chiar compoziții spațiale mai complexe, cum ar fi scene care înfățișează o femeie în fundal urmărind un câine în prim-plan. Această caracteristică este deosebit de semnificativă, deoarece indică un salt în capacitatea software-ului de a interpreta și reda scenarii nuanțate și cu mai multe fațete.

Accesibilitate open source:

Pentru dezvoltatorii și entuziaștii interesați să aprofundeze, Stability a pus la dispoziție greutățile și codul pentru SDXL 1.0 pe GitHub. Această mișcare nu numai că promovează transparența, ci și încurajează dezvoltarea colaborativă și inovația în cadrul comunității.

Încearcă:

Pentru cei dornici să testeze capabilitățile SDXL 1.0, Stability l-a integrat în platforme precum DreamStudio și ClipDrop. În plus, sesiunile interactive și potențialele demonstrații sunt disponibile prin Discord, permițând utilizatorilor să experimenteze direct caracteristicile instrumentului.

Citiți mai multe despre AI:

Declinare a responsabilităţii

În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.

Despre autor

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Mai multe articole
Damir Yalalov
Damir Yalalov

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Hot Stories
Alăturați-vă Newsletter-ului nostru.
Ultimele ştiri

De la Ripple la Big Green DAO: Cum contribuie proiectele de criptomonede la caritate

Să explorăm inițiativele care valorifică potențialul monedelor digitale pentru cauze caritabile.

Aflați mai multe

AlphaFold 3, Med-Gemini și alții: modul în care AI transformă asistența medicală în 2024

Inteligența artificială se manifestă în diferite moduri în asistența medicală, de la descoperirea de noi corelații genetice până la abilitarea sistemelor chirurgicale robotizate...

Aflați mai multe
Alăturați-vă comunității noastre tehnologice inovatoare
Citeste mai mult
Află mai multe
Top 10 instrumente AI gratuite pentru crearea de conținut, editare video și multe altele
AI Wiki rezumat Educaţie Stil de viață Software Tehnologia
Top 10 instrumente AI gratuite pentru crearea de conținut, editare video și multe altele
14 Mai, 2024
Comisia pentru Valori Mobiliare din Hong Kong avertizează cu privire la înșelătoriile de deepfake care vizează industria criptografică: implicații pentru siguranța investitorilor
Stil de viață Securitate Wiki Software Povești și recenzii Tehnologia
Comisia pentru Valori Mobiliare din Hong Kong avertizează cu privire la înșelătoriile de deepfake care vizează industria criptografică: implicații pentru siguranța investitorilor
14 Mai, 2024
Ripple și Evmos colaborează la dezvoltarea XRP Ledger EVM Sidechain cu tehnologia EvmOS
Afaceri Buletin de stiri Tehnologia
Ripple și Evmos colaborează la dezvoltarea XRP Ledger EVM Sidechain cu tehnologia EvmOS
14 Mai, 2024
5ireChain inițiază „Testnet Thunder: GA” stimulat pentru testarea stresului în rețea, invită utilizatorii să participe la Airdrop Recompense
Buletin de stiri Tehnologia
5ireChain inițiază „Testnet Thunder: GA” stimulat pentru testarea stresului în rețea, invită utilizatorii să participe la Airdrop Recompense
14 Mai, 2024
CRYPTOMERIA LABS PTE. LTD.