Buletin de stiri Tehnologia
Aprilie 10, 2023

Stability AI Lansează un nou model numit SDXL Beta

Pe scurt

Stability AI a lansat un nou model numit SDXL Beta (Stable Diffusion XL Beta). Este un model mai mare, cu mai mulți parametri și unele îmbunătățiri necunoscute. Este disponibil la DreamStudio, Stability AIgeneratorul oficial de imagini și folosește algoritmi avansați și tehnici de deep learning pentru a crea imagini uimitoare.

Stability AI a dezvăluit o previzualizare a unui nou model numit SDXL Beta, prescurtare pentru Stable Diffusion XL Beta. Până acum, compania nu a împărtășit multe informații despre model, dar acesta este disponibil pentru testare pentru oricine dorește să facă acest lucru. Pentru ce este nou acest model SDXL stable diffusion? Care sunt avantajele și dezavantajele sale? Să investigăm.

Citeşte mai mult: Midjourney Descarcă de stiluri de artiști și Dall-E cu exemple: 130 de tehnici de pictură AI faimoase

Ce este mai exact modelul SDXL?

Modelul SDXL este un model nou care este în prezent fiind instruit. Este departe de a fi terminat, iar până la lansare, multe detalii despre el se pot schimba; din câte știm, s-ar putea să nu se numească nici modelul SDXL. Tot ce știm este că este un model mai mare, cu mai mulți parametri și unele îmbunătățiri necunoscute. Este un model v2, nu un model v3 (indiferent ce înseamnă asta). Este posibil ca îmbunătățirile din modelul v2 să îmbunătățească performanța sistemului, dar fără informații suplimentare, este dificil de determinat cât de semnificative pot fi aceste îmbunătățiri. În plus, ar fi util să știți ce parametri specifici au fost adăugați sau ajustați în această versiune.

Modelul SDXL este disponibil în prezent la DreamStudio, Stability AIgeneratorul oficial de imagini al lui. Selectați SDXL Beta din meniul modelului pentru a verifica. Se pare că folosește algoritmi avansați și tehnici de învățare profundă pentru a crea imagini uimitoare care sunt perfecte pentru o gamă largă de aplicații.

Ce este mai exact modelul SDXL?

Îmbunătățiri

Text lizibil. SDXL este capabil să genereze text lizibil și este probabil cea mai frapantă caracteristică, deoarece nu a fost posibil în modelele existente v1 și v2.1. Textul generat de SDXL nu este întotdeauna corect, așa cum puteți vedea în Stable Diffusion Text de mai jos. Cu toate acestea, este cu mult superior v2.1, darămite modelului v1. Acest lucru se datorează faptului că SDXL-urile utilizează un algoritm de învățare profundă mai avansat, care îi permite să înțeleagă și să genereze structuri de limbaj mai complexe. Odată cu dezvoltarea ulterioară, are potențialul de a deveni și mai precis și mai fiabil.

Solicitare: fotografia unui domn care ține o hârtie albă pe care scrie „Fără falsuri”
Solicitare: fotografia unui domn care ține o hârtie albă pe care scrie „Fără falsuri”
Fotografie cu o femeie roșcată ținând o pancartă neagră cu fonturi albe pe care scrie „Fără glume”
Solicitare: fotografia unei femei roșcate ținând o pancartă neagră cu fonturi albe pe care scrie „Fără glume”
Solicitare: Fotografia unei chinezoaice stând într-un cinema ținând o farfurie cu cuvântul „Durere și avion” scris pe ea.
Solicitare: Fotografia unei femei chineze stând într-un cinema ținând o farfurie cu cuvântul „Durere și avion” scris pe ea.

Anatomia omului. Generarea precisă de figuri umane corecte din punct de vedere anatomic a fost mult timp o provocare pentru stable diffusion. Prezența membrelor suplimentare sau lipsă este frecventă. Inpainting este de obicei folosit pentru a le remedia sau, mai recent, puteți utiliza funcția Open Pose a ControlNet pentru a duplica o poziție dintr-o imagine de referință. Ne bucurăm să observăm că aici s-a îmbunătățit modelul SDXL Beta. Modelul SDXL Beta a demonstrat o îmbunătățire semnificativă în duplicarea cu precizie a pozițiilor din imaginile de referință. Acesta poate fi un instrument valoros pentru diverse aplicații, cum ar fi animația și realitatea virtuală.

Fotografie cu o femeie într-o ținută sportivă care învârte mingea în mâna dreaptă
Solicitare: Fotografia unei femei într-o ținută sportivă învârtând mingea în mâna dreaptă
Fotografie cu un băiat stând sub luna roșie
Prompt: Fotografia unui băiat stând sub luna roșie
Prompt: O fotografie arată un bătrân alergând în pădure.

Stilul portret. SDXL Beta produce portrete excelente care arată ca niște fotografii – este un upgrade față de versiunea 1.5. Algoritmul îmbunătățit din SDXL Beta îmbunătățește detaliile și acuratețea culorilor portretelor, rezultând un aspect mai natural și mai realist. Utilizatorii pot, de asemenea, ajusta nivelurile de claritate și saturație pentru a obține efectele dorite.

Prompt: o poză cu un băiat și o fată
Prompt: o poză cu un băiat și o fată
Prompt: o fotografie portret a unui tip gras
Prompt: o fotografie portret a unui tip gras
Prompt: o fotografie cu o femeie din anii 80
Prompt: o fotografie cu o femeie din anii 80

Duoton. Cuvântul cheie duoton produce întotdeauna fotografii alb-negru în modelul v1.5. Cu toate acestea, acum, imaginile biton produse de SDXL Beta vin într-o varietate de culori. Este clar că, în comparație cu modelele v1, capacitatea de a interpreta promptul s-a îmbunătățit, rezultând răspunsuri mai precise și mai relevante de la modelele v2, făcându-le un instrument mai fiabil pentru sarcinile de procesare a limbajului natural.

portret în stil duoton al unui câine
Solicitare: portretul în stil bicolor al unui câine
peisajul biton al insulei
Prompt: peisajul biton al insulei
portret biton al unei tinere africane
Solicitare: portret biton al unei tinere africane

Stiluri artistice. Au existat unele ajustări minore, dar este dificil de determinat dacă noul model oferă rezultate mai bune, deoarece sunt pur și simplu unice. Este posibil ca aceste ajustări să fie o chestiune de preferință personală sau o opinie subiectivă, ceea ce face dificilă efectuarea a defijudecată nitivă asupra calității lor. Cu toate acestea, unicitatea ajustărilor poate fi demnă de remarcat și merită explorată în continuare.

New York de Ivan Aivazovsky
v 1.5: New York de Ivan Aivazovsky
New York de Ivan Aivazovsky
SDXL: New York de Ivan Aivazovsky
Pădurea Veche de Christopher Balaskas
v 1.5: Pădurea Veche de Christopher Balaskas
Pădurea Veche de Christopher Balaskas
SDXL: Pădurea veche de Christopher Balaskas

Concluzie

  • Stable Diffusion poate produce în sfârșit text care are sens.
  • SDXL oferă imagini mai plăcute din punct de vedere estetic decât modelele v2.1 și (într-o măsură mai mică) v1.5.
  • Noul model produce imagini mai precise.
  • Anatomia umană s-a îmbunătățit.
  • Solicitările negative nu sunt la fel de necesare ca în v2.1.
  • Poate crea portrete realiste.
  • Unele ciudățenii din model vor fi remediate înainte de lansare.

Citiți mai multe articole conexe:

Declinare a responsabilităţii

În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.

Despre autor

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Mai multe articole
Damir Yalalov
Damir Yalalov

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Hot Stories
Alăturați-vă Newsletter-ului nostru.
Ultimele ştiri

Sosește ziua sentinței: soarta lui CZ este în echilibru, în timp ce tribunalul american ia în considerare pledoaria DOJ

Changpeng Zhao este pe cale de a fi condamnat astăzi într-un tribunal american din Seattle.

Aflați mai multe

Fondatorii portofelului Samourai sunt acuzați că au facilitat 2 miliarde de dolari în oferte Darknet

Reținerea fondatorilor Samourai Wallet reprezintă un regres notabil pentru industrie, subliniind persistenta...

Aflați mai multe
Alăturați-vă comunității noastre tehnologice inovatoare
Citeste mai mult
Află mai multe
Ankr colaborează cu platforma AI Blockchain Talus Network pentru a debloca lichiditatea Bitcoin pentru AI
Afaceri Buletin de stiri Tehnologia
Ankr colaborează cu platforma AI Blockchain Talus Network pentru a debloca lichiditatea Bitcoin pentru AI
1 Mai, 2024
Binance Labs sprijină Movement Labs pentru a facilita integrarea Facebook Move în blockchain-uri
Afaceri Buletin de stiri Tehnologia
Binance Labs sprijină Movement Labs pentru a facilita integrarea Facebook Move în blockchain-uri
1 Mai, 2024
Soluție de comerț cu monede stabile BRICS Nations Eye
Afaceri pieţe Povești și recenzii Tehnologia
Soluție de comerț cu monede stabile BRICS Nations Eye
1 Mai, 2024
Bitcoin L2 Network BOB se integrează cu LayerZero pentru o funcționalitate îmbunătățită
Afaceri Buletin de stiri Tehnologia
Bitcoin L2 Network BOB se integrează cu LayerZero pentru o funcționalitate îmbunătățită
1 Mai, 2024
CRYPTOMERIA LABS PTE. LTD.