Buletin de stiri Tehnologia
19 Septembrie, 2023

Modelul Würstchen V2 a câștigat Stable Diffusion XL cu viteză impresionantă pentru generarea de imagini de înaltă rezoluție

Un tweet recent de autorul unui articol intitulat „Würstchen” (germană pentru „cârnat”) a captat atenția entuziaștilor și experților deopotrivă. Tweet-ul a împărtășit rezultatele intrigante ale generării de imagini folosind noul model Würstchen V2.

Modelul Würstchen V2 a câștigat Stable Diffusion XL cu viteză impresionantă pentru generarea de imagini de înaltă rezoluție
Legate de: Midjourney 5.2 și Stable Diffusion Actualizări SDXL 0.9 pentru generarea creativă de text în imagine

Würstchen este rapid și eficient, generând imagini mai rapid decât modele asemănătoare Stable Diffusion XL în timp ce utilizați mai puțină memorie. De asemenea, are costuri reduse de formare, Würstchen v1 necesitând doar 9,000 de ore de antrenament GPU la rezoluții de 512×512, comparativ cu 150,000 de ore GPU petrecute pe Stable Diffusion 1.4. Această reducere de 16 ori a costurilor nu numai că aduce beneficii cercetătorilor care efectuează noi experimente, dar deschide și ușa pentru mai multe organizații să antreneze astfel de modele. Würstchen v2 a folosit 24,602 de ore GPU, ceea ce îl face de 6 ori mai ieftin decât SD1.4, care a fost antrenat doar la 512×512.

Modelul Würstchen V2 a câștigat Stable Diffusion XL cu viteză impresionantă pentru generarea de imagini de înaltă rezoluție
O caracteristică remarcabilă care a atras imediat atenția comunității AI este viteza impresionantă a lui Würstchen V2. Potrivit autorului, generarea a patru imagini 1024×2048 folosind acest model durează doar 7 secunde. Pentru a pune acest lucru în perspectivă, modelul SDXL ar necesita 40 de secunde relativ lente pentru a realiza aceeași sarcină.

Modelul Würstchen V2 a câștigat Stable Diffusion XL cu viteză impresionantă pentru generarea de imagini de înaltă rezoluție
Würstchen V1, introdus anterior, își împărtășește fundația cu SDXL ca Latent Model de difuzie dar încorporează o arhitectură Unet mai rapidă. Pe măsură ce comunitatea anticipează cu nerăbdare detalii suplimentare despre arhitectura Würstchen V2, viteza îmbunătățită îl marchează ca o dezvoltare demnă de remarcat.

Würstchen V2 este un model de difuzie care funcționează într-un spațiu latent de imagini foarte comprimat, reducând costurile de calcul pentru antrenament și inferență cu ordine de mărime. Utilizează un design nou care realizează o compresie spațială de 42x, o performanță nemaivăzută anterior. Würstchen folosește o compresie în două etape, Etapa A și Etapa B, care decodifică imaginile comprimate înapoi în spațiul pixelilor. Un al treilea model, Etapa C, este învățat în spațiul latent foarte comprimat, necesitând fracțiuni de calcul utilizate pentru modelele actuale cu cele mai bune performanțe, permițând în același timp o inferență mai ieftină și mai rapidă.

Würstchen V2 cuprinde două etape de difuzie:

  • Etapa A: Această etapă implică difuzarea condiționată de text și se mândrește cu 1 miliard de parametri uimitoare. Accelerația aici este realizată prin tehnici de compresie ultra-înaltă. În special, în loc de dimensiunea codului ascuns de 128x128x4, așa cum se vede în SDXL, Würstchen V2 funcționează inițial la o rezoluție de 24x24x16. Aceasta înseamnă mai puțini pixeli, dar mai multe canale, rezultând o creștere semnificativă a vitezei.
  • Etapa B: Acesta este un model de difuzie echipat cu 600 de milioane de parametri, responsabil pentru decomprimarea imaginii de la 24×24 la o rezoluție de 128×128.

Finalizarea procesului este un decodor cu 20 de milioane de parametri care transformă codul ascuns într-o imagine redată.

Beneficiul practic care iese imediat în evidență este viteza remarcabilă a lui Würstchen V2. Funcționează la o viteză care este de 2-2.5 ori mai rapidă decât SDXL, un progres demn de remarcat în domeniul Generare de imagini AI.

Ca și în cazul oricărei inovații tehnologice, pot exista compromisuri. În ceea ce privește calitatea imaginii, unii experți sugerează o ușoară pierdere, deși încă se așteaptă o comparație cuprinzătoare și sinceră pentru a oferi dovezi concrete.

Exemple generate de text în imagine sunt mai jos:

Modelul Würstchen V2 a câștigat Stable Diffusion XL cu viteză impresionantă pentru generarea de imagini de înaltă rezoluție
Modelul Würstchen V2 a câștigat Stable Diffusion XL cu viteză impresionantă pentru generarea de imagini de înaltă rezoluție
Modelul Würstchen V2 a câștigat Stable Diffusion XL cu viteză impresionantă pentru generarea de imagini de înaltă rezoluție
Modelul Würstchen V2 a câștigat Stable Diffusion XL cu viteză impresionantă pentru generarea de imagini de înaltă rezoluție
Modelul Würstchen V2 a câștigat Stable Diffusion XL cu viteză impresionantă pentru generarea de imagini de înaltă rezoluție

Citiți mai multe subiecte conexe:

Declinare a responsabilităţii

În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.

Despre autor

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Mai multe articole
Damir Yalalov
Damir Yalalov

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Hot Stories
Alăturați-vă Newsletter-ului nostru.
Ultimele ştiri

Calmul dinaintea furtunii Solana: Ce spun acum graficele, balenele și semnalele on-chain

Solana a demonstrat o performanță solidă, determinată de creșterea adopției, a interesului instituțional și a parteneriatelor cheie, confruntându-se în același timp cu potențiale...

Aflați mai multe

Criptomonedele în aprilie 2025: tendințe cheie, schimbări și ce urmează

În aprilie 2025, spațiul criptomonedelor s-a concentrat pe consolidarea infrastructurii de bază, Ethereum pregătindu-se pentru Pectra...

Aflați mai multe
Citește mai mult
Află mai multe
În interiorul HSC Asset Management Hong Kong 2026: Faceți cunoștință cu greii instituționali RedefiCriptomonede, Piețe de Capital și Tokenizare
Hack Seasons Stil de viață Buletin de stiri Tehnologia
În interiorul HSC Asset Management Hong Kong 2026: Faceți cunoștință cu greii instituționali RedefiCriptomonede, Piețe de Capital și Tokenizare
Aprilie 21, 2026
Adobe CX Enterprise promovează inteligența artificială agentică, în timp ce analiștii evaluează inovația în raport cu riscurile de guvernanță
Buletin de stiri Tehnologia
Adobe CX Enterprise promovează inteligența artificială agentică, în timp ce analiștii evaluează inovația în raport cu riscurile de guvernanță
Aprilie 21, 2026
Bitget lansează Ulysses pentru a accelera eforturile de reimplicare instituțională și de integrare
Buletin de stiri Tehnologia
Bitget lansează Ulysses pentru a accelera eforturile de reimplicare instituțională și de integrare
Aprilie 21, 2026
Ascensiunea roiurilor de agenți: Lansarea Kimi K2.6 de la Moonshot AI semnalează o trecere de la inteligența artificială bazată pe prompturi la sistemele autonome
Buletin de stiri Tehnologia
Ascensiunea roiurilor de agenți: Lansarea Kimi K2.6 de la Moonshot AI semnalează o trecere de la inteligența artificială bazată pe prompturi la sistemele autonome
Aprilie 21, 2026
CRYPTOMERIA LABS PTE. LTD.