Uudiste reportaaž Tehnoloogia
September 19, 2023

Würstchen V2 mudel võidab Stable Diffusion XL, millel on muljetavaldav kiirus kõrge eraldusvõimega piltide loomiseks

Hiljutine säuts artikli pealkirjaga "Würstchen" (saksa keeles "vorst") autor on köitnud nii entusiastide kui ka ekspertide tähelepanu. Säuts jagas uue Würstchen V2 mudeli abil piltide genereerimise intrigeerivaid tulemusi.

Würstchen V2 mudel võidab Stable Diffusion XL, millel on muljetavaldav kiirus kõrge eraldusvõimega piltide loomiseks
seotud: Midjourney 5.2 ja Stable Diffusion SDXL 0.9 värskendused loominguliseks tekstist pildiks genereerimiseks

Würstchen on kiire ja tõhus, genereerides pilte kiiremini kui mudelid Stable Diffusion XL, kasutades vähem mälu. Samuti on sellel väiksemad koolituskulud, kuna Würstchen v1 vajab ainult 9,000 GPU tundi eraldusvõimega 512 × 512, võrreldes 150,000 XNUMX GPU tunniga. Stable Diffusion 1.4. See 16-kordne kulude vähenemine ei too kasu mitte ainult uusi eksperimente läbi viivatele teadlastele, vaid avab ka ukse rohkematele organisatsioonidele selliste mudelite koolitamiseks. Würstchen v2 kasutas 24,602 6 GPU tundi, muutes selle 1.4 korda odavamaks kui SD512, mida treeniti ainult 512 × XNUMX.

Üks silmapaistev funktsioon, mis AI kogukonnale kohe silma jäi, on Würstchen V2 muljetavaldav kiirus. Autori sõnul võtab selle mudeli abil nelja 1024 × 2048 pildi genereerimine vaid 7 sekundit. Selle perspektiivi vaatamiseks kuluks SDXL-mudelil sama ülesande täitmiseks suhteliselt aeglane 40 sekundit.

Varem tutvustatud Würstchen V1 jagab oma alust SDXL-iga kui latentne Difusioonimudel kuid sisaldab kiiremat Uneti arhitektuuri. Kuna kogukond ootab innukalt täiendavaid üksikasju Würstchen V2 arhitektuuri kohta, märgib ainuüksi suurenenud kiirus seda tähelepanuväärse arenguna.

Würstchen V2 on a difusioonimudel mis töötab väga tihendatud varjatud kujutiste ruumis, vähendades koolituse ja järelduste arvutuskulusid suurusjärgu võrra. See kasutab uudset disaini, mis saavutab 42-kordse ruumilise tihenduse, mida pole varem nähtud. Würstchen kasutab kaheastmelist tihendamist, etappi A ja B, mis dekodeerivad tihendatud pildid tagasi piksliruumi. Kolmas mudel, etapp C, õpitakse väga kokkusurutud latentses ruumis, mis nõuab praeguste parima jõudlusega mudelite jaoks kasutatavaid arvutusi, võimaldades samas odavamat ja kiiremat järeldust.

Würstchen V2 koosneb kahest difusiooniastmest:

  • A etapp: See etapp hõlmab tekstipõhise difusiooni ja sellel on hämmastav 1 miljard parameetrit. Siinne kiirendus saavutatakse ülikõrge tihendustehnika abil. Märkimisväärne on see, et varjatud koodi suuruse 128x128x4 asemel, nagu näha SDXL-is, töötab Würstchen V2 algselt eraldusvõimega 24x24x16. See tähendab vähem piksleid, kuid rohkem kanaleid, mille tulemuseks on märkimisväärne kiiruse kasv.
  • B etapp: See on 600 miljoni parameetriga difusioonimudel, mis vastutab pildi lahtipakkimise eest 24×24-lt eraldusvõimele 128×128.

Protsessi lõpetab 20 miljoni parameetriga dekooder, mis muudab peidetud koodi renderdatud pildiks.

Praktiline kasu, mis kohe silma paistab, on Würstchen V2 märkimisväärne kiirus. See töötab kiirusega, mis on 2–2.5 korda kiirem kui SDXL, mis on märkimisväärne edasiminek AI kujutise genereerimine.

Nagu iga tehnoloogilise uuenduse puhul, võib ka siin esineda kompromisse. Pildikvaliteedi osas viitavad mõned eksperdid kergele kaotusele, kuigi konkreetsete tõendite saamiseks on veel oodata kõikehõlmavat ja ausat võrdlust.

Loodud tekstist pildiks näited on allpool:

Loe rohkem seotud teemasid:

Kaebused

Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.

Umbes Autor

Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks. 

Veel artikleid
Damir Jalalov
Damir Jalalov

Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks. 

Institutsionaalne isu kasvab volatiilsuse tõttu Bitcoini ETF-ide poole

13F-i dokumentide kaudu avaldatud teave paljastab märkimisväärsed institutsionaalsed investorid, kes tegelevad Bitcoini ETF-idega, rõhutades, et ...

Rohkem teada

Karistuspäev saabub: CZ saatus on tasakaalus, kuna USA kohus võtab DOJ palvet arvesse

Changpeng Zhao ootab täna ees kohtuotsus USA Seattle'i kohtus.

Rohkem teada
Liituge meie uuendusliku tehnikakogukonnaga
Loe rohkem
Loe edasi
Donald Trumpi üleminek krüptotehnoloogiale: vastasest advokaadiks ja mida see USA krüptovaluutaturu jaoks tähendab
Äri turud Lood ja ülevaated Tehnoloogia
Donald Trumpi üleminek krüptotehnoloogiale: vastasest advokaadiks ja mida see USA krüptovaluutaturu jaoks tähendab
Võib 10 2024
Layer3 toob sel suvel turule L3 märgi, mis eraldab kogukonnale 51% kogupakkumisest
turud Uudiste reportaaž Tehnoloogia
Layer3 toob sel suvel turule L3 märgi, mis eraldab kogukonnale 51% kogupakkumisest
Võib 10 2024
Edward Snowdeni viimane hoiatus Bitcoini arendajatele: "Muutke privaatsus protokolli tasemel prioriteediks või riskige selle kaotamisega
turud TURVALISUS Wiki tarkvara Lood ja ülevaated Tehnoloogia
Edward Snowdeni viimane hoiatus Bitcoini arendajatele: "Muutke privaatsus protokolli tasemel prioriteediks või riskige selle kaotamisega
Võib 10 2024
Optimismi jõul töötav Ethereum Layer 2 Network Mint käivitab oma põhivõrgu 15. mail
Uudiste reportaaž Tehnoloogia
Optimismi jõul töötav Ethereum Layer 2 Network Mint käivitab oma põhivõrgu 15. mail
Võib 10 2024
CRYPTOMERIA LABS PTE. LTD.