Würstchen V2 mudel võidab Stable Diffusion XL, millel on muljetavaldav kiirus kõrge eraldusvõimega piltide loomiseks
Hiljutine säuts artikli pealkirjaga "Würstchen" (saksa keeles "vorst") autor on köitnud nii entusiastide kui ka ekspertide tähelepanu. Säuts jagas uue Würstchen V2 mudeli abil piltide genereerimise intrigeerivaid tulemusi.
Würstchen on kiire ja tõhus, genereerides pilte kiiremini kui mudelid Stable Diffusion XL, kasutades vähem mälu. Samuti on sellel väiksemad koolituskulud, kuna Würstchen v1 vajab ainult 9,000 GPU tundi eraldusvõimega 512 × 512, võrreldes 150,000 XNUMX GPU tunniga. Stable Diffusion 1.4. See 16-kordne kulude vähenemine ei too kasu mitte ainult uusi eksperimente läbi viivatele teadlastele, vaid avab ka ukse rohkematele organisatsioonidele selliste mudelite koolitamiseks. Würstchen v2 kasutas 24,602 6 GPU tundi, muutes selle 1.4 korda odavamaks kui SD512, mida treeniti ainult 512 × XNUMX.
Würstchen V2 on a difusioonimudel mis töötab väga tihendatud varjatud kujutiste ruumis, vähendades koolituse ja järelduste arvutuskulusid suurusjärgu võrra. See kasutab uudset disaini, mis saavutab 42-kordse ruumilise tihenduse, mida pole varem nähtud. Würstchen kasutab kaheastmelist tihendamist, etappi A ja B, mis dekodeerivad tihendatud pildid tagasi piksliruumi. Kolmas mudel, etapp C, õpitakse väga kokkusurutud latentses ruumis, mis nõuab praeguste parima jõudlusega mudelite jaoks kasutatavaid arvutusi, võimaldades samas odavamat ja kiiremat järeldust.
Würstchen V2 koosneb kahest difusiooniastmest:
- A etapp: See etapp hõlmab tekstipõhise difusiooni ja sellel on hämmastav 1 miljard parameetrit. Siinne kiirendus saavutatakse ülikõrge tihendustehnika abil. Märkimisväärne on see, et varjatud koodi suuruse 128x128x4 asemel, nagu näha SDXL-is, töötab Würstchen V2 algselt eraldusvõimega 24x24x16. See tähendab vähem piksleid, kuid rohkem kanaleid, mille tulemuseks on märkimisväärne kiiruse kasv.
- B etapp: See on 600 miljoni parameetriga difusioonimudel, mis vastutab pildi lahtipakkimise eest 24×24-lt eraldusvõimele 128×128.
Protsessi lõpetab 20 miljoni parameetriga dekooder, mis muudab peidetud koodi renderdatud pildiks.
Praktiline kasu, mis kohe silma paistab, on Würstchen V2 märkimisväärne kiirus. See töötab kiirusega, mis on 2–2.5 korda kiirem kui SDXL, mis on märkimisväärne edasiminek AI kujutise genereerimine.
Nagu iga tehnoloogilise uuenduse puhul, võib ka siin esineda kompromisse. Pildikvaliteedi osas viitavad mõned eksperdid kergele kaotusele, kuigi konkreetsete tõendite saamiseks on veel oodata kõikehõlmavat ja ausat võrdlust.
Loodud tekstist pildiks näited on allpool:
Loe rohkem seotud teemasid:
Kaebused
Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.
Umbes Autor
Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks.
Veel artikleidDamir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks.