Naujienų ataskaita Technologija
Sausis 24, 2023

StyleGAN-T: Greičiausias teksto į vaizdą generavimas, sukuriantis rezultatus per mažiau nei 0.1 sekundės

Trumpai

StyleGAN-T yra naujas GAN, skirtas tex2 vaizdų generavimui.

Šis GAN duoda gerų rezultatų ir netgi gana greitas (0.1 sek. 512 × 512 vaizdui).

Naujoji architektūra yra pagrįsta StyleGAN-XL, tačiau ji iš naujo įvertina generatoriaus ir diskriminatoriaus dizainą.

Jūs tikrai pastebėjote, kad GAN nebekalbama, kai iškyla įvaizdžio generavimo tema. Po difuzijos modeliai kaip Stable Diffusion atsirado, GAN kažkodėl pasitraukė į antrą planą. Taip yra todėl, kad jiems sunku treniruotis ir jie dažnai užkliūva. Vienintelis GAN privalumas buvo tas, kad, skirtingai nei difuzijos modeliai, jie sukuria vaizdą per vieną paleidimą („perėjimas į priekį“), o ne daug kartų.

StyleGAN-T: greičiausias teksto į vaizdą generavimas per mažiau nei 0.1 sekundės

Tačiau dabar į aikštelę įžengė naujas žaidėjas iš GAN: StiliusGAN-T. Šis GAN, skirtas iš teksto į vaizdą generuoti, duoda gerų rezultatų greitai, nes 0.1 × 512 dydžio vaizdas užtrunka tik 512 sek. Naujoji architektūra yra pagrįsta StyleGAN-XL, tačiau ji iš naujo įvertina generatoriaus ir diskriminatoriaus dizainą ir naudoja CLIP teksto raginimo lygiavimui ir generuojamai grafikai.

Susijęs straipsnis: VToonify: realaus laiko AI modelis, skirtas meniniams portretiniams vaizdo įrašams kurti

Apskritai, StyleGAN-T dabar sukuria tekstą į vaizdą greičiau ir tiksliau nei kiti GAN. Tačiau GAN vis dar yra siaubingas, o viso dydžio SD modelio kokybė akivaizdžiai nekyla. Tačiau visa tai priklausys nuo sugebėjimo iš teksto pagaminti itin aukštos kokybės vaizdus per mažiau nei sekundę per metus. Be to, jis atsidurs kažkur tarp GAN ir difuzijos modelis.

StyleGAN-T architektūra
StyleGAN-T architektūra

Skaitykite daugiau apie AI:

Atsakomybės neigimas

Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.

Apie autorių

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Daugiau straipsnių
Damiras Jalalovas
Damiras Jalalovas

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Hot Stories
Prisijunkite prie mūsų naujienlaiškio.
Paskutinės naujienos

Ateina nuosprendžio paskelbimo diena: CZ likimas subalansuotas, nes JAV teismas svarsto DOJ prašymą

Changpeng Zhao šiandien laukia nuosprendžio JAV teisme Sietle.

Žinoti daugiau

Samourai piniginės įkūrėjai apkaltinti palengvinę 2 mlrd. USD „Darknet“ sandorius

„Samourai Wallet“ įkūrėjų nuogąstavimai yra reikšmingas pramonės nuosmukis, pabrėžiantis nuolatinį ...

Žinoti daugiau
Prisijunkite prie mūsų naujoviškų technologijų bendruomenės
Skaityti daugiau
Skaityti daugiau
„Pantera Capital“ investuoja į „TON Blockchain“ ir išreiškia pasitikėjimą „Telegram“ galimybe išplėsti kriptovaliutų prieinamumą
Atsakingas verslas Naujienų ataskaita Technologija
„Pantera Capital“ investuoja į „TON Blockchain“ ir išreiškia pasitikėjimą „Telegram“ galimybe išplėsti kriptovaliutų prieinamumą
Gali 2, 2024
„Mitosis“ pritraukia 7 mln. USD lėšų iš „Amber Group“ ir „Foresight Ventures“, kad patobulintų savo modulinį likvidumo protokolą
Atsakingas verslas Naujienų ataskaita Technologija
„Mitosis“ pritraukia 7 mln. USD lėšų iš „Amber Group“ ir „Foresight Ventures“, kad patobulintų savo modulinį likvidumo protokolą
Gali 2, 2024
„Galxe“ bendradarbiauja su „Jambo“, siekdama išplėsti pasaulinį prieinamumą Web3
Atsakingas verslas Naujienų ataskaita Technologija
„Galxe“ bendradarbiauja su „Jambo“, siekdama išplėsti pasaulinį prieinamumą Web3
Gali 2, 2024
„Google“ „Med-Gemini“ pasiruošęs duoti pažangą GPT-4 Su puikiu našumu sveikatos priežiūros srityje
AI Wiki Naujienos programinė įranga Technologija
„Google“ „Med-Gemini“ pasiruošęs duoti pažangą GPT-4 Su puikiu našumu sveikatos priežiūros srityje
Gali 2, 2024
CRYPTOMERIA LABS PTE. LTD.