Vijesti Tehnologija
24. 2023. XNUMX.

StyleGAN-T: Najbrže generiranje teksta u sliku koje daje rezultate za manje od 0.1 sekunde

Ukratko

StyleGAN-T je novi GAN za generaciju tex2image.

Ovaj GAN daje dobre rezultate i čak je prilično brz (0.1 sekunda za sliku 512×512).

Nova arhitektura temelji se na StyleGAN-XL, ali preispituje dizajn generatora i diskriminatora.

Zasigurno ste primijetili da se o GAN-ovima više ne raspravlja kada se pojavi tema generiranja slika. Nakon difuzijskih modela poput Stable Diffusion pojavili, GAN-ovi su se nekako povukli u pozadinu. To je zato što ih je teško trenirati i često se spotiču. Jedina prednost GAN-ova bila je ta što, za razliku od difuzijskih modela, proizvode sliku u jednom ciklusu ("prolaz naprijed") umjesto u mnogim ciklusima.

StyleGAN-T: Najbrže generiranje teksta u sliku za manje od 0.1 sekunde

Ali sada je novi igrač iz GAN-a ušao na teren: StilGAN-T. Ovaj GAN za generiranje teksta u sliku daje dobre rezultate brzo, jer je potrebno samo 0.1 sekundu za sliku 512×512. Nova arhitektura temelji se na StyleGAN-XL, ali preispituje dizajn generatora i diskriminatora i koristi CLIP za usklađivanje teksta i generiranu grafiku.

Povezani članak: VToonify: AI model u stvarnom vremenu za generiranje umjetničkih portretnih videa

Općenito, StyleGAN-T sada stvara tekst u sliku brže i točnije od ostalih GAN-ova. Međutim, GAN je i dalje grozan, a kvaliteta SD modela u punoj veličini očito ne dolazi u obzir. Ali to će sve ovisiti o sposobnosti proizvodnje izuzetno kvalitetnih slika iz teksta u manje od jedne sekunde u godini. Osim toga, bit će negdje između GAN-a i difuzijski model.

StilGAN-T arhitektura
StilGAN-T arhitektura

Pročitajte više o AI:

Izjava o odricanju od odgovornosti

U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.

O autoru

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Više članaka
Damir Yalalov
Damir Yalalov

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Stiže dan izricanja presude: CZ-ova sudbina visi na ravnoteži dok američki sud razmatra izjavu DOJ-a

Changpeng Zhao danas će se suočiti s kaznom na američkom sudu u Seattleu.

Znati više

Osnivači novčanika Samourai optuženi za omogućavanje 2 milijarde dolara u poslovima Darkneta

Uhićenje osnivača Samourai Walleta predstavlja značajno nazadovanje u industriji, naglašavajući upornu ...

Znati više
Pridružite se našoj zajednici inovativnih tehnologija
opširnije
Čitaj više
Pantera Capital ulaže u TON Blockchain, izražava povjerenje u potencijal Telegrama da proširi kripto pristupačnost
posao Vijesti Tehnologija
Pantera Capital ulaže u TON Blockchain, izražava povjerenje u potencijal Telegrama da proširi kripto pristupačnost
Neka 2, 2024
Mitosis prikuplja 7 milijuna dolara financiranja od Amber Group i Foresight Ventures kako bi unaprijedio svoj modularni protokol likvidnosti
posao Vijesti Tehnologija
Mitosis prikuplja 7 milijuna dolara financiranja od Amber Group i Foresight Ventures kako bi unaprijedio svoj modularni protokol likvidnosti
Neka 2, 2024
Galxe surađuje s Jambom kako bi proširio globalnu dostupnost na Web3
posao Vijesti Tehnologija
Galxe surađuje s Jambom kako bi proširio globalnu dostupnost na Web3
Neka 2, 2024
Googleov Med-Gemini spreman dati prednost GPT-4 Sa svojom vrhunskom izvedbom u zdravstvu
AI Wiki Vijesti iz kluba softver Tehnologija
Googleov Med-Gemini spreman dati prednost GPT-4 Sa svojom vrhunskom izvedbom u zdravstvu
Neka 2, 2024
CRYPTOMERIA LABS PTE. LTD.