StyleGAN-T: Nopein tekstistä kuvaksi -sukupolvi, joka tuottaa tuloksia alle 0.1 sekunnissa
Lyhyesti
StyleGAN-T on uusi GAN tex2-kuvan luomiseen.
Tämä GAN tuottaa hyviä tuloksia ja on jopa melko nopea (0.1 sekuntia 512 × 512 -kuvalle).
Uusi arkkitehtuuri perustuu StyleGAN-XL:ään, mutta se arvioi generaattorin ja erottimen mallit uudelleen.
Olet varmasti huomannut, että GANista ei enää keskustella, kun kuvan luominen tulee esille. Diffuusiomallit, kuten Stable Diffusion syntyi, GANit vetäytyivät jotenkin taustalle. Tämä johtuu siitä, että heidän harjoitteleminen on haastavaa ja usein kompastuu niihin. GAN-laitteiden ainoa etu oli, että toisin kuin diffuusiomalleissa, ne tuottavat kuvan yhdellä ajolla ("eteenpäin") useiden ajojen sijaan.
Mutta nyt uusi pelaaja GANista on tullut kentälle: TyyliGAN-T. Tämä tekstistä kuvan luomiseen tarkoitettu GAN tuottaa hyviä tuloksia nopeasti, sillä 0.1×512-kuvaan menee vain 512 sekuntia. Uusi arkkitehtuuri perustuu StyleGAN-XL:ään, mutta se arvioi generaattorin ja erottimen suunnitelmat uudelleen ja käyttää CLIP:iä tekstikehotteiden tasaamiseen ja luotuun grafiikkaan.
Aiheeseen liittyvä artikkeli: VToonify: Reaaliaikainen tekoälymalli taiteellisten muotokuvavideoiden luomiseen |
Yleensä StyleGAN-T luo nyt tekstistä kuvaksi nopeammin ja tarkemmin kuin muut GAN:it. GAN on kuitenkin edelleen kauhea, ja täysikokoisen SD-mallin laatu ei tietenkään tule kysymykseen. Mutta kaikki riippuu kyvystä tuottaa erittäin korkealaatuisia kuvia tekstistä alle sekunnissa vuodessa. Lisäksi se putoaa jonnekin GANin ja diffuusio malli.
Lue lisää tekoälystä:
Vastuun kieltäminen
Mukaisesti Luottamusprojektin ohjeetHuomaa, että tällä sivulla annettuja tietoja ei ole tarkoitettu eikä niitä tule tulkita oikeudellisiksi, verotukselliseksi, sijoitus-, rahoitus- tai minkään muun muodon neuvoiksi. On tärkeää sijoittaa vain sen verran, mitä sinulla on varaa menettää, ja pyytää riippumatonta talousneuvontaa, jos sinulla on epäilyksiä. Lisätietoja saat käyttöehdoista sekä myöntäjän tai mainostajan tarjoamista ohje- ja tukisivuista. MetaversePost on sitoutunut tarkkaan, puolueettomaan raportointiin, mutta markkinaolosuhteet voivat muuttua ilman erillistä ilmoitusta.
Author
Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa.
lisää artikkeleitaDamir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa.