StyleGAN-T: ātrākā teksta pārveide attēlā, kas nodrošina rezultātus mazāk nekā 0.1 sekundē
Īsumā
StyleGAN-T ir jauns GAN tex2 attēlu ģenerēšanai.
Šis GAN nodrošina labus rezultātus un ir pat diezgan ātrs (0.1 s 512 × 512 attēlam).
Jaunā arhitektūra ir balstīta uz StyleGAN-XL, taču tā atkārtoti novērtē ģeneratora un diskriminatora dizainu.
Jūs noteikti esat pamanījuši, ka GAN vairs netiek apspriests, kad tiek runāts par attēlu ģenerēšanu. Pēc difūzijas modeļiem, piemēram Stable Diffusion parādījās, GAN kaut kā atkāpās otrajā plānā. Tas ir tāpēc, ka viņiem ir grūti trenēties un viņi bieži paklupa. Vienīgais GAN ieguvums bija tas, ka atšķirībā no difūzijas modeļiem tie rada attēlu vienā piegājienā (“pāreja uz priekšu”), nevis daudzu piegājienu.
Bet tagad laukumā ir nācis jauns spēlētājs no GAN: StilsGAN-T. Šis GAN teksta-attēlu ģenerēšanai nodrošina labus rezultātus ātri, jo 0.1 × 512 attēla iegūšanai ir nepieciešama tikai 512 sekunde. Jaunā arhitektūra ir balstīta uz StyleGAN-XL, taču tā atkārtoti novērtē ģeneratora un diskriminatora dizainu un izmanto CLIP teksta uzvedņu līdzināšanai un ģenerētajai grafikai.
Saistītais raksts: VToonify: reāllaika AI modelis māksliniecisku portretu video ģenerēšanai |
Kopumā StyleGAN-T tagad izveido tekstu pārveidošanu attēlā ātrāk un precīzāk nekā citi GAN. Tomēr GAN joprojām ir šausmīgs, un pilna izmēra SD modeļa kvalitāte acīmredzami nav apšaubāma. Bet tas viss būs atkarīgs no spējas ražot ārkārtīgi augstas kvalitātes attēlus no teksta mazāk nekā sekundē gada laikā. Turklāt tas atradīsies kaut kur starp GAN un difūzijas modelis.
Lasiet vairāk par AI:
Atbildības noraidīšana
Atbilstīgi Uzticības projekta vadlīnijas, lūdzu, ņemiet vērā, ka šajā lapā sniegtā informācija nav paredzēta un to nedrīkst interpretēt kā juridisku, nodokļu, ieguldījumu, finanšu vai jebkāda cita veida padomu. Ir svarīgi ieguldīt tikai to, ko varat atļauties zaudēt, un meklēt neatkarīgu finanšu padomu, ja jums ir šaubas. Lai iegūtu papildinformāciju, iesakām skatīt pakalpojumu sniegšanas noteikumus, kā arī palīdzības un atbalsta lapas, ko nodrošina izdevējs vai reklāmdevējs. MetaversePost ir apņēmies sniegt precīzus, objektīvus pārskatus, taču tirgus apstākļi var tikt mainīti bez iepriekšēja brīdinājuma.
Par Autors
Damirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē.
Vairāk rakstusDamirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē.