Novinky Technika
Ledna 24, 2023

StyleGAN-T: Nejrychlejší generace převodu textu na obrázek, která poskytuje výsledky za méně než 0.1 sekundy

Stručně

StyleGAN-T je nový GAN pro generaci tex2image.

Tento GAN poskytuje dobré výsledky a je dokonce docela rychlý (0.1 s pro obrázek 512×512).

Nová architektura je založena na StyleGAN-XL, ale přehodnocuje návrhy generátoru a diskriminátoru.

Určitě jste si všimli, že když se objeví téma generování obrázků, o GANech se už nemluví. Po difúzní modely jako Stable Diffusion GANy nějak ustoupily do pozadí. Je to proto, že jsou náročné na trénink a často zakopnou. Jedinou výhodou GAN bylo to, že na rozdíl od difúzních modelů vytvářejí obraz v jediném běhu („dopředný průchod“) namísto mnoha běhů.

StyleGAN-T: Nejrychlejší generování textu na obrázek za méně než 0.1 sekundy

Nyní však na pole vstoupil nový hráč z GAN: StylGAN-T. Tento GAN pro generování tex-to-image poskytuje dobré výsledky rychle, protože trvá pouze 0.1 sekundy pro obrázek 512 × 512. Nová architektura je založena na StyleGAN-XL, ale přehodnocuje návrhy generátoru a diskriminátoru a využívá CLIP pro rychlé zarovnání textu a generovanou grafiku.

Související článek: VToonify: Model umělé inteligence v reálném čase pro generování uměleckých portrétních videí

Obecně platí, že StyleGAN-T nyní vytváří převod textu na obrázek rychleji a přesněji než jiné GAN. GAN je však stále příšerný a o kvalitě full-size SD modelu zjevně nemůže být řeč. Ale to vše bude záviset na schopnosti vytvářet extrémně kvalitní obrázky z textu za méně než sekundu za rok. Navíc bude spadat někde mezi GAN a difuzní model.

Architektura StyleGAN-T
Architektura StyleGAN-T

Přečtěte si více o AI:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Další články
Damir Yalalov
Damir Yalalov

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více

Zakladatelé peněženky Samourai byli obviněni z usnadňování 2 miliard dolarů v obchodech Darknet

Obavy zakladatelů Peněženky Samourai představují pro průmysl významnou překážku, která podtrhuje přetrvávající ...

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Pantera Capital investuje do blockchainu TON, vyjadřuje důvěru v potenciál Telegramu rozšířit dostupnost kryptoměn
Business Novinky Technika
Pantera Capital investuje do blockchainu TON, vyjadřuje důvěru v potenciál Telegramu rozšířit dostupnost kryptoměn
2
Mitosis získává finanční prostředky ve výši 7 milionů USD od Amber Group a Foresight Ventures, aby podpořila svůj modulární protokol likvidity
Business Novinky Technika
Mitosis získává finanční prostředky ve výši 7 milionů USD od Amber Group a Foresight Ventures, aby podpořila svůj modulární protokol likvidity
2
Galxe spolupracuje se společností Jambo, aby rozšířila globální dostupnost Web3
Business Novinky Technika
Galxe spolupracuje se společností Jambo, aby rozšířila globální dostupnost Web3
2
Med-Gemini od Googlu se chystá dát náskok GPT-4 S vynikajícím výkonem ve zdravotnictví
AI Wiki Novinky Vývoj Technika
Med-Gemini od Googlu se chystá dát náskok GPT-4 S vynikajícím výkonem ve zdravotnictví
2
CRYPTOMERIA LABS PTE. LTD.