StyleGAN-T: Най-бързото генериране на текст към изображение, което дава резултати за по-малко от 0.1 секунда
Накратко
StyleGAN-T е нов GAN за поколение на tex2image.
Този GAN дава добри резултати и дори е доста бърз (0.1 секунди за изображение 512×512).
Новата архитектура е базирана на StyleGAN-XL, но преоценява дизайна на генератора и дискриминатора.
Със сигурност сте забелязали, че GAN вече не се обсъждат, когато се появи темата за генериране на изображения. След дифузионни модели като Stable Diffusion появиха се, GAN някак се оттеглиха на заден план. Това е така, защото те са трудни за обучение и често се спъват. Единственото предимство на GAN е, че за разлика от дифузионните модели, те произвеждат изображение в един цикъл („преминаване напред“), вместо много пъти.
Но сега нов играч от GANs влезе на терена: СтилГАН-Т. Този GAN за генериране на текст към изображение дава добри резултати бързо, тъй като отнема само 0.1 секунди за изображение 512×512. Новата архитектура е базирана на StyleGAN-XL, но преоценява дизайна на генератора и дискриминатора и използва CLIP за подравняване на текст и генерирани графики.
Свързана статия: VToonify: AI модел в реално време за генериране на художествени портретни видеоклипове |
Като цяло StyleGAN-T сега създава текст към изображение по-бързо и по-точно от другите GAN. Въпреки това, GAN все още е ужасен и качеството на пълноразмерния SD модел очевидно е изключено. Но всичко ще зависи от способността за създаване на изключително висококачествени изображения от текст за по-малко от секунда за една година. Освен това ще се намира някъде между GAN и дифузионен модел.
Прочетете повече за AI:
Отказ от отговорност
В съответствие с Доверете се насоките на проекта, моля, имайте предвид, че предоставената на тази страница информация не е предназначена да бъде и не трябва да се тълкува като правен, данъчен, инвестиционен, финансов или каквато и да е друга форма на съвет. Важно е да инвестирате само това, което можете да си позволите да загубите, и да потърсите независим финансов съвет, ако имате някакви съмнения. За допълнителна информация предлагаме да се обърнете към правилата и условията, както и към страниците за помощ и поддръжка, предоставени от издателя или рекламодателя. MetaversePost се ангажира с точно, безпристрастно отчитане, но пазарните условия подлежат на промяна без предизвестие.
За автора
Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет.
Още статииДамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет.