Новини Технологии
Януари 24, 2023

StyleGAN-T: Най-бързото генериране на текст към изображение, което дава резултати за по-малко от 0.1 секунда

Накратко

StyleGAN-T е нов GAN за поколение на tex2image.

Този GAN дава добри резултати и дори е доста бърз (0.1 секунди за изображение 512×512).

Новата архитектура е базирана на StyleGAN-XL, но преоценява дизайна на генератора и дискриминатора.

Със сигурност сте забелязали, че GAN вече не се обсъждат, когато се появи темата за генериране на изображения. След дифузионни модели като Stable Diffusion появиха се, GAN някак се оттеглиха на заден план. Това е така, защото те са трудни за обучение и често се спъват. Единственото предимство на GAN е, че за разлика от дифузионните модели, те произвеждат изображение в един цикъл („преминаване напред“), вместо много пъти.

StyleGAN-T: Най-бързото генериране на текст към изображение за по-малко от 0.1 секунда

Но сега нов играч от GANs влезе на терена: СтилГАН-Т. Този GAN за генериране на текст към изображение дава добри резултати бързо, тъй като отнема само 0.1 секунди за изображение 512×512. Новата архитектура е базирана на StyleGAN-XL, но преоценява дизайна на генератора и дискриминатора и използва CLIP за подравняване на текст и генерирани графики.

Свързана статия: VToonify: AI модел в реално време за генериране на художествени портретни видеоклипове

Като цяло StyleGAN-T сега създава текст към изображение по-бързо и по-точно от другите GAN. Въпреки това, GAN все още е ужасен и качеството на пълноразмерния SD модел очевидно е изключено. Но всичко ще зависи от способността за създаване на изключително висококачествени изображения от текст за по-малко от секунда за една година. Освен това ще се намира някъде между GAN и дифузионен модел.

Архитектура StyleGAN-T
Архитектура StyleGAN-T

Прочетете повече за AI:

Отказ от отговорност

В съответствие с Доверете се насоките на проекта, моля, имайте предвид, че предоставената на тази страница информация не е предназначена да бъде и не трябва да се тълкува като правен, данъчен, инвестиционен, финансов или каквато и да е друга форма на съвет. Важно е да инвестирате само това, което можете да си позволите да загубите, и да потърсите независим финансов съвет, ако имате някакви съмнения. За допълнителна информация предлагаме да се обърнете към правилата и условията, както и към страниците за помощ и поддръжка, предоставени от издателя или рекламодателя. MetaversePost се ангажира с точно, безпристрастно отчитане, но пазарните условия подлежат на промяна без предизвестие.

За автора

Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет. 

Още статии
Дамир Ялалов
Дамир Ялалов

Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет. 

Hot Stories
Присъединете се към нашия бюлетин.
Последни новини

Пристига денят на присъдата: Съдбата на CZ виси на равновесие, докато американският съд разглежда молбата на DOJ

Changpeng Zhao е готов да бъде осъден днес в американски съд в Сиатъл.

Научете още

Основателите на портфейла Samourai са обвинени в улесняване на $2 милиарда в Darknet сделки

Заплахата от страна на основателите на портфейла Samourai Wallet представлява забележителна неуспех за индустрията, подчертавайки постоянните...

Научете още
Присъединете се към нашата иновативна техническа общност
Вижте повече
Прочети повече
Pantera Capital инвестира в TON Blockchain, изразява увереност в потенциала на Telegram за разширяване на крипто достъпността
Бизнес Новини Технологии
Pantera Capital инвестира в TON Blockchain, изразява увереност в потенциала на Telegram за разширяване на крипто достъпността
Май 2, 2024
Mitosis набира $7 милиона финансиране от Amber Group и Foresight Ventures, за да усъвършенства модулния си протокол за ликвидност
Бизнес Новини Технологии
Mitosis набира $7 милиона финансиране от Amber Group и Foresight Ventures, за да усъвършенства модулния си протокол за ликвидност
Май 2, 2024
Galxe си партнира с Jambo, за да разшири глобалната достъпност до Web3
Бизнес Новини Технологии
Galxe си партнира с Jambo, за да разшири глобалната достъпност до Web3
Май 2, 2024
Google Med-Gemini е готов да даде преднина на GPT-4 С превъзходното си представяне в здравеопазването
AI Wiki Статии Софтуер Технологии
Google Med-Gemini е готов да даде преднина на GPT-4 С превъзходното си представяне в здравеопазването
Май 2, 2024
CRYPTOMERIA LABS PTE. LTD.