Новини Технологии
Януари 24, 2023

VToonify: AI модел в реално време за генериране на художествени портретни видеоклипове

Накратко

Революционна рамка VToonify е разработена от разработчиците, за да осигури контролирани трансфери в портретен видео стил с висока разделителна способност.

За да създаде зашеметяващи артистични портрети, рамката използва слоевете със средна и висока разделителна способност на StyleGAN.

Позволява разширяване на съществуващите базирани на StyleGAN модели за тонизиране на изображения към видео.

Изследователи от Технологичния университет Нанянг имат въведе нова рамка VToonify за генериране на контролируем трансфер в портретен видео стил с висока разделителна способност. VToonify използва слоевете със средна и висока разделителна способност на StyleGAN, за да изобрази висококачествени артистични портрети, базирани на многомащабните характеристики на съдържанието, извлечени от енкодер за по-добро запазване на детайлите на рамката. Експерименталните резултати показват, че нашата рамка може да генерира видеоклипове с постоянно високо качество и желани изражения на лицето без необходимост от подравняване на лицето или ограничения за размера на рамката.

В резултат на това една напълно конволюционна архитектура, която приема неподравнени лица във видеоклипове с различни размери, създава пълни лица с органични движения. VToonify framework наследява привлекателните функции на тези модели за гъвкав контрол на стила на цвят и интензитет. Той е съвместим със съществуващите базирани на StyleGAN модели за тонизиране на изображения, за да ги разшири до видео тонизиране. Тази работа въвежда две инстанции на VToonify за прехвърляне на портретен видео стил, базиран на колекция и базиран на пример, съответно, изграден върху Toonify и DualStyleGAN.

Vtoonify: AI модел в реално време за генериране на художествени портретни видеоклипове

Обширни експериментални констатации показват, че предложената рамка VToonify превъзхожда конкурентните подходи при създаването на артистични портретни филми с регулируеми стилови контроли, които са с отлично качество и последователни във времето. Проверете GitHub за повече информация.

Свързана статия: OpenAI работи върху създаването на AI модел за видео

За да осигури контролиран портретен видео стил с висока разделителна способност, VToonify съчетава предимствата на рамката за превод на изображения и базираната на StyleGAN рамка.

(A) За да поддържа променлив входен размер, системата за превод на изображения използва напълно конволюционни мрежи. Въпреки това е предизвикателство да се придаде стил с висока разделителна способност и контролиран, когато се преподава от нулата.

(B) Базирана на StyleGAN рамка, която поддържа само фиксиран размер на картината и загуба на детайли, използва предварително обучения модел StyleGAN за прехвърляне на стил с висока разделителна способност и контролируем.

(C) За да се създаде напълно конволюционна архитектура на енкодер-генератор, наподобяваща тази на рамката за превод на изображения, нашата хибридна система разширява StyleGAN, като изтрива функцията за въвеждане с фиксиран размер и слоевете с ниска разделителна способност.

За да запазят детайлите на рамката, разработчиците обучават енкодер да извлича многомащабни характеристики на съдържанието от входната рамка като допълнително условие за съдържание. VToonify наследява гъвкавостта на стиловия контрол на модела StyleGAN, като го поставя в генератора, за да дестилира както неговите данни, така и модела.

Vtoonify: AI модел в реално време за генериране на художествени портретни видеоклипове
Свързана статия: Lambda Labs обяви смесител на изображения с изкуствен интелект, който може да комбинира до пет изображения

VToonify framework наследява привлекателните характеристики за гъвкав контрол на стила от настоящите базирани на StyleGAN модели за тонизиране на изображения и е съвместим с тях, за да ги разшири до видео тонизиране. Нашият VToonify предлага следното, използвайки модела DualStyleGAN като основа на StyleGAN:

  • Трансфер на стил от структури, базирани на образци;
  • Промяна на стиловата степен;
  • Прехвърляне на цветови стил въз основа на екземпляри.
Vtoonify: AI модел в реално време за генериране на художествени портретни видеоклипове
За дестилация на StyleGAN разработчиците сравняват два гръбнака Toonify и DualStyleGAN, както и основната линия за превод от изображение към изображение с висока разделителна способност Pix2pixHD. VToonify-T и VToonify-D превъзхождат сравнимите си опори, Toonify и DualStyleGAN, по отношение на стилизирането на цялото видео, като същевременно запазват същото високо качество и визуални елементи като опорите за всеки отделен кадър. VToonify-T, например, следва Toonify, за да наложи силен стилов ефект, като виолетова коса в стил Arcane. VToonify-D, от друга страна, върши по-добра работа за поддържане на чертите на лицето. Pix2pixHD има трептения и артефакти в сравнение с VToonify-D.

Прочетете повече за AI:

Отказ от отговорност

В съответствие с Доверете се насоките на проекта, моля, имайте предвид, че предоставената на тази страница информация не е предназначена да бъде и не трябва да се тълкува като правен, данъчен, инвестиционен, финансов или каквато и да е друга форма на съвет. Важно е да инвестирате само това, което можете да си позволите да загубите, и да потърсите независим финансов съвет, ако имате някакви съмнения. За допълнителна информация предлагаме да се обърнете към правилата и условията, както и към страниците за помощ и поддръжка, предоставени от издателя или рекламодателя. MetaversePost се ангажира с точно, безпристрастно отчитане, но пазарните условия подлежат на промяна без предизвестие.

За автора

Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет. 

Още статии
Дамир Ялалов
Дамир Ялалов

Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет. 

Hot Stories
Присъединете се към нашия бюлетин.
Последни новини

Пристига денят на присъдата: Съдбата на CZ виси на равновесие, докато американският съд разглежда молбата на DOJ

Changpeng Zhao е готов да бъде осъден днес в американски съд в Сиатъл.

Научете още

Основателите на портфейла Samourai са обвинени в улесняване на $2 милиарда в Darknet сделки

Заплахата от страна на основателите на портфейла Samourai Wallet представлява забележителна неуспех за индустрията, подчертавайки постоянните...

Научете още
Присъединете се към нашата иновативна техническа общност
Вижте повече
Прочети повече
AltLayer навлиза във втората фаза на своята инициатива за залагане, представя reALT Token
пазари Новини Технологии
AltLayer навлиза във втората фаза на своята инициатива за залагане, представя reALT Token
Май 2, 2024
Веригата BNB публикува отчет за първото тримесечие на 1 г., който подчертава 2024% намаление на загубата на стойност, докато BSC TVL скочи със 55.8%
пазари Новини Технологии
Веригата BNB публикува отчет за първото тримесечие на 1 г., който подчертава 2024% намаление на загубата на стойност, докато BSC TVL скочи със 55.8%
Май 2, 2024
Kaia на Naver и Kakao: Новата азиатска блокчейн мощност, готова да разруши глобалните крипто пазари
Бизнес Софтуер Истории и рецензии Технологии
Kaia на Naver и Kakao: Новата азиатска блокчейн мощност, готова да разруши глобалните крипто пазари
Май 2, 2024
Aave Labs разкрива предложение „Aave 2030“, включително стартиране на протокол Aave V4
Бизнес Новини Технологии
Aave Labs разкрива предложение „Aave 2030“, включително стартиране на протокол Aave V4
Май 2, 2024
CRYPTOMERIA LABS PTE. LTD.