Новостной репортаж Технологии
24 января 2023

VToonify: модель искусственного интеллекта в реальном времени для создания художественных портретных видео.

Коротко

Революционная структура VToonify была разработана разработчиками для обеспечения контролируемой передачи видео в портретном стиле с высоким разрешением.

Для создания потрясающих художественных портретов фреймворк использует слои StyleGAN со средним и высоким разрешением.

Это позволяет расширить существующий на основе StyleGAN модели тонирования изображений к видео.

Исследователи из Наньянского технологического университета представил новую структуру VToonify для создания управляемой передачи портретного видео в высоком разрешении. VToonify использует слои StyleGAN со средним и высоким разрешением для визуализации высококачественных художественных портретов на основе мультимасштабных функций содержимого, извлеченных кодировщиком, для лучшего сохранения деталей кадра. Экспериментальные результаты показывают, что наша платформа может создавать видео с неизменно высоким качеством и желаемым выражением лица без необходимости выравнивания лица или ограничений размера кадра.

В результате полностью сверточная архитектура, которая допускает несовмещенные лица в видеороликах разного размера, создает полные лица с органичными движениями. Фреймворк VToonify унаследовал привлекательные черты этих моделей для гибкого управления стилем цвета и интенсивности. Он совместим с существующими моделями тонирования изображений на основе StyleGAN, чтобы расширить их до тонификации видео. В этой работе представлены два экземпляра VToonify для передачи стиля портретного видео на основе коллекции и на основе образцов, соответственно, основанные на Toonify и DualStyleGAN.

Vtoonify: модель искусственного интеллекта в реальном времени для создания художественных портретных видео.

Обширные экспериментальные данные показывают, что предложенная структура VToonify превосходит конкурирующие подходы в создании художественных портретных фильмов с регулируемыми элементами управления стилем, которые отличаются превосходным качеством и согласованностью во времени. Чек об оплате GitHub Больше подробностей.

Связанная статья: OpenAI работает над созданием модели ИИ для видео

Чтобы обеспечить управляемую передачу стиля портретного видео с высоким разрешением, VToonify сочетает в себе преимущества платформы перевода изображений и платформы на основе StyleGAN.

(A) Для поддержки переменного размера ввода система перевода изображений использует полностью сверточные сети. Тем не менее, при обучении с нуля сложно передать стиль высокого разрешения и контроля.

(B) Платформа на основе StyleGAN, которая поддерживает только фиксированный размер изображения и потерю деталей, использует предварительно обученную модель StyleGAN для передачи стилей с высоким разрешением и управляемостью.

(C) Чтобы создать полностью сверточную архитектуру кодировщика-генератора, напоминающую структуру перевода изображений, наша гибридная система расширяет StyleGAN, удаляя его входную функцию фиксированного размера и слои с низким разрешением.

Чтобы сохранить детали кадра, разработчики обучают кодировщик извлекать функции многомасштабного содержимого из входного кадра в качестве дополнительного условия содержимого. VToonify наследует гибкость управления стилем модели StyleGAN, помещая его в генератор для очистки как его данных, так и модели.

Vtoonify: модель искусственного интеллекта в реальном времени для создания художественных портретных видео.
Связанная статья: Lambda Labs анонсировала микшер изображений с искусственным интеллектом, который может объединять до пяти изображений.

Платформа VToonify унаследовала привлекательные характеристики гибкого управления стилями от текущих моделей тоонизации изображений на основе StyleGAN и совместима с ними, что позволяет расширить их до видео тоонификация. Наш VToonify предлагает следующее, используя модель DualStyleGAN в качестве основы StyleGAN:

  • Перенос стиля из образцовых структур;
  • Модификация степени стиля;
  • Передача цветового стиля на основе образцов.
Vtoonify: модель искусственного интеллекта в реальном времени для создания художественных портретных видео.
Для дистилляции StyleGAN разработчики сравнивают две магистрали Toonify и DualStyleGAN, а также базовый уровень перевода изображения в изображение с высоким разрешением Pix2pixHD. VToonify-T и VToonify-D превосходят свои сопоставимые магистрали Toonify и DualStyleGAN с точки зрения стилизации всего видео, сохраняя при этом то же высокое качество и визуальные элементы, что и основы для каждого отдельного кадра. VToonify-T, например, следует за Toonify, чтобы наложить сильный эффект стиля, такой как фиолетовые волосы в стиле Arcane. С другой стороны, VToonify-D лучше сохраняет черты лица. Pix2pixHD имеет мерцание и артефакты по сравнению с VToonify-D.

Подробнее об ИИ:

Отказ от ответственности

В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.

Об авторе

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Другие статьи
Дамир Ялалов
Дамир Ялалов

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Hot Stories
Подпишитесь на нашу рассылку.
Новости

Наступил день вынесения приговора: судьба CZ висит на волоске, поскольку суд США рассматривает ходатайство Министерства юстиции

Чанпэн Чжао сегодня предстанет перед судом США в Сиэтле.

Узнать больше

Основателей Samourai Wallet обвиняют в содействии сделкам в даркнете на 2 миллиарда долларов

Задержание основателей Samourai Wallet представляет собой заметную неудачу для отрасли, подчеркивая упорное...

Узнать больше
Присоединяйтесь к нашему сообществу инновационных технологий
Узнать больше
Читать далее
AltLayer вступает во вторую фазу своей инициативы по стейкингу и представляет токен reALT
Области применения: Новостной репортаж Технологии
AltLayer вступает во вторую фазу своей инициативы по стейкингу и представляет токен reALT
2 мая 2024
Сеть BNB опубликовала отчет за первый квартал 1 года, в котором подчеркивается сокращение потерь стоимости на 2024%, в то время как TVL BSC взлетает на 55.8%
Области применения: Новостной репортаж Технологии
Сеть BNB опубликовала отчет за первый квартал 1 года, в котором подчеркивается сокращение потерь стоимости на 2024%, в то время как TVL BSC взлетает на 55.8%
2 мая 2024
Naver и Kaia из Kakao: новый азиатский блокчейн-гигант, готовый разрушить глобальные рынки криптовалют
Бизнес Software Истории и обзоры Технологии
Naver и Kaia из Kakao: новый азиатский блокчейн-гигант, готовый разрушить глобальные рынки криптовалют
2 мая 2024
Aave Labs представляет предложение «Aave 2030», включая запуск протокола Aave V4
Бизнес Новостной репортаж Технологии
Aave Labs представляет предложение «Aave 2030», включая запуск протокола Aave V4
2 мая 2024
CRYPTOMERIA LABS PTE. ООО