Google представляет инновационную генеративную динамику изображений, которая имитирует динамические сцены в статических изображениях
Google представила Генеративная динамика изображенийновый подход позволяет преобразовать одно статическое изображение в бесшовное зацикленное видео или интерактивную динамическую сцену, предлагающую широкий спектр практических применений.
В основе этой новаторской технологии лежит моделирование пространства изображения до динамики сцены. Цель состоит в том, чтобы создать полное понимание того, как объекты и элементы изображения могут вести себя при различных динамических взаимодействиях. Это понимание затем можно использовать для эффективного моделирования реакции динамики объекта на взаимодействие с пользователем.
Ключевой особенностью этой технологии является возможность создания плавного зацикливания видео. Используя пространство изображения, предшествующее динамике сцены, система Google может экстраполировать и расширять движение элементов изображения, превращая его в захватывающий и непрерывный видеоцикл. Эта функциональность открывает многочисленные творческие возможности для создателей контента и дизайнеров.
Технология позволяет пользователям реалистично взаимодействовать с объектами в статических изображениях. Имитируя реакцию динамики объекта на возбуждение пользователя, система Google позволяет захватывающий и интерактивный опыт внутри изображений. Это может произвести революцию пространства метавселенной и как пользователи взаимодействуют с визуальным контентом.
В основе этой инновации лежит тщательно обученная модель. Модель Google обучается на обширном наборе данных о траекториях движения, извлеченных из реальных видеопоследовательностей, демонстрирующих естественное колебательное движение. Эти эпизоды включают сцены с такими элементами, как покачивание деревьев, движение цветов, мерцание свечей и развевающаяся на ветру одежда. Этот разнообразный набор данных позволяет модели понимать широкий спектр динамического поведения.
При предъявлении Одно изображениеобученная модель использует частотно-скоординированный процесс диффузионной выборки. Этот процесс прогнозирует попиксельное долговременное представление движения в области Фурье, называемое нейронной стохастической текстурой движения. Затем это представление преобразуется в плотные траектории движения, охватывающие все видео. В сочетании с модулем рендеринга на основе изображений эти траектории можно использовать для различных практических приложений.
По сравнению с априорами необработанных пикселей RGB, априоры с движением захватывают более фундаментальную, низкоразмерную подразмерную структуру, которая эффективно объясняет различия в значениях пикселей. Это приводит к более последовательной долгосрочной генерации и более детальному контролю над анимацией по сравнению с предыдущими методами, выполняющими анимация изображения через синтез сырого видео.
Сгенерированное представление движения удобно для ряда последующих приложений, таких как создание плавного зацикливания видео, редактирование сгенерированного движения и включение интерактивного режима. динамические изображения, моделируя реакцию динамики объекта на силы, приложенные пользователем.
Читайте другие связанные темы:
Отказ от ответственности
В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.
Об авторе
Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета.
Другие статьиДамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета.