Microsoft выпустила диффузионную модель, которая может построить 3D-аватар из одной фотографии человека.
Коротко
Одно 2D-изображение лица человека можно использовать для создания 3D-аватара с помощью метода машинного обучения 3D Avatar Diffusion.
Его можно использовать для создания реалистичного трехмерного изображения человека для игр или других целей, а также для обеспечения виртуальной реальности (VR) или дополненной реальности (AR).
3D Avatar Diffusion — это алгоритм машинного обучения, который может взять одно 2D-изображение человеческого лица и создать трехмерный (3D) аватар. Затем аватар можно использовать для создания виртуальной реальности (VR) или дополненной реальности (AR) или просто для предоставления реалистичного трехмерного изображения человека для игр или других целей.
Диффузионная модель была развитый группой исследователей Microsoft Research и описан в статье, опубликованной в журнале ArXiv.
Диффузия 3D-аватаров основана на типе алгоритма машинного обучения, который называется диффузионной моделью. Диффузионные модели являются генеративными моделями, что означает, что они могут генерировать новые данные, аналогичные обучающим данным. Диффузионные модели уже использовались для создания 3D-изображений из 2D-изображений, но ADM — это первая диффузионная модель, которая может генерировать реалистичный 3D-аватар из одного 2D-изображения.
Для обучения модели исследователи использовали набор данных из более чем 200,000 3 2D-моделей лица. Набор данных включал широкий спектр лиц с разными оттенками кожи, прическами и чертами лица. Затем ADM смог изучить взаимосвязь между 3D-изображением и 3D-моделью лица и создать реалистичный 2D-аватар из одного XNUMXD-изображения.
Модель также можно использовать для создания аватара из фотографии, сделанной с другого ракурса.
В этом исследовании предлагается трехмерная генеративная модель, которая автоматически создает трехмерные цифровые аватары, которые представлены в виде полей нейронного излучения с использованием диффузионных моделей. Из-за неподъемных требований к памяти и обработке, связанных с 3D, создание богатых функций, необходимых для высококачественных аватаров, является огромной проблемой. Разработчики предлагают развернуть диффузионную сеть (Rodin) для решения этой проблемы.
Эта сеть развертывает многочисленные карты 2D-характеристик поля нейронного излучения в единую плоскость 2D-характеристик, где затем модель выполняет диффузию с учетом 3D. В модели Родена используется свертка с учетом 3D, которая обращается к спроецированным объектам в плоскости 2D объектов в соответствии с их исходными отношениями в 3D, чтобы обеспечить столь необходимую вычислительную эффективность при сохранении целостности диффузии в 3D.
Подробнее об ИИ:
Отказ от ответственности
В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.
Об авторе
Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета.
Другие статьиДамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета.