Новостной репортаж Технологии
18 января 2023

Microsoft выпустила диффузионную модель, которая может построить 3D-аватар из одной фотографии человека.

Коротко

Одно 2D-изображение лица человека можно использовать для создания 3D-аватара с помощью метода машинного обучения 3D Avatar Diffusion.

Его можно использовать для создания реалистичного трехмерного изображения человека для игр или других целей, а также для обеспечения виртуальной реальности (VR) или дополненной реальности (AR).

3D Avatar Diffusion — это алгоритм машинного обучения, который может взять одно 2D-изображение человеческого лица и создать трехмерный (3D) аватар. Затем аватар можно использовать для создания виртуальной реальности (VR) или дополненной реальности (AR) или просто для предоставления реалистичного трехмерного изображения человека для игр или других целей.

Диффузионная модель была развитый группой исследователей Microsoft Research и описан в статье, опубликованной в журнале ArXiv.

Microsoft выпустила диффузионную модель, которая может построить 3D-аватар из одной фотографии человека.

Диффузия 3D-аватаров основана на типе алгоритма машинного обучения, который называется диффузионной моделью. Диффузионные модели являются генеративными моделями, что означает, что они могут генерировать новые данные, аналогичные обучающим данным. Диффузионные модели уже использовались для создания 3D-изображений из 2D-изображений, но ADM — это первая диффузионная модель, которая может генерировать реалистичный 3D-аватар из одного 2D-изображения.

Для обучения модели исследователи использовали набор данных из более чем 200,000 3 2D-моделей лица. Набор данных включал широкий спектр лиц с разными оттенками кожи, прическами и чертами лица. Затем ADM смог изучить взаимосвязь между 3D-изображением и 3D-моделью лица и создать реалистичный 2D-аватар из одного XNUMXD-изображения.

Модель также можно использовать для создания аватара из фотографии, сделанной с другого ракурса.

Для персонализированного 3D-аватара модель Родена предлагает манипулирование текстом. Редактирование естественного языка — это интуитивно понятный способ изменить множество различных функций 3D-аватара.

В этом исследовании предлагается трехмерная генеративная модель, которая автоматически создает трехмерные цифровые аватары, которые представлены в виде полей нейронного излучения с использованием диффузионных моделей. Из-за неподъемных требований к памяти и обработке, связанных с 3D, создание богатых функций, необходимых для высококачественных аватаров, является огромной проблемой. Разработчики предлагают развернуть диффузионную сеть (Rodin) для решения этой проблемы.

С точки зрения пола, возраста, расы, выражения, лицевых аксессуаров и т. д. модель демонстрирует выдающееся разнообразие поколений.​

Эта сеть развертывает многочисленные карты 2D-характеристик поля нейронного излучения в единую плоскость 2D-характеристик, где затем модель выполняет диффузию с учетом 3D. В модели Родена используется свертка с учетом 3D, которая обращается к спроецированным объектам в плоскости 2D объектов в соответствии с их исходными отношениями в 3D, чтобы обеспечить столь необходимую вычислительную эффективность при сохранении целостности диффузии в 3D.

Подробнее об ИИ:

Отказ от ответственности

В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.

Об авторе

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Другие статьи
Дамир Ялалов
Дамир Ялалов

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Hot Stories
Подпишитесь на нашу рассылку.
Новости

Институциональный аппетит к биткойн-ETF растет на фоне волатильности

Раскрытие информации через отчеты 13F показывает, что известные институциональные инвесторы балуются биткойн-ETF, подчеркивая растущее признание...

Узнать больше

Наступил день вынесения приговора: судьба CZ висит на волоске, поскольку суд США рассматривает ходатайство Министерства юстиции

Чанпэн Чжао сегодня предстанет перед судом США в Сиэтле.

Узнать больше
Присоединяйтесь к нашему сообществу инновационных технологий
Узнать больше
Читать далее
Radiant Capital инициирует предложение RFP-34 и предлагает включить weETH в свои развертывания Ethereum и Arbitrum
Новостной репортаж Технологии
Radiant Capital инициирует предложение RFP-34 и предлагает включить weETH в свои развертывания Ethereum и Arbitrum
7 мая 2024
Криптобиржа Binance запустит новые торговые пары и включит торговых ботов 8 мая
Области применения: Новостной репортаж Технологии
Криптобиржа Binance запустит новые торговые пары и включит торговых ботов 8 мая
7 мая 2024
Stacks, Moonriver Network, Hedera и Iron Fish примут участие в программе межцепных усилителей Axelar
Новостной репортаж Технологии
Stacks, Moonriver Network, Hedera и Iron Fish примут участие в программе межцепных усилителей Axelar
7 мая 2024
Tesla использует Dogecoin: значительный рост популярности монеты Meme, поскольку она становится вариантом оплаты в интернет-магазине Tesla
Области применения: Истории и обзоры Технологии
Tesla использует Dogecoin: значительный рост популярности монеты Meme, поскольку она становится вариантом оплаты в интернет-магазине Tesla
7 мая 2024
CRYPTOMERIA LABS PTE. ООО