Новини Технологии
Януари 18, 2023

Microsoft пусна дифузионен модел, който може да изгради 3D аватар от една снимка на човек

Накратко

Едно 2D изображение на лицето на човек може да се използва за генериране на 3D аватар с помощта на техниката за машинно обучение 3D Avatar Diffusion.

Може да се използва за осигуряване на реалистичен 3D изглед на лицето за игри или други приложения, или за предоставяне на изживяване с виртуална реалност (VR) или разширена реалност (AR).

3D Avatar Diffusion е алгоритъм за машинно обучение, който може да вземе едно 2D изображение на човешко лице и да създаде триизмерен (3D) аватар. След това аватарът може да се използва за създаване на изживяване с виртуална реалност (VR) или разширена реалност (AR) или просто за предоставяне на реалистичен 3D изглед на лицето за игри или други цели.

Дифузионният модел беше разработени от екип от изследователи в Microsoft Research и е описан в статия, публикувана в списанието arXiv.

Microsoft пусна дифузионен модел, който може да изгради 3D аватар от една снимка на човек

3D Avatar Diffusion се основава на вид алгоритъм за машинно обучение, наречен модел на дифузия. Дифузионните модели са генеративни модели, което означава, че могат да генерират нови данни, които са подобни на данните за обучение. Дифузионни модели са били използвани преди за генериране на 3D изображения от 2D изображения, но ADM е първият дифузионен модел, който може да генерира реалистичен 3D аватар от едно 2D изображение.

За да обучат модела, изследователите са използвали набор от данни от над 200,000 3 2D модела на лица. Наборът от данни включва голямо разнообразие от лица с различни тонове на кожата, прически и черти на лицето. След това ADM успя да научи връзката между 3D изображението и 3D модела на лицето и да генерира реалистичен 2D аватар от едно XNUMXD изображение.

Моделът може да се използва и за генериране на аватар от снимка, която е направена от различен ъгъл

За персонализирания 3D аватар, моделът Rodin предлага манипулиране с текстово управление. Редактирането на естествен език е интуитивен начин за промяна на много различни функции на 3D аватар.

Това проучване предлага 3D генеративен модел, който автоматично създава 3D цифрови аватари, които са представени като полета на невронно излъчване, използвайки модели на дифузия. Поради прекалено високите изисквания за памет и обработка, свързани с 3D, създаването на богатите функции, необходими за висококачествени аватари, е огромен проблем. Разработчиците предлагат разгръщащата се дифузионна мрежа (Rodin) да се справи с този проблем.

По отношение на пол, възраст, раса, изражение, лицеви аксесоари и т.н., моделът показва изключително разнообразие от поколения.​

Тази мрежа разгръща многобройни 2D характеристики на поле на невронно излъчване в една 2D равнина на функции, където моделът след това изпълнява 3D-съзнателна дифузия. Моделът на Роден използва 3D-съзнаваща конволюция, която се грижи за проектираните характеристики в равнината на 2D характеристиките според първоначалната им връзка в 3D, за да осигури така необходимата изчислителна ефективност, като същевременно поддържа целостта на дифузията в 3D.

Прочетете повече за AI:

Отказ от отговорност

В съответствие с Доверете се насоките на проекта, моля, имайте предвид, че предоставената на тази страница информация не е предназначена да бъде и не трябва да се тълкува като правен, данъчен, инвестиционен, финансов или каквато и да е друга форма на съвет. Важно е да инвестирате само това, което можете да си позволите да загубите, и да потърсите независим финансов съвет, ако имате някакви съмнения. За допълнителна информация предлагаме да се обърнете към правилата и условията, както и към страниците за помощ и поддръжка, предоставени от издателя или рекламодателя. MetaversePost се ангажира с точно, безпристрастно отчитане, но пазарните условия подлежат на промяна без предизвестие.

За автора

Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет. 

Още статии
Дамир Ялалов
Дамир Ялалов

Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет. 

Hot Stories
Присъединете се към нашия бюлетин.
Последни новини

Институционалният апетит нараства към биткойн ETF на фона на волатилност

Оповестяванията чрез документи 13F разкриват забележителни институционални инвеститори, занимаващи се с биткойн ETF, което подчертава нарастващото приемане на...

Научете още

Пристига денят на присъдата: Съдбата на CZ виси на равновесие, докато американският съд разглежда молбата на DOJ

Changpeng Zhao е готов да бъде осъден днес в американски съд в Сиатъл.

Научете още
Присъединете се към нашата иновативна техническа общност
Вижте повече
Прочети повече
Radiant Capital инициира предложение RFP-34, предлага weETH Onboarding в своите внедрявания на Ethereum и Arbitrum
Новини Технологии
Radiant Capital инициира предложение RFP-34, предлага weETH Onboarding в своите внедрявания на Ethereum и Arbitrum
Май 7, 2024
Крипто борсата Binance ще пусне нови двойки за търговия и ще активира ботове за търговия на 8 май
пазари Новини Технологии
Крипто борсата Binance ще пусне нови двойки за търговия и ще активира ботове за търговия на 8 май
Май 7, 2024
Stacks, Moonriver Network, Hedera и Iron Fish ще участват в програмата на Axelar за междуверижен усилвател
Новини Технологии
Stacks, Moonriver Network, Hedera и Iron Fish ще участват в програмата на Axelar за междуверижен усилвател
Май 7, 2024
Tesla приема Dogecoin: Голям тласък за монетата Meme, тъй като тя се превръща в опция за плащане в онлайн магазина на Tesla
пазари Истории и рецензии Технологии
Tesla приема Dogecoin: Голям тласък за монетата Meme, тъй като тя се превръща в опция за плащане в онлайн магазина на Tesla
Май 7, 2024
CRYPTOMERIA LABS PTE. LTD.