Microsoft пусна дифузионен модел, който може да изгради 3D аватар от една снимка на човек
Накратко
Едно 2D изображение на лицето на човек може да се използва за генериране на 3D аватар с помощта на техниката за машинно обучение 3D Avatar Diffusion.
Може да се използва за осигуряване на реалистичен 3D изглед на лицето за игри или други приложения, или за предоставяне на изживяване с виртуална реалност (VR) или разширена реалност (AR).
3D Avatar Diffusion е алгоритъм за машинно обучение, който може да вземе едно 2D изображение на човешко лице и да създаде триизмерен (3D) аватар. След това аватарът може да се използва за създаване на изживяване с виртуална реалност (VR) или разширена реалност (AR) или просто за предоставяне на реалистичен 3D изглед на лицето за игри или други цели.
Дифузионният модел беше разработени от екип от изследователи в Microsoft Research и е описан в статия, публикувана в списанието arXiv.
3D Avatar Diffusion се основава на вид алгоритъм за машинно обучение, наречен модел на дифузия. Дифузионните модели са генеративни модели, което означава, че могат да генерират нови данни, които са подобни на данните за обучение. Дифузионни модели са били използвани преди за генериране на 3D изображения от 2D изображения, но ADM е първият дифузионен модел, който може да генерира реалистичен 3D аватар от едно 2D изображение.
За да обучат модела, изследователите са използвали набор от данни от над 200,000 3 2D модела на лица. Наборът от данни включва голямо разнообразие от лица с различни тонове на кожата, прически и черти на лицето. След това ADM успя да научи връзката между 3D изображението и 3D модела на лицето и да генерира реалистичен 2D аватар от едно XNUMXD изображение.
Моделът може да се използва и за генериране на аватар от снимка, която е направена от различен ъгъл
Това проучване предлага 3D генеративен модел, който автоматично създава 3D цифрови аватари, които са представени като полета на невронно излъчване, използвайки модели на дифузия. Поради прекалено високите изисквания за памет и обработка, свързани с 3D, създаването на богатите функции, необходими за висококачествени аватари, е огромен проблем. Разработчиците предлагат разгръщащата се дифузионна мрежа (Rodin) да се справи с този проблем.
Тази мрежа разгръща многобройни 2D характеристики на поле на невронно излъчване в една 2D равнина на функции, където моделът след това изпълнява 3D-съзнателна дифузия. Моделът на Роден използва 3D-съзнаваща конволюция, която се грижи за проектираните характеристики в равнината на 2D характеристиките според първоначалната им връзка в 3D, за да осигури така необходимата изчислителна ефективност, като същевременно поддържа целостта на дифузията в 3D.
Прочетете повече за AI:
Отказ от отговорност
В съответствие с Доверете се насоките на проекта, моля, имайте предвид, че предоставената на тази страница информация не е предназначена да бъде и не трябва да се тълкува като правен, данъчен, инвестиционен, финансов или каквато и да е друга форма на съвет. Важно е да инвестирате само това, което можете да си позволите да загубите, и да потърсите независим финансов съвет, ако имате някакви съмнения. За допълнителна информация предлагаме да се обърнете към правилата и условията, както и към страниците за помощ и поддръжка, предоставени от издателя или рекламодателя. MetaversePost се ангажира с точно, безпристрастно отчитане, но пазарните условия подлежат на промяна без предизвестие.
За автора
Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет.
Още статииДамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет.