Ulat sa Balita Teknolohiya
Enero 18, 2023

Naglabas ang Microsoft ng diffusion model na maaaring bumuo ng 3D avatar mula sa isang larawan ng isang tao

Sa madaling sabi

Maaaring gamitin ang isang solong 2D na larawan ng mukha ng isang tao upang bumuo ng 3D avatar gamit ang 3D Avatar Diffusion machine learning technique.

Magagamit ito para magbigay ng makatotohanang 3D view ng tao para sa paglalaro o iba pang gamit, o para magbigay ng karanasan sa virtual reality (VR) o augmented reality (AR).

Ang 3D Avatar Diffusion ay isang machine learning algorithm na maaaring kumuha ng isang 2D na imahe ng mukha ng tao at lumikha ng three-dimensional (3D) avatar. Pagkatapos ay magagamit ang avatar upang lumikha ng karanasan sa virtual reality (VR) o augmented reality (AR) o para lang magbigay ng makatotohanang 3D view ng tao para sa paglalaro o iba pang layunin.

Ang modelo ng pagsasabog ay umunlad ng isang pangkat ng mga mananaliksik sa Microsoft Research at inilarawan sa isang papel na inilathala sa journal arXiv.

Naglabas ang Microsoft ng diffusion model na maaaring bumuo ng 3D avatar mula sa isang larawan ng isang tao

Ang 3D Avatar Diffusion ay batay sa isang uri ng machine-learning algorithm na tinatawag na diffusion model. Ang mga modelo ng pagsasabog ay mga generative na modelo, na nangangahulugang maaari silang bumuo ng bagong data na katulad ng data ng pagsasanay. Mga modelo ng pagsasabog ay ginamit noon upang makabuo ng mga 3D na larawan mula sa mga 2D na larawan, ngunit ang ADM ay ang unang modelo ng pagsasabog na maaaring makabuo ng isang makatotohanang 3D na avatar mula sa isang solong 2D na larawan.

Upang sanayin ang modelo, gumamit ang mga mananaliksik ng dataset ng mahigit 200,000 3D face models. Kasama sa dataset ang iba't ibang uri ng mga mukha na may iba't ibang kulay ng balat, hairstyle, at tampok ng mukha. Natutunan ng ADM ang kaugnayan sa pagitan ng 2D na imahe at ng 3D na modelo ng mukha at nakabuo ng isang makatotohanang 3D na avatar mula sa iisang 2D na larawan.

Ang modelo ay maaari ding gamitin upang makabuo ng isang avatar mula sa isang larawan na kinuha mula sa ibang anggulo

Naglabas ang Microsoft ng diffusion model na maaaring bumuo ng 3D avatar mula sa isang larawan ng isang tao
Para sa personalized na 3D avatar, nag-aalok ang Rodin model ng text-guided manipulation. Ang natural na pag-edit ng wika ay isang intuitive na paraan upang baguhin ang maraming iba't ibang feature ng 3D avatar.

Ang pag-aaral na ito ay nagmumungkahi ng 3D generative model na awtomatikong gumagawa ng 3D digital avatar na kinakatawan bilang neural radiance field gamit ang mga diffusion model. Dahil sa ipinagbabawal na memorya at mga kinakailangan sa pagproseso na nauugnay sa 3D, ang paglikha ng mga rich feature na kinakailangan para sa mga de-kalidad na avatar ay isang malaking isyu. Iminumungkahi ng mga developer na tugunan ng roll-out diffusion network (Rodin) ang isyung ito.

Naglabas ang Microsoft ng diffusion model na maaaring bumuo ng 3D avatar mula sa isang larawan ng isang tao
Sa mga tuntunin ng kasarian, edad, lahi, ekspresyon, mga accessories sa mukha, atbp., ang modelo ay nagpapakita ng namumukod-tanging pagkakaiba-iba ng henerasyon.ang

Ang network na ito ay naglalabas ng maraming 2D feature na mapa ng isang neural radiance field sa isang solong 2D feature plane, kung saan ang modelo ay nagsasagawa ng 3D-aware diffusion. Gumagamit ang modelong Rodin ng 3D-aware convolution, na dumadalo sa mga inaasahang feature sa 2D feature plane ayon sa kanilang orihinal na relasyon sa 3D, upang maibigay ang kinakailangang kahusayan sa computational habang pinapanatili ang integridad ng diffusion sa 3D.

Magbasa pa tungkol sa AI:

Pagtanggi sa pananagutan

Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.

Tungkol sa Ang May-akda

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Mas marami pang artikulo
Damir Yalalov
Damir Yalalov

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Mula sa Ripple hanggang sa The Big Green DAO: Paano Nag-aambag ang Mga Proyekto ng Cryptocurrency sa Charity

Tuklasin natin ang mga hakbangin na gumagamit ng potensyal ng mga digital na pera para sa mga layuning pangkawanggawa.

Malaman Higit Pa

AlphaFold 3, Med-Gemini, at iba pa: The Way AI Transforms Healthcare in 2024

Ang AI ay nagpapakita sa iba't ibang paraan sa pangangalagang pangkalusugan, mula sa pagtuklas ng mga bagong genetic correlations hanggang sa pagpapalakas ng mga robotic surgical system ...

Malaman Higit Pa
Magbasa Pa
Magbasa nang higit pa
Paano Binabago ng Mga Ahente ng AI ang Lakas ng Trabaho sa 2025
Palagay Negosyo markets Teknolohiya
Paano Binabago ng Mga Ahente ng AI ang Lakas ng Trabaho sa 2025
Enero 20, 2025
Pinili ni Gemini ang Malta Bilang MiCA Hub Sa Pangunahing Milestone sa Pagpapalawak ng Europa
Ulat sa Balita Teknolohiya
Pinili ni Gemini ang Malta Bilang MiCA Hub Sa Pangunahing Milestone sa Pagpapalawak ng Europa
Enero 20, 2025
Binance Research Full-Year Report 2024 Nagbubunyag ng Mga Pangunahing Trend at Pag-unlad ng Crypto at Ano ang Aasahan sa 2025
Palagay Negosyo markets Teknolohiya
Binance Research Full-Year Report 2024 Nagbubunyag ng Mga Pangunahing Trend at Pag-unlad ng Crypto at Ano ang Aasahan sa 2025
Enero 20, 2025
Lingguhang Crypto Recap: Bitcoin Blazes Nakaraang $109K, Ethereum Build Momentum, TON Eyes US Expansion
Digest Negosyo markets Teknolohiya
Lingguhang Crypto Recap: Bitcoin Blazes Nakaraang $109K, Ethereum Build Momentum, TON Eyes US Expansion
Enero 20, 2025
CRYPTOMERIA LABS PTE. LTD.