Ulat sa Balita Teknolohiya
Enero 18, 2023

Naglabas ang Microsoft ng diffusion model na maaaring bumuo ng 3D avatar mula sa isang larawan ng isang tao

Sa madaling sabi

Maaaring gamitin ang isang solong 2D na larawan ng mukha ng isang tao upang bumuo ng 3D avatar gamit ang 3D Avatar Diffusion machine learning technique.

Magagamit ito para magbigay ng makatotohanang 3D view ng tao para sa paglalaro o iba pang gamit, o para magbigay ng karanasan sa virtual reality (VR) o augmented reality (AR).

Ang 3D Avatar Diffusion ay isang machine learning algorithm na maaaring kumuha ng isang 2D na imahe ng mukha ng tao at lumikha ng three-dimensional (3D) avatar. Pagkatapos ay magagamit ang avatar upang lumikha ng karanasan sa virtual reality (VR) o augmented reality (AR) o para lang magbigay ng makatotohanang 3D view ng tao para sa paglalaro o iba pang layunin.

Ang modelo ng pagsasabog ay umunlad ng isang pangkat ng mga mananaliksik sa Microsoft Research at inilarawan sa isang papel na inilathala sa journal arXiv.

Naglabas ang Microsoft ng diffusion model na maaaring bumuo ng 3D avatar mula sa isang larawan ng isang tao

Ang 3D Avatar Diffusion ay batay sa isang uri ng machine-learning algorithm na tinatawag na diffusion model. Ang mga modelo ng pagsasabog ay mga generative na modelo, na nangangahulugang maaari silang bumuo ng bagong data na katulad ng data ng pagsasanay. Mga modelo ng pagsasabog ay ginamit noon upang makabuo ng mga 3D na larawan mula sa mga 2D na larawan, ngunit ang ADM ay ang unang modelo ng pagsasabog na maaaring makabuo ng isang makatotohanang 3D na avatar mula sa isang solong 2D na larawan.

Upang sanayin ang modelo, gumamit ang mga mananaliksik ng dataset ng mahigit 200,000 3D face models. Kasama sa dataset ang iba't ibang uri ng mga mukha na may iba't ibang kulay ng balat, hairstyle, at tampok ng mukha. Natutunan ng ADM ang kaugnayan sa pagitan ng 2D na imahe at ng 3D na modelo ng mukha at nakabuo ng isang makatotohanang 3D na avatar mula sa iisang 2D na larawan.

Ang modelo ay maaari ding gamitin upang makabuo ng isang avatar mula sa isang larawan na kinuha mula sa ibang anggulo

Para sa personalized na 3D avatar, nag-aalok ang Rodin model ng text-guided manipulation. Ang natural na pag-edit ng wika ay isang intuitive na paraan upang baguhin ang maraming iba't ibang feature ng 3D avatar.

Ang pag-aaral na ito ay nagmumungkahi ng 3D generative model na awtomatikong gumagawa ng 3D digital avatar na kinakatawan bilang neural radiance field gamit ang mga diffusion model. Dahil sa ipinagbabawal na memorya at mga kinakailangan sa pagproseso na nauugnay sa 3D, ang paglikha ng mga rich feature na kinakailangan para sa mga de-kalidad na avatar ay isang malaking isyu. Iminumungkahi ng mga developer na tugunan ng roll-out diffusion network (Rodin) ang isyung ito.

Sa mga tuntunin ng kasarian, edad, lahi, ekspresyon, mga accessories sa mukha, atbp., ang modelo ay nagpapakita ng namumukod-tanging pagkakaiba-iba ng henerasyon.ang

Ang network na ito ay naglalabas ng maraming 2D feature na mapa ng isang neural radiance field sa isang solong 2D feature plane, kung saan ang modelo ay nagsasagawa ng 3D-aware diffusion. Gumagamit ang modelong Rodin ng 3D-aware convolution, na dumadalo sa mga inaasahang feature sa 2D feature plane ayon sa kanilang orihinal na relasyon sa 3D, upang maibigay ang kinakailangang kahusayan sa computational habang pinapanatili ang integridad ng diffusion sa 3D.

Magbasa pa tungkol sa AI:

Pagtanggi sa pananagutan

Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.

Tungkol sa Ang May-akda

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Mas marami pang artikulo
Damir Yalalov
Damir Yalalov

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Hot Stories
Sumali sa Aming Newsletter.
Pinakabagong Balita

Ang Institutional Appetite ay Lumalaki Patungo sa Bitcoin ETFs Sa gitna ng Volatility

Ang mga pagsisiwalat sa pamamagitan ng 13F filing ay nagpapakita ng mga kilalang institusyonal na mamumuhunan na nakikipag-ugnayan sa mga Bitcoin ETF, na binibigyang-diin ang lumalaking pagtanggap ng ...

Malaman Higit Pa

Dumating na ang Araw ng Pagsentensiya: Ang Kapalaran ni CZ ay Nagbabalanse habang Isinasaalang-alang ng Korte ng US ang Panawagan ng DOJ

Si Changpeng Zhao ay handang harapin ang sentensiya sa korte ng US sa Seattle ngayon.

Malaman Higit Pa
Sumali sa Aming Innovative Tech Community
Magbasa Pa
Magbasa nang higit pa
Pinasimulan ng Zeta Markets ang Komunidad Airdrop, Naglalaan ng 1% Ng Z Token Supply Sa Solana Communities
markets Ulat sa Balita Teknolohiya
Pinasimulan ng Zeta Markets ang Komunidad Airdrop, Naglalaan ng 1% Ng Z Token Supply Sa Solana Communities
Mayo 8, 2024
Ang Blockchain-Based Digital Bonds ng KfW: Isang Paglukso Tungo sa Mas Transparent at Mahusay na Financial Ecosystem
Negosyo software Mga Kuwento at Pagsusuri Teknolohiya
Ang Blockchain-Based Digital Bonds ng KfW: Isang Paglukso Tungo sa Mas Transparent at Mahusay na Financial Ecosystem
Mayo 8, 2024
Ang Revised Donation Act ng South Korea: Ito ba ay Isang Hakbang Pasulong o Paatras para sa Crypto Philanthropy?
crypto Wiki Digest Negosyo markets Teknolohiya
Ang Revised Donation Act ng South Korea: Ito ba ay Isang Hakbang Pasulong o Paatras para sa Crypto Philanthropy?
Mayo 8, 2024
Generative AI sa 2024: Mga Umuusbong na Trend, Mga Pambihirang tagumpay, at Outlook sa Hinaharap
AI Wiki software Mga Kuwento at Pagsusuri Teknolohiya
Generative AI sa 2024: Mga Umuusbong na Trend, Mga Pambihirang tagumpay, at Outlook sa Hinaharap
Mayo 8, 2024
CRYPTOMERIA LABS PTE. LTD.