Microsoft on välja andnud difusioonimudeli, mis suudab luua 3D-avatari ühest inimese fotost
Põgusalt
Inimese näo üksikut 2D-pilti saab kasutada 3D-avatari loomiseks, kasutades 3D Avatari difusiooni masinõppe tehnikat.
Seda saab kasutada inimesest realistliku 3D-vaate pakkumiseks mängimiseks või muuks otstarbeks või virtuaalreaalsuse (VR) või liitreaalsuse (AR) kogemuse pakkumiseks.
3D Avatari difusioon on masinõppe algoritm, mis suudab teha inimese näost ühe 2D-kujutise ja luua kolmemõõtmelise (3D) avatari. Seejärel saab avatari kasutada virtuaalreaalsuse (VR) või liitreaalsuse (AR) kogemuse loomiseks või lihtsalt inimesest realistliku 3D-vaate pakkumiseks mängude või muudel eesmärkidel.
Difusioonimudel oli arenenud Microsoft Researchi teadlaste meeskonna poolt ja seda kirjeldatakse ajakirjas avaldatud artiklis arXiv.
3D Avatari difusioon põhineb teatud tüüpi masinõppe algoritmil, mida nimetatakse difusioonimudeliks. Difusioonimudelid on generatiivsed mudelid, mis tähendab, et nad saavad genereerida uusi andmeid, mis on sarnased koolitusandmetega. Difusioonimudelid on varem kasutatud 3D-piltidest 2D-piltide genereerimiseks, kuid ADM on esimene difusioonimudel, mis suudab ühest 3D-pildist luua realistliku 2D-avatari.
Mudeli koolitamiseks kasutasid teadlased enam kui 200,000 3 2D-näomudeli andmestikku. Andmekogum sisaldas laias valikus erinevaid nahatoonide, soengute ja näojoontega nägusid. Seejärel suutis ADM õppida seost 3D-kujutise ja 3D-näomudeli vahel ning luua ühest 2D-pildist realistliku XNUMXD-avatari.
Mudelit saab kasutada ka avatari genereerimiseks fotost, mis on tehtud erineva nurga alt
Selles uuringus pakutakse välja 3D generatiivne mudel, mis loob difusioonimudelite abil automaatselt 3D digitaalsed avatarid, mis on kujutatud närvikiirguse väljadena. 3D-ga seotud liigsete mälu- ja töötlemisnõuete tõttu on kvaliteetsete avataride jaoks vajalike rikkalike funktsioonide loomine tohutu probleem. Arendajad soovitavad selle probleemiga tegeleda levitamisvõrgus (Rodin).
See võrk koondab arvukalt närvikiirguse välja 2D-funktsioonide kaarte üheks 2D-funktsiooni tasapinnaks, kus mudel teostab seejärel 3D-teadliku difusiooni. Rodini mudel kasutab 3D-teadlikku konvolutsiooni, mis jälgib 2D funktsioonitasandil projitseeritud funktsioone vastavalt nende algsele suhtele 3D-s, et tagada väga vajalik arvutuslik efektiivsus, säilitades samal ajal 3D-s difusiooni terviklikkuse.
Loe AI kohta lähemalt:
Kaebused
Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.
Umbes Autor
Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks.
Veel artikleidDamir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks.