Uudiste reportaaž Tehnoloogia
Jaanuar 18, 2023

Microsoft on välja andnud difusioonimudeli, mis suudab luua 3D-avatari ühest inimese fotost

Põgusalt

Inimese näo üksikut 2D-pilti saab kasutada 3D-avatari loomiseks, kasutades 3D Avatari difusiooni masinõppe tehnikat.

Seda saab kasutada inimesest realistliku 3D-vaate pakkumiseks mängimiseks või muuks otstarbeks või virtuaalreaalsuse (VR) või liitreaalsuse (AR) kogemuse pakkumiseks.

3D Avatari difusioon on masinõppe algoritm, mis suudab teha inimese näost ühe 2D-kujutise ja luua kolmemõõtmelise (3D) avatari. Seejärel saab avatari kasutada virtuaalreaalsuse (VR) või liitreaalsuse (AR) kogemuse loomiseks või lihtsalt inimesest realistliku 3D-vaate pakkumiseks mängude või muudel eesmärkidel.

Difusioonimudel oli arenenud Microsoft Researchi teadlaste meeskonna poolt ja seda kirjeldatakse ajakirjas avaldatud artiklis arXiv.

Microsoft on välja andnud difusioonimudeli, mis suudab luua 3D-avatari ühest inimese fotost

3D Avatari difusioon põhineb teatud tüüpi masinõppe algoritmil, mida nimetatakse difusioonimudeliks. Difusioonimudelid on generatiivsed mudelid, mis tähendab, et nad saavad genereerida uusi andmeid, mis on sarnased koolitusandmetega. Difusioonimudelid on varem kasutatud 3D-piltidest 2D-piltide genereerimiseks, kuid ADM on esimene difusioonimudel, mis suudab ühest 3D-pildist luua realistliku 2D-avatari.

Mudeli koolitamiseks kasutasid teadlased enam kui 200,000 3 2D-näomudeli andmestikku. Andmekogum sisaldas laias valikus erinevaid nahatoonide, soengute ja näojoontega nägusid. Seejärel suutis ADM õppida seost 3D-kujutise ja 3D-näomudeli vahel ning luua ühest 2D-pildist realistliku XNUMXD-avatari.

Mudelit saab kasutada ka avatari genereerimiseks fotost, mis on tehtud erineva nurga alt

Isikupärastatud 3D-avatari jaoks pakub Rodini mudel tekstiga manipuleerimist. Loomuliku keele redigeerimine on intuitiivne viis paljude erinevate 3D-avatari funktsioonide muutmiseks.

Selles uuringus pakutakse välja 3D generatiivne mudel, mis loob difusioonimudelite abil automaatselt 3D digitaalsed avatarid, mis on kujutatud närvikiirguse väljadena. 3D-ga seotud liigsete mälu- ja töötlemisnõuete tõttu on kvaliteetsete avataride jaoks vajalike rikkalike funktsioonide loomine tohutu probleem. Arendajad soovitavad selle probleemiga tegeleda levitamisvõrgus (Rodin).

Soo, vanuse, rassi, näoilme, näoaksessuaaride jms osas on mudelil silmapaistev põlvkondadevaheline mitmekesisus.)

See võrk koondab arvukalt närvikiirguse välja 2D-funktsioonide kaarte üheks 2D-funktsiooni tasapinnaks, kus mudel teostab seejärel 3D-teadliku difusiooni. Rodini mudel kasutab 3D-teadlikku konvolutsiooni, mis jälgib 2D funktsioonitasandil projitseeritud funktsioone vastavalt nende algsele suhtele 3D-s, et tagada väga vajalik arvutuslik efektiivsus, säilitades samal ajal 3D-s difusiooni terviklikkuse.

Loe AI kohta lähemalt:

Kaebused

Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.

Umbes Autor

Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks. 

Veel artikleid
Damir Jalalov
Damir Jalalov

Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks. 

Institutsionaalne isu kasvab volatiilsuse tõttu Bitcoini ETF-ide poole

13F-i dokumentide kaudu avaldatud teave paljastab märkimisväärsed institutsionaalsed investorid, kes tegelevad Bitcoini ETF-idega, rõhutades, et ...

Rohkem teada

Karistuspäev saabub: CZ saatus on tasakaalus, kuna USA kohus võtab DOJ palvet arvesse

Changpeng Zhao ootab täna ees kohtuotsus USA Seattle'i kohtus.

Rohkem teada
Liituge meie uuendusliku tehnikakogukonnaga
Loe rohkem
Loe edasi
Zeta Markets algatab kogukonna Airdrop, eraldab 1% Z-märgi tarnetest Solana kogukondadele
turud Uudiste reportaaž Tehnoloogia
Zeta Markets algatab kogukonna Airdrop, eraldab 1% Z-märgi tarnetest Solana kogukondadele
Võib 8 2024
KfW plokiahelapõhised digitaalsed võlakirjad: hüpe läbipaistvama ja tõhusama finantsökosüsteemi poole
Äri tarkvara Lood ja ülevaated Tehnoloogia
KfW plokiahelapõhised digitaalsed võlakirjad: hüpe läbipaistvama ja tõhusama finantsökosüsteemi poole
Võib 8 2024
Lõuna-Korea muudetud annetamisseadus: kas see on samm edasi või tagasi krüptofilantroopia jaoks?
Crypto Wiki Digest Äri turud Tehnoloogia
Lõuna-Korea muudetud annetamisseadus: kas see on samm edasi või tagasi krüptofilantroopia jaoks?
Võib 8 2024
Generatiivne AI 2024. aastal: esilekerkivad suundumused, läbimurded ja tulevikuväljavaated
AI Wiki tarkvara Lood ja ülevaated Tehnoloogia
Generatiivne AI 2024. aastal: esilekerkivad suundumused, läbimurded ja tulevikuväljavaated
Võib 8 2024
CRYPTOMERIA LABS PTE. LTD.