Microsoft on julkaissut diffuusiomallin, joka voi rakentaa 3D-avatarin yhdestä henkilön valokuvasta
Lyhyesti
Yksittäistä 2D-kuvaa henkilön kasvoista voidaan käyttää 3D-avatarin luomiseen käyttämällä 3D Avatar Diffusion -koneoppimistekniikkaa.
Sitä voidaan käyttää tarjoamaan realistinen 3D-näkymä henkilöstä pelaamista tai muuta käyttöä varten tai tarjoamaan virtuaalitodellisuus (VR) tai lisätty todellisuus (AR).
3D Avatar Diffusion on koneoppimisalgoritmi, joka voi ottaa yhden 2D-kuvan ihmisen kasvoista ja luoda kolmiulotteisen (3D) avatarin. Avataria voidaan sitten käyttää virtuaalitodellisuuden (VR) tai lisätyn todellisuuden (AR) luomiseen tai yksinkertaisesti realistisen 3D-näkymän tarjoamiseen henkilöstä pelaamista tai muita tarkoituksia varten.
Diffuusiomalli oli kehitetty Microsoft Researchin tutkijaryhmä, ja se kuvataan lehdessä julkaistussa artikkelissa arXiv.
3D Avatar Diffusion perustuu eräänlaiseen koneoppimisalgoritmiin, jota kutsutaan diffuusiomalliksi. Diffuusiomallit ovat generatiivisia malleja, mikä tarkoittaa, että ne voivat tuottaa uutta dataa, joka on samanlaista kuin koulutusdata. Diffuusiomallit Niitä on käytetty aiemmin luomaan 3D-kuvia 2D-kuvista, mutta ADM on ensimmäinen diffuusiomalli, joka voi luoda realistisen 3D-avatarin yhdestä 2D-kuvasta.
Mallin kouluttamiseen tutkijat käyttivät yli 200,000 3 2D-kasvomallin tietojoukkoa. Tietojoukko sisälsi laajan valikoiman kasvoja eri ihonväreillä, kampauksilla ja kasvonpiirteillä. ADM pystyi sitten oppimaan 3D-kuvan ja 3D-kasvomallin välisen suhteen ja luomaan realistisen 2D-avatarin yhdestä XNUMXD-kuvasta.
Mallin avulla voidaan myös luoda avatar valokuvasta, joka on otettu eri kulmasta
Tässä tutkimuksessa ehdotetaan 3D-generatiivista mallia, joka luo automaattisesti 3D-digitaalisia avatareja, jotka esitetään hermosäteilykenttinä diffuusiomallien avulla. 3D:hen liittyvien kohtuuttomien muisti- ja prosessointivaatimusten vuoksi laadukkaiden avatareiden edellyttämien monipuolisten ominaisuuksien luominen on valtava ongelma. Kehittäjät ehdottavat, että käyttöönoton diffuusioverkko (Rodin) ratkaisee tämän ongelman.
Tämä verkko levittää lukuisia 2D-piirrekarttoja hermosäteilykentästä yhdeksi 2D-ominaisuustasolle, jossa malli sitten suorittaa 3D-tietoisen diffuusion. Rodin-malli käyttää 3D-tietoista konvoluutiota, joka huolehtii projisoiduista piirteistä 2D-ominaisuustasossa niiden alkuperäisen suhteen mukaisesti 3D:ssä, jotta saadaan kipeästi kaivattua laskentatehoa säilyttäen samalla diffuusion eheys 3D:ssä.
Lue lisää tekoälystä:
Vastuun kieltäminen
Mukaisesti Luottamusprojektin ohjeetHuomaa, että tällä sivulla annettuja tietoja ei ole tarkoitettu eikä niitä tule tulkita oikeudellisiksi, verotukselliseksi, sijoitus-, rahoitus- tai minkään muun muodon neuvoiksi. On tärkeää sijoittaa vain sen verran, mitä sinulla on varaa menettää, ja pyytää riippumatonta talousneuvontaa, jos sinulla on epäilyksiä. Lisätietoja saat käyttöehdoista sekä myöntäjän tai mainostajan tarjoamista ohje- ja tukisivuista. MetaversePost on sitoutunut tarkkaan, puolueettomaan raportointiin, mutta markkinaolosuhteet voivat muuttua ilman erillistä ilmoitusta.
Author
Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa.
lisää artikkeleitaDamir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa.