Informe de notícies Tecnologia
Gener 18, 2023

Microsoft ha llançat un model de difusió que pot crear un avatar 3D a partir d'una sola foto d'una persona

En breu

Es pot utilitzar una única imatge en 2D de la cara d'una persona per generar un avatar en 3D mitjançant la tècnica d'aprenentatge automàtic 3D Avatar Diffusion.

Es pot utilitzar per proporcionar una visió 3D realista de la persona per a jocs o altres usos, o per proporcionar una experiència de realitat virtual (VR) o realitat augmentada (AR).

El 3D Avatar Diffusion és un algorisme d'aprenentatge automàtic que pot prendre una única imatge en 2D d'un rostre humà i crear un avatar tridimensional (3D). L'avatar es pot utilitzar per crear una experiència de realitat virtual (VR) o de realitat augmentada (AR) o simplement per proporcionar una vista realista en 3D de la persona per a jocs o altres finalitats.

El model de difusió era desenvolupat per un equip d'investigadors de Microsoft Research i es descriu en un article publicat a la revista arXiv.

Microsoft ha llançat un model de difusió que pot crear un avatar 3D a partir d'una sola foto d'una persona

El 3D Avatar Diffusion es basa en un tipus d'algorisme d'aprenentatge automàtic anomenat model de difusió. Els models de difusió són models generatius, és a dir, poden generar noves dades similars a les dades d'entrenament. Models de difusió s'han utilitzat abans per generar imatges 3D a partir d'imatges 2D, però l'ADM és el primer model de difusió que pot generar un avatar 3D realista a partir d'una sola imatge 2D.

Per entrenar el model, els investigadors van utilitzar un conjunt de dades de més de 200,000 models de cares en 3D. El conjunt de dades incloïa una gran varietat de cares amb diferents tons de pell, pentinats i trets facials. Aleshores, l'ADM va poder aprendre la relació entre la imatge 2D i el model de cara 3D i generar un avatar 3D realista a partir d'una sola imatge 2D.

El model també es pot utilitzar per generar un avatar a partir d'una foto que s'ha fet des d'un angle diferent

Per a l'avatar 3D personalitzat, el model Rodin ofereix una manipulació guiada per text. L'edició del llenguatge natural és una manera intuïtiva de canviar moltes funcions diferents d'avatar en 3D.

Aquest estudi proposa un model generatiu 3D que crea automàticament avatars digitals 3D que es representen com a camps de radiació neuronal mitjançant models de difusió. A causa dels requisits prohibitius de memòria i processament associats al 3D, crear les riques funcions necessàries per a avatars d'alta qualitat és un gran problema. Els desenvolupadors suggereixen que la xarxa de difusió de desplegament (Rodin) solucioni aquest problema.

Pel que fa a gènere, edat, raça, expressió, complements facials, etc., el model presenta una diversitat generacional excepcional.​

Aquesta xarxa desplega nombrosos mapes de característiques 2D d'un camp de radiació neuronal en un únic pla de característiques 2D, on el model executa una difusió conscient de 3D. El model de Rodin utilitza la convolució conscient de 3D, que atén les característiques projectades en el pla de característiques 2D segons la seva relació original en 3D, per proporcionar l'eficiència computacional tan necessària alhora que es manté la integritat de la difusió en 3D.

Llegeix més sobre AI:

renúncia

En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.

About The Autor

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet. 

més articles
Damir Yalalov
Damir Yalalov

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet. 

L'apetit institucional creix cap als ETF de Bitcoin enmig de la volatilitat

Les divulgacions a través de les presentacions 13F revelen inversors institucionals notables que s'estan incursionant en els ETF de Bitcoin, subratllant una acceptació creixent de...

saber Més

Arriba el dia de la sentència: el destí de CZ està en equilibri mentre el tribunal nord-americà considera la petició del DOJ

Changpeng Zhao està a punt d'enfrontar-se avui a la sentència en un tribunal dels Estats Units a Seattle.

saber Més
Uneix-te a la nostra comunitat tecnològica innovadora
Més...
Llegeix més
Zeta Markets inicia la comunitat Airdrop, destina l'1% del subministrament de fitxes Z a les comunitats de Solana
mercats Informe de notícies Tecnologia
Zeta Markets inicia la comunitat Airdrop, destina l'1% del subministrament de fitxes Z a les comunitats de Solana
Pot 8, 2024
Bons digitals basats en Blockchain de KfW: un salt cap a un ecosistema financer més transparent i eficient
Negocis Software Històries i ressenyes Tecnologia
Bons digitals basats en Blockchain de KfW: un salt cap a un ecosistema financer més transparent i eficient
Pot 8, 2024
Llei de donació revisada de Corea del Sud: és un pas endavant o enrere per a la filantropia criptogràfica?
Cripto Wiki Resum Negocis mercats Tecnologia
Llei de donació revisada de Corea del Sud: és un pas endavant o enrere per a la filantropia criptogràfica?
Pot 8, 2024
IA generativa el 2024: tendències emergents, avenços i perspectives de futur
AI Wiki Software Històries i ressenyes Tecnologia
IA generativa el 2024: tendències emergents, avenços i perspectives de futur
Pot 8, 2024
CRYPTOMERIA LABS PTE. LTD.