Microsoft ha lanzado un modelo de difusión que puede construir un avatar 3D a partir de una sola foto de una persona.
En Resumen
Se puede usar una sola imagen 2D del rostro de una persona para generar un avatar 3D usando la técnica de aprendizaje automático 3D Avatar Diffusion.
Se puede utilizar para proporcionar una vista 3D realista de la persona para juegos u otros usos, o para proporcionar una experiencia de realidad virtual (VR) o realidad aumentada (AR).
3D Avatar Diffusion es un algoritmo de aprendizaje automático que puede tomar una sola imagen 2D de un rostro humano y crear un avatar tridimensional (3D). Luego, el avatar se puede usar para crear una experiencia de realidad virtual (VR) o realidad aumentada (AR) o simplemente para proporcionar una vista 3D realista de la persona para juegos u otros fines.
El modelo de difusión fue desarrollado por un equipo de investigadores de Microsoft Research y se describe en un artículo publicado en la revista arXiv.
La difusión de avatar 3D se basa en un tipo de algoritmo de aprendizaje automático llamado modelo de difusión. Los modelos de difusión son modelos generativos, lo que significa que pueden generar nuevos datos similares a los datos de entrenamiento. Modelos de difusión se han utilizado antes para generar imágenes 3D a partir de imágenes 2D, pero el ADM es el primer modelo de difusión que puede generar un avatar 3D realista a partir de una sola imagen 2D.
Para entrenar el modelo, los investigadores utilizaron un conjunto de datos de más de 200,000 3 modelos faciales en 2D. El conjunto de datos incluía una amplia variedad de rostros con diferentes tonos de piel, peinados y rasgos faciales. Luego, el ADM pudo aprender la relación entre la imagen 3D y el modelo facial 3D y generar un avatar 2D realista a partir de una sola imagen XNUMXD.
El modelo también se puede usar para generar un avatar a partir de una foto que se haya tomado desde un ángulo diferente
Este estudio propone un modelo generativo 3D que crea automáticamente avatares digitales 3D que se representan como campos de radiación neuronal utilizando modelos de difusión. Debido a los requisitos prohibitivos de memoria y procesamiento asociados con el 3D, la creación de las ricas funciones necesarias para los avatares de alta calidad es un gran problema. Los desarrolladores sugieren que la red de difusión de despliegue (Rodin) aborde este problema.
Esta red despliega numerosos mapas de características 2D de un campo de radiación neural en un solo plano de características 2D, donde el modelo luego ejecuta la difusión consciente de 3D. El modelo de Rodin utiliza la convolución compatible con 3D, que se ocupa de las características proyectadas en el plano de características 2D de acuerdo con su relación original en 3D, para proporcionar la eficiencia computacional tan necesaria mientras se mantiene la integridad de la difusión en 3D.
Lea más sobre la IA:
Observación
En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.
Sobre el Autor
Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet.
Más artículosDamir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet.