Relatório de notícias Inovadora
18 de janeiro de 2023

A Microsoft lançou um modelo de difusão que pode construir um avatar 3D a partir de uma única foto de uma pessoa

Em Breve

Uma única imagem 2D do rosto de uma pessoa pode ser usada para gerar um avatar 3D usando a técnica de aprendizado de máquina 3D Avatar Diffusion.

Ele pode ser usado para fornecer uma visão 3D realista da pessoa para jogos ou outros usos, ou para fornecer uma experiência de realidade virtual (VR) ou realidade aumentada (AR).

O 3D Avatar Diffusion é um algoritmo de aprendizado de máquina que pode pegar uma única imagem 2D de um rosto humano e criar um avatar tridimensional (3D). O avatar pode então ser usado para criar uma experiência de realidade virtual (VR) ou realidade aumentada (AR) ou simplesmente fornecer uma visão 3D realista da pessoa para jogos ou outros fins.

O modelo de difusão foi desenvolvido por uma equipe de pesquisadores da Microsoft Research e é descrito em um artigo publicado na revista arXiv.

A Microsoft lançou um modelo de difusão que pode construir um avatar 3D a partir de uma única foto de uma pessoa

O 3D Avatar Diffusion é baseado em um tipo de algoritmo de aprendizado de máquina chamado modelo de difusão. Os modelos de difusão são modelos generativos, o que significa que podem gerar novos dados semelhantes aos dados de treinamento. Modelos de difusão foram usados ​​antes para gerar imagens 3D a partir de imagens 2D, mas o ADM é o primeiro modelo de difusão que pode gerar um avatar 3D realista a partir de uma única imagem 2D.

Para treinar o modelo, os pesquisadores usaram um conjunto de dados de mais de 200,000 modelos faciais 3D. O conjunto de dados incluiu uma grande variedade de rostos com diferentes tons de pele, estilos de cabelo e características faciais. O ADM foi então capaz de aprender a relação entre a imagem 2D e o modelo facial 3D e gerar um avatar 3D realista a partir de uma única imagem 2D.

O modelo também pode ser usado para gerar um avatar a partir de uma foto tirada de um ângulo diferente

A Microsoft lançou um modelo de difusão que pode construir um avatar 3D a partir de uma única foto de uma pessoa
Para o avatar 3D personalizado, o modelo Rodin oferece manipulação guiada por texto. A edição de linguagem natural é uma maneira intuitiva de alterar muitos recursos de avatar 3D diferentes.

Este estudo propõe um modelo generativo 3D que cria automaticamente avatares digitais 3D que são representados como campos de radiância neural usando modelos de difusão. Por causa dos requisitos proibitivos de memória e processamento associados ao 3D, criar os recursos avançados necessários para avatares de alta qualidade é um grande problema. Os desenvolvedores sugerem que a rede de difusão roll-out (Rodin) resolva esse problema.

A Microsoft lançou um modelo de difusão que pode construir um avatar 3D a partir de uma única foto de uma pessoa
Em termos de sexo, idade, raça, expressão, acessórios faciais, etc., a modelo exibe uma notável diversidade geracional.​

Essa rede distribui vários mapas de recursos 2D de um campo de radiância neural em um único plano de recursos 2D, onde o modelo executa a difusão com reconhecimento 3D. O modelo de Rodin usa convolução 3D, que atende aos recursos projetados no plano de recurso 2D de acordo com sua relação original em 3D, para fornecer a eficiência computacional tão necessária, mantendo a integridade da difusão em 3D.

Leia mais sobre IA:

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Mais artigos
Damir Yalalov
Damir Yalalov

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Hot Stories
Junte-se ao nosso boletim informativo.
Últimas notícias

A Calmaria Antes da Tempestade de Solana: O Que os Gráficos, Baleias e Sinais On-Chain Estão Dizendo Agora

Solana demonstrou um forte desempenho, impulsionado pela crescente adoção, interesse institucional e parcerias importantes, ao mesmo tempo em que enfrenta potenciais...

Saber Mais

Criptomoedas em abril de 2025: Principais tendências, mudanças e o que vem a seguir

Em abril de 2025, o espaço criptográfico se concentrou no fortalecimento da infraestrutura principal, com o Ethereum se preparando para o Pectra...

Saber Mais
Saiba Mais
Ler mais
Dois terços dos adultos consideram a alfabetização financeira uma característica atraente, revela pesquisa da OKX.
Relatório de notícias Inovadora
Dois terços dos adultos consideram a alfabetização financeira uma característica atraente, revela pesquisa da OKX.
10 de fevereiro de 2026
Liquidez 2026: Onde as instituições globais convergiram para o futuro dos ativos digitais e do TradFi.
Relatório de notícias Inovadora
Liquidez 2026: Onde as instituições globais convergiram para o futuro dos ativos digitais e do TradFi.
10 de fevereiro de 2026
O mecanismo IsoDDE de última geração da Isomorphic Labs promove o design orientado por IA de moléculas complexas e de difícil acesso.
Relatório de notícias Inovadora
O mecanismo IsoDDE de última geração da Isomorphic Labs promove o design orientado por IA de moléculas complexas e de difícil acesso.
10 de fevereiro de 2026
A MEXC registra rápido crescimento em sua plataforma de negociação com IA, com a adoção por usuários ultrapassando 2.3 milhões.
Relatório de notícias Inovadora
A MEXC registra rápido crescimento em sua plataforma de negociação com IA, com a adoção por usuários ultrapassando 2.3 milhões.
10 de fevereiro de 2026
CRYPTOMERIA LABS PTE. LTDA.