Relatório de notícias Equipar
18 de janeiro de 2023

A Microsoft lançou um modelo de difusão que pode construir um avatar 3D a partir de uma única foto de uma pessoa

Em Breve

Uma única imagem 2D do rosto de uma pessoa pode ser usada para gerar um avatar 3D usando a técnica de aprendizado de máquina 3D Avatar Diffusion.

Ele pode ser usado para fornecer uma visão 3D realista da pessoa para jogos ou outros usos, ou para fornecer uma experiência de realidade virtual (VR) ou realidade aumentada (AR).

O 3D Avatar Diffusion é um algoritmo de aprendizado de máquina que pode pegar uma única imagem 2D de um rosto humano e criar um avatar tridimensional (3D). O avatar pode então ser usado para criar uma experiência de realidade virtual (VR) ou realidade aumentada (AR) ou simplesmente fornecer uma visão 3D realista da pessoa para jogos ou outros fins.

O modelo de difusão foi desenvolvido por uma equipe de pesquisadores da Microsoft Research e é descrito em um artigo publicado na revista arXiv.

A Microsoft lançou um modelo de difusão que pode construir um avatar 3D a partir de uma única foto de uma pessoa

O 3D Avatar Diffusion é baseado em um tipo de algoritmo de aprendizado de máquina chamado modelo de difusão. Os modelos de difusão são modelos generativos, o que significa que podem gerar novos dados semelhantes aos dados de treinamento. Modelos de difusão foram usados ​​antes para gerar imagens 3D a partir de imagens 2D, mas o ADM é o primeiro modelo de difusão que pode gerar um avatar 3D realista a partir de uma única imagem 2D.

Para treinar o modelo, os pesquisadores usaram um conjunto de dados de mais de 200,000 modelos faciais 3D. O conjunto de dados incluiu uma grande variedade de rostos com diferentes tons de pele, estilos de cabelo e características faciais. O ADM foi então capaz de aprender a relação entre a imagem 2D e o modelo facial 3D e gerar um avatar 3D realista a partir de uma única imagem 2D.

O modelo também pode ser usado para gerar um avatar a partir de uma foto tirada de um ângulo diferente

Para o avatar 3D personalizado, o modelo Rodin oferece manipulação guiada por texto. A edição de linguagem natural é uma maneira intuitiva de alterar muitos recursos de avatar 3D diferentes.

Este estudo propõe um modelo generativo 3D que cria automaticamente avatares digitais 3D que são representados como campos de radiância neural usando modelos de difusão. Por causa dos requisitos proibitivos de memória e processamento associados ao 3D, criar os recursos avançados necessários para avatares de alta qualidade é um grande problema. Os desenvolvedores sugerem que a rede de difusão roll-out (Rodin) resolva esse problema.

Em termos de sexo, idade, raça, expressão, acessórios faciais, etc., a modelo exibe uma notável diversidade geracional.​

Essa rede distribui vários mapas de recursos 2D de um campo de radiância neural em um único plano de recursos 2D, onde o modelo executa a difusão com reconhecimento 3D. O modelo de Rodin usa convolução 3D, que atende aos recursos projetados no plano de recurso 2D de acordo com sua relação original em 3D, para fornecer a eficiência computacional tão necessária, mantendo a integridade da difusão em 3D.

Leia mais sobre IA:

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Mais artigos
Damir Yalalov
Damir Yalalov

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Hot Stories
Junte-se ao nosso boletim informativo.
Últimas notícias

O frenesi DOGE: analisando o recente aumento de valor do Dogecoin (DOGE)

A indústria de criptomoedas está se expandindo rapidamente e as moedas meme estão se preparando para um aumento significativo. Dogecoin (DOGE), ...

Saber Mais

A evolução do conteúdo gerado por IA no metaverso

O surgimento de conteúdo generativo de IA é um dos desenvolvimentos mais fascinantes dentro do ambiente virtual...

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
As principais ofertas desta semana, grandes investimentos em IA, TI, Web3e criptografia (22-26.04)
Digerir O negócio Mercados Equipar
As principais ofertas desta semana, grandes investimentos em IA, TI, Web3e criptografia (22-26.04)
26 de abril de 2024
Vitalik Buterin comenta sobre centralização do PoW, observa que era um estágio temporário até o PoS
Relatório de notícias Equipar
Vitalik Buterin comenta sobre centralização do PoW, observa que era um estágio temporário até o PoS
26 de abril de 2024
Offchain Labs revela descoberta de duas vulnerabilidades críticas nas provas de fraude do OP Stack do Optimism
Relatório de notícias Software Equipar
Offchain Labs revela descoberta de duas vulnerabilidades críticas nas provas de fraude do OP Stack do Optimism
26 de abril de 2024
Mercado aberto da Dymension para aumentar a liquidez da RollApps eIBC é lançado na rede principal
Relatório de notícias Equipar
Mercado aberto da Dymension para aumentar a liquidez da RollApps eIBC é lançado na rede principal 
26 de abril de 2024
CRYPTOMERIA LABS PTE. LTDA.