Relatório de notícias
30 de Setembro de 2022

Text-to-3D: Google desenvolveu uma rede neural que gera modelos 3D a partir de descrições de texto

Em Breve

Texto para 3D rede neural pode gerar modelos 3D a partir de texto

O DreamFusion otimiza cenas 3D com base no Imagen text-to-image

O modelo de difusão 2D pode ser usado para síntese de texto em imagem

O Google criou um rede neural capaz de criar modelos 3D a partir de descrições de texto. A melhor parte é que o aspecto mais difícil nem precisou ser ensinado. Imagen foi usado como base para Text-to-3D.

Text-to-3D: Google desenvolveu uma rede neural que gera modelos 3D a partir de descrições de texto

O que você deve saber sobre DreamFusion?

Modelos de difusão treinados em bilhões de pares imagem-texto levaram a avanços recentes na síntese de texto para imagem. A adaptação dessa abordagem à síntese 3D exigirá conjuntos de dados em grande escala de ativos 3D rotulados, bem como arquiteturas de dados 3D eficientes para remoção de ruído, nenhuma das quais está disponível atualmente. Neste artigo, superamos essas restrições realizando a síntese de texto para 3D com um 2D pré-treinado difusão de texto para imagem modelo. Apresentamos uma perda baseada na destilação por densidade de probabilidade que permite que um modelo de difusão 2D seja usado como prior para otimizar um modelo paramétrico gerador de imagens. Usando essa perda, usamos gradiente descendente para otimizar um modelo 3D inicializado aleatoriamente (um Neural Radiance Field ou NeRF) para que suas renderizações 2D de ângulos aleatórios tenham uma perda mínima.

O modelo 3D gerado do texto especificado pode ser visualizado de qualquer ângulo, iluminado com iluminação variável e composto em qualquer ambiente 3D. Seu método não requer dados de treinamento 3D e nenhuma alteração no modelo de difusão de imagem, ilustrando a eficácia do uso de modelos de difusão de imagem pré-treinados como antes.

A DreamFusion cria modelos 3D religáveis ​​com aparência, profundidade e normais de alta fidelidade com base em uma legenda. Os objetos são representados como um campo de radiação neural, com um pré-treinado difusão de texto para imagem antes como Imagen sendo usado.

Exemplos de 3D gerado a partir de texto

Dica: foto de um esquilo usando uma armadura medieval tocando saxofone
Sugestão: foto de um esquilo vestindo um elegante vestido de baile sentado em uma roda de oleiro moldando uma tigela de barro
Prompt: escultura de metal altamente detalhada de um esquilo vestindo um moletom roxo andando de motocicleta
Prompt: intrincado entalhe em madeira de um esquilo vestindo uma armadura medieval empunhando uma katana

Juntar objetos para fazer uma cena

Como funciona o Tech & Data Studio:

DreamFusion otimiza uma cena 3D com base em uma legenda usando o modelo gerador de texto para imagem Imagen. Ele sugere Score Distillation Sampling (SDS), que envolve a otimização de uma função de perda para produzir amostras a partir de um modelo de difusão. Contanto que possamos mapear as imagens de maneira diferente, o SDS nos permite otimizar amostras em qualquer espaço de parâmetros, como um espaço 3D. Para defiNeste mapeamento diferenciável, ele emprega uma parametrização de cena 3D semelhante a Campos de Radiância Neural ou NeRFs. O SDS sozinho cria uma aparência de cena aceitável, mas o DreamFusion aprimora a geometria com regularizadores extras e técnicas de otimização. Os NeRFs treinados produzidos são coerentes, possuem excelentes normais, geometria de superfície e profundidade e podem ser reacender usando um modelo de sombreamento Lambertiano.

Leia artigos relacionados:

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Mais artigos
Damir Yalalov
Damir Yalalov

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Hot Stories
Junte-se ao nosso boletim informativo.
Últimas notícias

Do Ripple ao Big Green DAO: como os projetos de criptomoeda contribuem para a caridade

Vamos explorar iniciativas que aproveitem o potencial das moedas digitais para causas beneficentes.

Saber Mais

AlphaFold 3, Med-Gemini e outros: A maneira como a IA transforma a saúde em 2024

A IA se manifesta de várias maneiras na área da saúde, desde a descoberta de novas correlações genéticas até o fortalecimento de sistemas cirúrgicos robóticos...

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
Comissão de Valores Mobiliários de Hong Kong alerta sobre golpes deepfake direcionados à indústria de criptografia: implicações para a segurança do investidor
Estilo de vida Segurança Wiki Software Histórias e resenhas Tecnologia
Comissão de Valores Mobiliários de Hong Kong alerta sobre golpes deepfake direcionados à indústria de criptografia: implicações para a segurança do investidor
14 de maio de 2024
Ripple e Evmos colaboram no desenvolvimento de XRP Ledger EVM Sidechain com tecnologia EvmOS
O negócio Relatório de notícias Tecnologia
Ripple e Evmos colaboram no desenvolvimento de XRP Ledger EVM Sidechain com tecnologia EvmOS
14 de maio de 2024
5ireChain inicia 'Testnet Thunder: GA' incentivado para testes de estresse de rede e convida os usuários a participarem Airdrop Recompensas
Relatório de notícias Tecnologia
5ireChain inicia 'Testnet Thunder: GA' incentivado para testes de estresse de rede e convida os usuários a participarem Airdrop Recompensas
14 de maio de 2024
Stacks faz parceria com a Uphold para facilitar a negociação e transferência contínua de ativos, reforçando a adoção do Bitcoin
O negócio Relatório de notícias Tecnologia
Stacks faz parceria com a Uphold para facilitar a negociação e transferência contínua de ativos, reforçando a adoção do Bitcoin
14 de maio de 2024
CRYPTOMERIA LABS PTE. LTDA.