Relatório de notícias
06 de outubro de 2022

Google supera Meta lançando um novo gerador de AI de texto para vídeo, Imagen Video 

Em Breve

O Imagen Video do Google tenta ajudar o gerador de vídeo a se transformar em aplicativos matadores

Não demorou muito para o Google responder ao Make-a-Video da Meta. Usando um prompt de texto, Vídeo de imagem pode produzir um vídeo fantástico. Os resultados são um tremendo avanço em relação ao estado da arte, apesar de uma série de inconvenientes.

Em comparação com o gerador de AI Text-to-Video do Facebook Faz um video, os resultados são visivelmente melhores. No entanto, essa estratégia também exigia mais supervisão. Em contraste com o Imagen Video, onde os microtrabalhadores trabalhavam arduamente para anotar filmes com descrições escritas, o Make-a-Scene usava vídeos não rotulados para treinamento.

Entrar nas especificidades da arquitetura é inútil; você deve ler sobre isso no artigo SUA PARTICIPAÇÃO FAZ A DIFERENÇA. Podemos apenas confirmar que 16 quadros são gerados primeiro a partir da incorporação de texto do codificador T5 em uma resolução de 48 × 24 com 3 quadros por segundo e que isso é aprimorado por vários modelos de difusão no filme final de 128 quadros em 1280 × 768 e 24 quadros por segundo.

O que é Imagen Vídeo?

Imagen Video é um método para criar vídeos condicionais de texto com base em uma série de modelos de difusão de vídeo. Imagen Video produz filmes de alta qualidade a partir de prompts de texto combinando um modelo básico de produção de vídeo com uma série de modelos de super-resolução de vídeo espacial e temporal entrelaçados. Revise as escolhas de design feitas pela equipe ao expandir o sistema como um sistema de alta qualidade.defimodelo de texto para vídeo, incluindo a decisão de parametrizar modelos de difusão e a seleção de modelos de super-resolução temporais e espaciais totalmente convolucionais em resoluções específicas. Além disso, valida e aplica resultados de trabalhos anteriores sobre produção de imagens baseadas em difusão ao contexto de geração de vídeo. Os modelos de vídeo são então submetidos à destilação progressiva com orientação sem classificador para amostragem rápida e de alta qualidade.

A equipe de pesquisa do Google afirma que o sistema aceita uma descrição textual e gera um filme de 16 quadros em três quadros por segundo com uma resolução de 24 por 48 pixels. O sistema dimensiona e “prevê” os quadros extras, criando um vídeo final com 128 quadros a 24 quadros por segundo e resolução de 720p (1280×768). Existem 60 milhões de pares imagem-texto e 14 milhões de pares vídeo-texto foram usados ​​para treinar o Imagen Video.

Imagens de amostras de vídeo

Mesmo que seja mais rápido e barato usar IA para fazer vídeo, essas tecnologias certamente serão empregadas em todos os lugares.

Interessado em ler mais? Aqui estão alguns tópicos adicionais para verificar:

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Mais artigos
Damir Yalalov
Damir Yalalov

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Hot Stories
Junte-se ao nosso boletim informativo.
Últimas notícias

Do Ripple ao Big Green DAO: como os projetos de criptomoeda contribuem para a caridade

Vamos explorar iniciativas que aproveitem o potencial das moedas digitais para causas beneficentes.

Saber Mais

AlphaFold 3, Med-Gemini e outros: A maneira como a IA transforma a saúde em 2024

A IA se manifesta de várias maneiras na área da saúde, desde a descoberta de novas correlações genéticas até o fortalecimento de sistemas cirúrgicos robóticos...

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
Comissão de Valores Mobiliários de Hong Kong alerta sobre golpes deepfake direcionados à indústria de criptografia: implicações para a segurança do investidor
Estilo de vida Segurança Wiki Software Histórias e resenhas Tecnologia
Comissão de Valores Mobiliários de Hong Kong alerta sobre golpes deepfake direcionados à indústria de criptografia: implicações para a segurança do investidor
14 de maio de 2024
Ripple e Evmos colaboram no desenvolvimento de XRP Ledger EVM Sidechain com tecnologia EvmOS
O negócio Relatório de notícias Tecnologia
Ripple e Evmos colaboram no desenvolvimento de XRP Ledger EVM Sidechain com tecnologia EvmOS
14 de maio de 2024
5ireChain inicia 'Testnet Thunder: GA' incentivado para testes de estresse de rede e convida os usuários a participarem Airdrop Recompensas
Relatório de notícias Tecnologia
5ireChain inicia 'Testnet Thunder: GA' incentivado para testes de estresse de rede e convida os usuários a participarem Airdrop Recompensas
14 de maio de 2024
Stacks faz parceria com a Uphold para facilitar a negociação e transferência contínua de ativos, reforçando a adoção do Bitcoin
O negócio Relatório de notícias Tecnologia
Stacks faz parceria com a Uphold para facilitar a negociação e transferência contínua de ativos, reforçando a adoção do Bitcoin
14 de maio de 2024
CRYPTOMERIA LABS PTE. LTDA.