Relatório de notícias Equipar
24 de janeiro de 2023

VToonify: um modelo de IA em tempo real para gerar vídeos de retratos artísticos

Em Breve

Uma estrutura revolucionária do VToonify foi desenvolvida por desenvolvedores para fornecer transferências controladas de estilo de vídeo em retrato de alta resolução.

Para produzir retratos artísticos impressionantes, a estrutura faz uso das camadas de média e alta resolução do StyleGAN.

Ele permite a extensão do existente baseado em StyleGAN modelos de toonificação de imagem para vídeo.

Pesquisadores da Universidade Tecnológica de Nanyang desenvolveram introduziu uma nova estrutura VToonify para gerar transferência de estilo de vídeo de retrato de alta resolução controlável. O VToonify aproveita as camadas de média e alta resolução do StyleGAN para renderizar retratos artísticos de alta qualidade com base nos recursos de conteúdo multiescala extraídos por um codificador para melhor preservar os detalhes do quadro. Os resultados experimentais mostram que nossa estrutura pode gerar vídeos com alta qualidade consistente e expressões faciais desejadas sem a necessidade de alinhamento facial ou restrições de tamanho de quadro.

Como resultado, uma arquitetura totalmente convolucional que aceita faces não alinhadas em vídeos de vários tamanhos produz faces completas com movimentos orgânicos. A estrutura VToonify herda recursos atraentes desses modelos para controle de estilo flexível em cor e intensidade. É compatível com os modelos existentes de toonificação de imagem baseados em StyleGAN para estendê-los à toonificação de vídeo. Este trabalho apresenta duas instanciações do VToonify para transferência de estilo de vídeo de retrato baseada em coleção e baseada em exemplar, respectivamente, construídas sobre Toonify e DualStyleGAN.

Vtoonify: um modelo de IA em tempo real para gerar vídeos de retratos artísticos

Extensas descobertas experimentais mostram que a estrutura proposta do VToonify supera as abordagens concorrentes na produção de filmes de retratos artísticos com controles de estilo ajustáveis ​​que são de excelente qualidade e temporalmente consistentes. Verificar GitHub para mais detalhes.

Artigo relacionado: OpenAI está trabalhando na criação de um modelo de IA para vídeo

Para fornecer uma transferência de estilo de vídeo retrato de alta resolução controlável, o VToonify combina as vantagens da estrutura de tradução de imagens e a estrutura baseada em StyleGAN.

(A) Para suportar tamanho de entrada variável, um sistema de tradução de imagens usa redes totalmente convolucionais. É difícil transmitir alta resolução e estilo controlado, no entanto, ao ensinar do zero.

(B) A estrutura baseada em StyleGAN, que suporta apenas tamanho fixo de imagem e perdas de detalhes, usa o modelo StyleGAN pré-treinado para transferência de estilo controlável e de alta resolução.

(C) Para criar uma arquitetura codificadora-geradora completamente convolucional semelhante à da estrutura de tradução de imagem, nosso sistema híbrido estende o StyleGAN excluindo seu recurso de entrada de tamanho fixo e camadas de baixa resolução.

Para preservar os detalhes do quadro, os desenvolvedores treinam um codificador para extrair recursos de conteúdo multiescala do quadro de entrada como uma condição de conteúdo adicional. O VToonify herda a flexibilidade de controle de estilo do modelo StyleGAN, colocando-o no gerador para destilar seus dados e modelo.

Vtoonify: um modelo de IA em tempo real para gerar vídeos de retratos artísticos
Artigo relacionado: Lambda Labs anunciou um misturador de imagem AI que pode combinar até cinco imagens

A estrutura VToonify herda as características atraentes para controle de estilo flexível dos atuais modelos de toonificação de imagens baseados em StyleGAN e é compatível com eles para expandi-los para vídeo toonificação. Nosso VToonify oferece o seguinte usando o modelo DualStyleGAN como base do StyleGAN:

  • Transferência de estilo de estruturas baseadas em exemplares;
  • Modificação do grau de estilo;
  • Transferência de estilo de cor com base em exemplares.
Vtoonify: um modelo de IA em tempo real para gerar vídeos de retratos artísticos
Para a destilação StyleGAN, os desenvolvedores comparam dois backbones Toonify e DualStyleGAN, bem como a linha de base de tradução de imagem para imagem de alta resolução Pix2pixHD. O VToonify-T e o VToonify-D superam seus backbones comparáveis, Toonify e DualStyleGAN, em termos de estilização de todo o vídeo, mantendo a mesma alta qualidade e elementos visuais dos backbones de cada quadro individual. O VToonify-T, por exemplo, segue o Toonify para impor um efeito de estilo forte, como o cabelo violeta no estilo Arcane. O VToonify-D, por outro lado, faz um trabalho melhor ao manter as características faciais. O Pix2pixHD apresenta cintilações e artefatos quando comparado ao VToonify-D.

Leia mais sobre IA:

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Mais artigos
Damir Yalalov
Damir Yalalov

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Hot Stories
Junte-se ao nosso boletim informativo.
Últimas notícias

Chega o dia da sentença: o destino de CZ está em equilíbrio enquanto o tribunal dos EUA considera o apelo do DOJ

Changpeng Zhao está prestes a ser condenado hoje em um tribunal dos EUA em Seattle.

Saber Mais

Fundadores da Samourai Wallet acusados ​​de facilitar US$ 2 bilhões em negócios Darknet

A apreensão dos fundadores da Samourai Wallet representa um revés notável para a indústria, ressaltando a persistência ...

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
AltLayer entra na segunda fase de sua iniciativa de piquetagem e apresenta o token reALT
Mercados Relatório de notícias Equipar
AltLayer entra na segunda fase de sua iniciativa de piquetagem e apresenta o token reALT
2 de maio de 2024
Rede BNB divulga relatório do primeiro trimestre de 1, destaca redução de 2024% em sua perda de valor, enquanto BSC TVL sobe 55.8%
Mercados Relatório de notícias Equipar
Rede BNB divulga relatório do primeiro trimestre de 1, destaca redução de 2024% em sua perda de valor, enquanto BSC TVL sobe 55.8%
2 de maio de 2024
Kaia de Naver e Kakao: a nova potência asiática de blockchain preparada para perturbar os mercados criptográficos globais
O negócio Software Histórias e resenhas Equipar
Kaia de Naver e Kakao: a nova potência asiática de blockchain preparada para perturbar os mercados criptográficos globais
2 de maio de 2024
Aave Labs revela proposta 'Aave 2030' incluindo lançamento do protocolo Aave V4
O negócio Relatório de notícias Equipar
Aave Labs revela proposta 'Aave 2030' incluindo lançamento do protocolo Aave V4
2 de maio de 2024
CRYPTOMERIA LABS PTE. LTDA.