Relatório de notícias Equipar
24 de janeiro de 2023

StyleGAN-T: A geração mais rápida de texto para imagem que produz resultados em menos de 0.1 segundo

Em Breve

StyleGAN-T é um novo GAN para geração de tex2image.

Esta GAN produz bons resultados e até é bastante rápida (0.1 seg para uma imagem de 512×512).

A nova arquitetura é baseada no StyleGAN-XL, mas reavalia os designs do gerador e do discriminador.

Você com certeza já percebeu que GANs não são mais discutidas quando o assunto é geração de imagens. Depois de modelos de difusão como Stable Diffusion surgiram, as GANs de alguma forma recuaram para segundo plano. Isso ocorre porque eles são difíceis de treinar e frequentemente tropeçam. O único benefício dos GANs é que, ao contrário dos modelos de difusão, eles produzem uma imagem em uma única execução (um “passe direto”) em vez de várias execuções.

StyleGAN-T: A geração mais rápida de texto para imagem em menos de 0.1 segundo

Mas agora um novo jogador dos GANs entrou em campo: Estilo GAN-T. Essa GAN para geração de texto para imagem produz bons resultados rapidamente, pois leva apenas 0.1 segundo para uma imagem de 512 × 512. A nova arquitetura é baseada no StyleGAN-XL, mas reavalia os designs do gerador e discriminador e emprega CLIP para alinhamento de prompt de texto e gráficos gerados.

Artigo relacionado: VToonify: um modelo de IA em tempo real para gerar vídeos de retratos artísticos

Em geral, o StyleGAN-T agora cria texto para imagem com mais rapidez e precisão do que outros GANs. No entanto, o GAN ainda é péssimo e a qualidade do modelo SD em tamanho real está obviamente fora de questão. Mas tudo isso dependerá da capacidade de produzir imagens de texto de altíssima qualidade em menos de um segundo por ano. Além disso, ficará em algum lugar entre GAN e o modelo de difusão.

EstiloGAN-T arquitetura
EstiloGAN-T arquitetura

Leia mais sobre IA:

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Mais artigos
Damir Yalalov
Damir Yalalov

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Hot Stories
Junte-se ao nosso boletim informativo.
Últimas notícias

O frenesi DOGE: analisando o recente aumento de valor do Dogecoin (DOGE)

A indústria de criptomoedas está se expandindo rapidamente e as moedas meme estão se preparando para um aumento significativo. Dogecoin (DOGE), ...

Saber Mais

A evolução do conteúdo gerado por IA no metaverso

O surgimento de conteúdo generativo de IA é um dos desenvolvimentos mais fascinantes dentro do ambiente virtual...

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
As principais ofertas desta semana, grandes investimentos em IA, TI, Web3e criptografia (22-26.04)
Digerir O negócio Mercados Equipar
As principais ofertas desta semana, grandes investimentos em IA, TI, Web3e criptografia (22-26.04)
26 de abril de 2024
Vitalik Buterin comenta sobre centralização do PoW, observa que era um estágio temporário até o PoS
Relatório de notícias Equipar
Vitalik Buterin comenta sobre centralização do PoW, observa que era um estágio temporário até o PoS
26 de abril de 2024
Offchain Labs revela descoberta de duas vulnerabilidades críticas nas provas de fraude do OP Stack do Optimism
Relatório de notícias Software Equipar
Offchain Labs revela descoberta de duas vulnerabilidades críticas nas provas de fraude do OP Stack do Optimism
26 de abril de 2024
Mercado aberto da Dymension para aumentar a liquidez da RollApps eIBC é lançado na rede principal
Relatório de notícias Equipar
Mercado aberto da Dymension para aumentar a liquidez da RollApps eIBC é lançado na rede principal 
26 de abril de 2024
CRYPTOMERIA LABS PTE. LTDA.