Relatório de notícias Tecnologia
19 de Junho de 2023

SnapFusion: modelo rápido de conversão de texto em imagem para dispositivos móveis em 1.9 segundos

Em Breve

SnapFusion muda a criação de conteúdo executando modelos de difusão de texto para imagem diretamente em dispositivos móveis, reduzindo custos e abordando questões de privacidade.

SnapFusion é um modelo de IA de conversão de texto em imagem que permite aos usuários gerar imagens impressionantes a partir de descrições em linguagem natural, tudo em apenas dois segundos em seus dispositivos móveis. Longe vão os dias de depender de GPUs de ponta ou serviços baseados em nuvem para executar esses modelos complexos. O SnapFusion democratiza a criação de conteúdo colocando o poder da difusão de texto para imagem nas mãos dos usuários.

SnapFusion: modelo de conversão de texto em imagem rápido e eficiente para dispositivos móveis em 1.9 segundos
Crédito: Midjourney /lili10292#2100

Criar imagens realistas a partir de descrições de texto sempre foi uma tarefa desafiadora. modelos anteriores grandes arquiteturas de rede necessárias e várias iterações de remoção de ruído, tornando-as computacionalmente caro e lento. Além disso, a execução desses modelos geralmente envolvia o envio de dados do usuário para serviços de terceiros, aumentando preocupações com a privacidade.

Para enfrentar esses desafios, os criadores do SnapFusion desenvolveram uma arquitetura de rede eficiente e aprimoraram o processo de destilação por etapas. Ao identificar redundâncias no modelo original, eles introduziram uma UNet eficiente e reduziram a computação do decodificador de imagem por meio de destilação de dados. Além disso, eles aprimoraram a destilação por etapas explorando estratégias de treinamento e introduzindo técnicas de regularização.

arxiv.org/pdf/2306.00980.pdf

Extensas experiências sobre o conjunto de dados MS-COCO demonstrou a superioridade do SnapFusion. Com apenas oito etapas de redução de ruído, o SnapFusion obteve melhores pontuações FID e CLIP em comparação com o anterior modelo de última geração, Stable Diffusion v1.5, que exigia 50 etapas. Essa melhoria notável em eficiência e desempenho abre novas possibilidades para a criação de conteúdo.

O impacto do SnapFusion vai além de suas conquistas técnicas. Correndo modelos de difusão de texto para imagem diretamente em dispositivos móveis, elimina a necessidade de GPUs caras e serviços baseados em nuvem. Isso não apenas reduz os custos, mas também aborda questões de privacidade associadas ao envio de dados do usuário a terceiros. Os usuários agora podem liberar sua criatividade e gerar imagens de alta qualidade em movimento.

O tamanho do parâmetro do modelo pode ser ainda mais reduzido para torná-lo compatível com vários dispositivos de ponta. Além disso, otimizar o modelo para diferentes dispositivos móveis para alcançar inferência rápida velocidades é um tópico de pesquisa em andamento.

É essencial usar o SnapFusion e tecnologias semelhantes de forma responsável para evitar aplicativos mal-intencionados. Medidas podem ser tomadas, como sistemas de detecção automática que identificam e sinalizam o conteúdo da imagem que viola os regulamentos. Ao encontrar um equilíbrio entre inovação e considerações éticas, o SnapFusion pode mudar a criação de conteúdo enquanto garante uma experiência de usuário segura e responsável.

Leia mais sobre IA:

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Mais artigos
Damir Yalalov
Damir Yalalov

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Hot Stories

Descubra as Crypto Whales: quem é quem no mercado

by Viktoria Palchik
07 de maio de 2024
Junte-se ao nosso boletim informativo.
Últimas notícias

Cresce apetite institucional por ETFs de Bitcoin em meio à volatilidade

As divulgações por meio de registros 13F revelam investidores institucionais notáveis ​​​​que se envolvem em ETFs Bitcoin, ressaltando uma aceitação crescente de ...

Saber Mais

Chega o dia da sentença: o destino de CZ está em equilíbrio enquanto o tribunal dos EUA considera o apelo do DOJ

Changpeng Zhao está prestes a ser condenado hoje em um tribunal dos EUA em Seattle.

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
LD Capital, Antalpha Ventures e Highblock Limited unem forças para lançar fundo de liquidez ETF de US$ 128 milhões em Hong Kong
O negócio Mercados Relatório de notícias
LD Capital, Antalpha Ventures e Highblock Limited unem forças para lançar fundo de liquidez ETF de US$ 128 milhões em Hong Kong
8 de maio de 2024
Por dentro dos memes de Wall Street (WSM): revelando as manchetes
O negócio Mercados Histórias e resenhas Tecnologia
Por dentro dos memes de Wall Street (WSM): revelando as manchetes
7 de maio de 2024
Descubra as Crypto Whales: quem é quem no mercado
O negócio Mercados Histórias e resenhas Tecnologia
Descubra as Crypto Whales: quem é quem no mercado
7 de maio de 2024
Orbiter Finance faz parceria com Bitcoin Layer 2 Zulu Network e implanta na Lwazi Testnet
O negócio Relatório de notícias Tecnologia
Orbiter Finance faz parceria com Bitcoin Layer 2 Zulu Network e implanta na Lwazi Testnet 
7 de maio de 2024
CRYPTOMERIA LABS PTE. LTDA.