Relatório de notícias Equipar
23 de novembro de 2022

Text-to-SVG: Berkeley anunciou a abstração do modelo de difusão baseado em pixels

Em Breve

Síntese de texto para imagem – pesquisadores da UC Berkeley demonstram gráficos vetoriais com modelos de difusão

Na síntese de texto para imagem, os modelos de difusão têm demonstraram resultados excepcionais. Os modelos de difusão aprendem a produzir imagens raster de objetos e situações extremamente diversos usando enormes bancos de dados de fotos anotadas. No entanto, para ícones digitais, gráficos e adesivos, os designers geralmente empregam representações vetoriais de imagens como Scalable Vector Graphics (SVGs). Os gráficos vetoriais são pequenos e podem ser dimensionados para qualquer tamanho.

Text-to-SVG: Berkeley anunciou a abstração do modelo de difusão baseado em pixels

A UC Berkeley demonstra como produzir gráficos vetoriais que podem ser exportados como SVG usando um modelo de difusão condicionada por texto que foi treinado em representações de pixel de imagem. Ele faz isso sem usar coleções extensas de SVGs com legendas. Em vez disso, os pesquisadores de Berkeley vetorizam um difusão de texto para imagem amostra e ajuste-o com uma perda de amostragem de destilação de pontuação, motivada por trabalhos recentes em síntese de texto para 3D.

Exemplos de vetores gerados

Confira a galeria SVG recém-gerada SUA PARTICIPAÇÃO FAZ A DIFERENÇA.

Os gráficos vetoriais são pequenos, mas mantêm sua nitidez quando dimensionados para qualquer tamanho. Pesquisadores em Berkeley melhoram uma perda de texto de imagem com base na amostragem de destilação de pontuação para otimizar gráficos vetoriais. O renderizador SVG diferenciável DiffVG, que é usado pelo VectorFusion, possibilita visuais inversos.

Além disso, o VectorFusion permite uma configuração multiestágio mais eficaz e de maior qualidade. Este método começa tirando amostras raster do modelo de difusão de texto para imagem chamado Stable Diffusion. As amostras são então rastreadas automaticamente pelo VectorFusion usando LIVE. Estas amostras, no entanto, frequentemente carecem de detalhes, são enfadonhas ou difíceis de adaptar a gráficos vetoriais. Melhorando a vibração e a consistência textual por meio da amostragem por destilação de pontuação.

O VectorFusion pode produzir pixel art no estilo dos videogames antigos, limitando os caminhos SVG a quadrados em uma grade.

Essa abordagem é facilmente expandida para oferecer suporte à geração de texto para esboço. Para aprender um desenho de linha abstrato que represente com precisão o texto fornecido pelo usuário, primeiro desenhamos 16 traços escolhidos aleatoriamente. Em seguida, otimizamos nossa perda de amostragem de destilação de pontuação latente.

Leia artigos relacionados:

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Mais artigos
Damir Yalalov
Damir Yalalov

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Chega o dia da sentença: o destino de CZ está em equilíbrio enquanto o tribunal dos EUA considera o apelo do DOJ

Changpeng Zhao está prestes a ser condenado hoje em um tribunal dos EUA em Seattle.

Saber Mais

Fundadores da Samourai Wallet acusados ​​de facilitar US$ 2 bilhões em negócios Darknet

A apreensão dos fundadores da Samourai Wallet representa um revés notável para a indústria, ressaltando a persistência ...

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
Pantera Capital investe na blockchain TON e expressa confiança no potencial do Telegram para ampliar a acessibilidade à criptografia
O negócio Relatório de notícias Equipar
Pantera Capital investe na blockchain TON e expressa confiança no potencial do Telegram para ampliar a acessibilidade à criptografia
2 de maio de 2024
Mitosis levanta US$ 7 milhões em financiamento do Amber Group e Foresight Ventures para avançar seu protocolo modular de liquidez
O negócio Relatório de notícias Equipar
Mitosis levanta US$ 7 milhões em financiamento do Amber Group e Foresight Ventures para avançar seu protocolo modular de liquidez
2 de maio de 2024
Galxe faz parceria com Jambo para expandir a acessibilidade global para Web3
O negócio Relatório de notícias Equipar
Galxe faz parceria com Jambo para expandir a acessibilidade global para Web3
2 de maio de 2024
Med-Gemini do Google preparado para dar uma vantagem inicial GPT-4 Com seu desempenho superior em saúde
AI Wiki Novidades Software Equipar
Med-Gemini do Google preparado para dar uma vantagem inicial GPT-4 Com seu desempenho superior em saúde
2 de maio de 2024
CRYPTOMERIA LABS PTE. LTDA.