Relatório de notícias Tecnologia
06 de dezembro de 2023

Google Research e Universidade de Tel Aviv desenvolvem estrutura de IA para geração precisa de imagens

Em Breve

O Google Research e a Universidade de Tel Aviv desenvolveram IA que combina difusão de texto para imagem com geometria de lente para renderização de imagem.

Google Research e Universidade de Tel Aviv revelam estrutura de IA para geração precisa de imagens

Pesquisa do Google em colaboração com Universidade de Tel Aviv, introduziu uma nova estrutura de inteligência artificial (IA) que combina um modelo de difusão de texto para imagem com geometria de lente especializada para renderização de imagem.

Essa integração permite um controle preciso sobre a geometria de renderização, facilitando a geração de diversos efeitos visuais, como olho de peixe, vistas panorâmicas e texturização esférica usando um único modelo de difusão.

Em uma última trabalho de pesquisa, os cientistas enfrentaram a tarefa de incorporar diversos controles ópticos em modelos de difusão de texto para imagem. Essa abordagem envolveu fazer com que o modelo considerasse a geometria local da lente, aprimorando sua capacidade de replicar efeitos ópticos intrincados e criar imagens de aparência realista.

Em vez de apenas alterar a forma padrão das imagens, este método permite praticamente qualquer distorção da grade por meio do condicionamento de coordenadas por pixel. Esta abordagem inovadora suporta diversas aplicações, como a geração de cenas panorâmicas que transmitem uma sensação de presença e texturização de esferas. 

Além disso, a estrutura introduz uma estrutura de geração de imagens com reconhecimento de geometria múltipla com condicionamento de tensor métrico. Isto proporciona possibilidades adicionais para controlar e modificar a forma como as imagens são geradas, revelando inúmeras possibilidades para criar e refinar imagens.

Geração precisa de imagens por meio da integração de difusão de texto para imagem

A estrutura integra texto para imagem modelos de difusão com geometria de lente específica por meio de condicionamento de coordenadas por pixel. O método envolve o refinamento de um modelo de difusão latente pré-treinado, utilizando dados gerados através da distorção de imagens com campos de distorção aleatórios.

A reponderação de tokens foi implementada em camadas de autoatenção, permitindo a manipulação das propriedades da curvatura e produzindo diversos efeitos, como olho de peixe e vistas panorâmicas. Esta abordagem vai além da resolução fixa na geração de imagens e inclui condicionamento de tensores métricos para melhor controle.

Revolucionando a manipulação de imagens

A estrutura expande as capacidades de manipulação de imagens, abordando desafios como geração de imagens grandes e ajuste de escalas de autoatenção em modelos de difusão.

Efetivamente, a estrutura integra um modelo de difusão de texto para imagem com geometria de lente específica, permitindo uma variedade de efeitos visuais como olho de peixe, vistas panorâmicas e texturização esférica usando um único modelo. Ele fornece controle meticuloso sobre as propriedades de curvatura e geometria de renderização, levando à criação de imagens realistas e diferenciadas.

Treinado em um conjunto de dados substancial anotado textualmente e campos de distorção por pixel, o método produz imagens distorcidas arbitrárias com resultados finamente não distorcidos e estreitamente alinhados com a geometria alvo. Além disso, facilita o desenvolvimento de panoramas esféricos caracterizados por proporções realistas e artefatos mínimos.

Google Research e Universidade de Tel Aviv revelam estrutura de IA para geração precisa de imagens

A estrutura recentemente introduzida, que integra diversas geometrias de lentes na renderização de imagens, oferece controle aprimorado sobre propriedades de curvatura e efeitos visuais.

Os pesquisadores sugerem estender esta abordagem para obter resultados comparáveis ​​aos de lentes especializadas que capturam cenas distintas. Ao considerar a utilização potencial de técnicas de condicionamento mais avançadas, a estrutura prevê geração aprimorada de imagens e capacidades expandidas.

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Alisa, jornalista dedicada do MPost, é especializada em criptomoedas, provas de conhecimento zero, investimentos e no vasto reino de Web3. Com um olhar atento às tendências e tecnologias emergentes, ela oferece uma cobertura abrangente para informar e envolver os leitores no cenário em constante evolução das finanças digitais.

Mais artigos
Alice Davidson
Alice Davidson

Alisa, jornalista dedicada do MPost, é especializada em criptomoedas, provas de conhecimento zero, investimentos e no vasto reino de Web3. Com um olhar atento às tendências e tecnologias emergentes, ela oferece uma cobertura abrangente para informar e envolver os leitores no cenário em constante evolução das finanças digitais.

Hot Stories
Junte-se ao nosso boletim informativo.
Últimas notícias

Cresce apetite institucional por ETFs de Bitcoin em meio à volatilidade

As divulgações por meio de registros 13F revelam investidores institucionais notáveis ​​​​que se envolvem em ETFs Bitcoin, ressaltando uma aceitação crescente de ...

Saber Mais

Chega o dia da sentença: o destino de CZ está em equilíbrio enquanto o tribunal dos EUA considera o apelo do DOJ

Changpeng Zhao está prestes a ser condenado hoje em um tribunal dos EUA em Seattle.

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
UXLINK e Binance colaboram em nova campanha, oferecendo aos usuários 20 milhões de pontos UXUY e Airdrop Recompensas
Mercados Relatório de notícias Tecnologia
UXLINK e Binance colaboram em nova campanha, oferecendo aos usuários 20 milhões de pontos UXUY e Airdrop Recompensas
9 de maio de 2024
Side Protocol lança testnet incentivado e apresenta sistema de pontos internos, permitindo que os usuários ganhem pontos SIDE
Mercados Relatório de notícias Tecnologia
Side Protocol lança testnet incentivado e apresenta sistema de pontos internos, permitindo que os usuários ganhem pontos SIDE
9 de maio de 2024
Web3 e Crypto Events em maio de 2024: Explorando Novas Tecnologias e Tendências Emergentes em Blockchain e DeFi
Digerir O negócio Mercados Tecnologia
Web3 e Crypto Events em maio de 2024: Explorando Novas Tecnologias e Tendências Emergentes em Blockchain e DeFi
9 de maio de 2024
Notcoin será lançado no OKX Jumpstart e oferece 1.25% do fornecimento total de tokens para mineração
Mercados Relatório de notícias Tecnologia
Notcoin será lançado no OKX Jumpstart e oferece 1.25% do fornecimento total de tokens para mineração
9 de maio de 2024
CRYPTOMERIA LABS PTE. LTDA.