Relatório de notícias Equipar
10 de abril de 2023

Stability AI Lança um novo modelo chamado SDXL Beta

Em Breve

Stability AI lançou um novo modelo chamado SDXL Beta (Stable Diffusion XL Beta). É um modelo maior com mais parâmetros e algumas melhorias desconhecidas. Está disponível no DreamStudio, Stability AIO gerador de imagens oficial da e usa algoritmos avançados e técnicas de aprendizado profundo para criar visuais impressionantes.

Stability AI revelou uma prévia de um novo modelo chamado SDXL Beta, abreviação de Stable Diffusion XL Beta. Até o momento, a empresa não divulgou muitas informações sobre o modelo, mas ele está disponível para testes para quem quiser. O que há de novo neste modelo SDXL para stable diffusion? Quais são as vantagens e desvantagens? Vamos investigar.

Leia mais: Midjourney e Dall-E Artist Styles Dump com exemplos: 130 técnicas famosas de pintura de IA

Qual é exatamente o modelo SDXL?

O modelo SDXL é um novo modelo que está atualmente sendo treinado. Está longe de estar finalizado e, quando for lançado, muitos detalhes sobre ele podem mudar; pelo que sabemos, pode nem ser chamado de modelo SDXL. Tudo o que sabemos é que é um modelo maior com mais parâmetros e algumas melhorias desconhecidas. É um modelo v2, não um modelo v3 (o que quer que isso signifique). É possível que as melhorias no modelo v2 possam melhorar o desempenho do sistema, mas sem mais informações, é difícil determinar o quão significativas essas melhorias podem ser. Além disso, seria útil saber quais parâmetros específicos foram adicionados ou ajustados nesta versão.

O modelo SDXL está atualmente disponível no DreamStudio, Stability AIgerador de imagem oficial do. Selecione SDXL Beta no menu do modelo para conferir. Parece usar algoritmos avançados e técnicas de aprendizado profundo para criar visuais impressionantes que são perfeitos para uma ampla gama de aplicações.

Qual é exatamente o modelo SDXL?

Melhorias

Texto legível. O SDXL é capaz de gerar texto legível e é provavelmente seu recurso mais impressionante, pois não era possível nos modelos v1 e v2.1 existentes. O texto gerado pelo SDXL nem sempre é preciso, como você pode ver no Stable Diffusion Texto abaixo. No entanto, é muito superior ao modelo v2.1, sem falar no modelo v1. Isso ocorre porque os SDXLs usam um algoritmo de aprendizado profundo mais avançado que permite entender e gerar estruturas de linguagem mais complexas. Com mais desenvolvimento, ele tem o potencial de se tornar ainda mais preciso e confiável.

Prompt: foto de um cavalheiro segurando um papel branco que diz “No Fakes”
Prompt: foto de um cavalheiro segurando um papel branco que diz “No Fakes”
Foto de uma mulher ruiva segurando uma placa preta com letras brancas que diz "Sem brincadeiras"
Prompt: Foto de uma mulher ruiva segurando uma placa preta com letras brancas que diz “Sem brincadeiras”
Prompt: Foto de uma mulher chinesa sentada em um cinema segurando um prato com a palavra "Pain and Plane" escrita nele.
Prompt: Foto de uma mulher chinesa sentada em um cinema segurando um prato com a palavra “Pain and Plane” escrita nele.

Anatomia humana. A geração precisa de figuras humanas anatomicamente corretas tem sido um desafio para stable diffusion. A presença de membros adicionais ou ausentes é comum. A pintura interna é normalmente usada para corrigi-los ou, mais recentemente, você pode usar o recurso Open Pose do ControlNet para duplicar uma pose de uma imagem de referência. Temos o prazer de observar que é aqui que o modelo SDXL Beta melhorou. O modelo SDXL Beta mostrou melhorias significativas na duplicação precisa de poses de imagens de referência. Esta pode ser uma ferramenta valiosa para várias aplicações, como animação e realidade virtual.

Foto de uma mulher com roupa esportiva girando a bola com a mão direita
Dica: Foto de uma mulher com roupa esportiva girando a bola com a mão direita
Foto de um menino sentado sob a lua vermelha
Dica: Foto de um menino sentado sob a lua vermelha
Prompt: Uma foto mostra um velho correndo na floresta.

Estilo retrato. O SDXL Beta produz excelentes retratos que se parecem com fotos – é uma atualização em comparação com a versão 1.5. O algoritmo aprimorado no SDXL Beta aprimora os detalhes e a precisão das cores dos retratos, resultando em uma aparência mais natural e realista. Os usuários também podem ajustar os níveis de nitidez e saturação para obter os efeitos desejados.

Dica: uma foto de um menino e uma menina
Dica: uma foto de um menino e uma menina
Prompt: uma foto de retrato de um cara gordo
Prompt: uma foto de retrato de um cara gordo
Dica: uma foto de uma mulher dos anos 80
Dica: uma foto de uma mulher dos anos 80

Duotônico. A palavra-chave duotone sempre produz fotos em preto e branco no modelo v1.5. No entanto, agora, as imagens duotônicas produzidas pelo SDXL Beta vêm em uma variedade de cores. É claro que, em comparação com os modelos v1, a capacidade de interpretar o prompt melhorou, resultando em respostas mais precisas e relevantes dos modelos v2, tornando-os uma ferramenta mais confiável para tarefas de processamento de linguagem natural.

retrato estilo duotônico de um cachorro
Prompt: retrato em estilo duotônico de um cachorro
paisagem duotone da ilha
Prompt: paisagem duotônica da ilha
retrato duotônico de jovem mulher africana
Prompt: retrato duotônico de jovem africana

Estilos artísticos. Houve alguns pequenos ajustes, mas é difícil determinar se o novo modelo oferece melhores resultados, pois são simplesmente únicos. É possível que esses ajustes sejam uma questão de preferência pessoal ou opinião subjetiva, tornando difícil fazer uma defijulgamento nitivo sobre sua qualidade. No entanto, a singularidade dos ajustes pode ser digna de nota e vale a pena explorar mais.

Nova York de Ivan Aivazovsky
v 1.5: Nova York por Ivan Aivazovsky
Nova York de Ivan Aivazovsky
SDXL: Nova York por Ivan Aivazovsky
Floresta Velha por Christopher Balaskas
v 1.5: Velha Floresta por Christopher Balaskas
Floresta Velha por Christopher Balaskas
SDXL: Floresta Velha por Christopher Balaskas

Conclusão

  • Stable Diffusion pode finalmente produzir um texto que faça sentido.
  • O SDXL fornece imagens esteticamente mais agradáveis ​​do que os modelos v2.1 e (em menor grau) v1.5.
  • O novo modelo produz imagens mais precisas.
  • A anatomia humana melhorou.
  • Prompts negativos não são tão necessários quanto na v2.1.
  • Pode criar retratos realistas.
  • Algumas esquisitices no modelo serão corrigidas antes do lançamento.

Leia mais artigos relacionados:

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Mais artigos
Damir Yalalov
Damir Yalalov

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Hot Stories
Junte-se ao nosso boletim informativo.
Últimas notícias

Chega o dia da sentença: o destino de CZ está em equilíbrio enquanto o tribunal dos EUA considera o apelo do DOJ

Changpeng Zhao está prestes a ser condenado hoje em um tribunal dos EUA em Seattle.

Saber Mais

Fundadores da Samourai Wallet acusados ​​de facilitar US$ 2 bilhões em negócios Darknet

A apreensão dos fundadores da Samourai Wallet representa um revés notável para a indústria, ressaltando a persistência ...

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
O preço do Bitcoin cai antes do anúncio da decisão da taxa de juros do Federal Reserve, analistas alertam sobre uma potencial mudança de mercado
Mercados Relatório de notícias Equipar
O preço do Bitcoin cai antes do anúncio da decisão da taxa de juros do Federal Reserve, analistas alertam sobre uma potencial mudança de mercado
1 de maio de 2024
PlayFi integra MultiversX para plug-and-play Web3 Experiência de Jogo
O negócio Relatório de notícias Equipar
PlayFi integra MultiversX para plug-and-play Web3 Experiência de Jogo
1 de maio de 2024
Galxe apresenta Passport V2 com ferramentas aprimoradas de privacidade e verificação para Web3
Relatório de notícias Equipar
Galxe apresenta Passport V2 com ferramentas aprimoradas de privacidade e verificação para Web3
30 de abril de 2024
De 32 ETH a 1 milhão de validadores: o papel da Lido Finance na democratização do staking de Ethereum
Software Histórias e resenhas Equipar
De 32 ETH a 1 milhão de validadores: o papel da Lido Finance na democratização do staking de Ethereum
30 de abril de 2024
CRYPTOMERIA LABS PTE. LTDA.