Stability AI Lança um novo modelo chamado SDXL Beta
Em Breve
Stability AI lançou um novo modelo chamado SDXL Beta (Stable Diffusion XL Beta). É um modelo maior com mais parâmetros e algumas melhorias desconhecidas. Está disponível no DreamStudio, Stability AIO gerador de imagens oficial da e usa algoritmos avançados e técnicas de aprendizado profundo para criar visuais impressionantes.
Stability AI revelou uma prévia de um novo modelo chamado SDXL Beta, abreviação de Stable Diffusion XL Beta. Até o momento, a empresa não divulgou muitas informações sobre o modelo, mas ele está disponível para testes para quem quiser. O que há de novo neste modelo SDXL para stable diffusion? Quais são as vantagens e desvantagens? Vamos investigar.
Leia mais: Midjourney e Dall-E Artist Styles Dump com exemplos: 130 técnicas famosas de pintura de IA |
Qual é exatamente o modelo SDXL?
O modelo SDXL é um novo modelo que está atualmente sendo treinado. Está longe de estar finalizado e, quando for lançado, muitos detalhes sobre ele podem mudar; pelo que sabemos, pode nem ser chamado de modelo SDXL. Tudo o que sabemos é que é um modelo maior com mais parâmetros e algumas melhorias desconhecidas. É um modelo v2, não um modelo v3 (o que quer que isso signifique). É possível que as melhorias no modelo v2 possam melhorar o desempenho do sistema, mas sem mais informações, é difícil determinar o quão significativas essas melhorias podem ser. Além disso, seria útil saber quais parâmetros específicos foram adicionados ou ajustados nesta versão.
O modelo SDXL está atualmente disponível no DreamStudio, Stability AIgerador de imagem oficial do. Selecione SDXL Beta no menu do modelo para conferir. Parece usar algoritmos avançados e técnicas de aprendizado profundo para criar visuais impressionantes que são perfeitos para uma ampla gama de aplicações.
Melhorias
Texto legível. O SDXL é capaz de gerar texto legível e é provavelmente seu recurso mais impressionante, pois não era possível nos modelos v1 e v2.1 existentes. O texto gerado pelo SDXL nem sempre é preciso, como você pode ver no Stable Diffusion Texto abaixo. No entanto, é muito superior ao modelo v2.1, sem falar no modelo v1. Isso ocorre porque os SDXLs usam um algoritmo de aprendizado profundo mais avançado que permite entender e gerar estruturas de linguagem mais complexas. Com mais desenvolvimento, ele tem o potencial de se tornar ainda mais preciso e confiável.
Anatomia humana. A geração precisa de figuras humanas anatomicamente corretas tem sido um desafio para stable diffusion. A presença de membros adicionais ou ausentes é comum. A pintura interna é normalmente usada para corrigi-los ou, mais recentemente, você pode usar o recurso Open Pose do ControlNet para duplicar uma pose de uma imagem de referência. Temos o prazer de observar que é aqui que o modelo SDXL Beta melhorou. O modelo SDXL Beta mostrou melhorias significativas na duplicação precisa de poses de imagens de referência. Esta pode ser uma ferramenta valiosa para várias aplicações, como animação e realidade virtual.
Estilo retrato. O SDXL Beta produz excelentes retratos que se parecem com fotos – é uma atualização em comparação com a versão 1.5. O algoritmo aprimorado no SDXL Beta aprimora os detalhes e a precisão das cores dos retratos, resultando em uma aparência mais natural e realista. Os usuários também podem ajustar os níveis de nitidez e saturação para obter os efeitos desejados.
Duotônico. A palavra-chave duotone sempre produz fotos em preto e branco no modelo v1.5. No entanto, agora, as imagens duotônicas produzidas pelo SDXL Beta vêm em uma variedade de cores. É claro que, em comparação com os modelos v1, a capacidade de interpretar o prompt melhorou, resultando em respostas mais precisas e relevantes dos modelos v2, tornando-os uma ferramenta mais confiável para tarefas de processamento de linguagem natural.
Estilos artísticos. Houve alguns pequenos ajustes, mas é difícil determinar se o novo modelo oferece melhores resultados, pois são simplesmente únicos. É possível que esses ajustes sejam uma questão de preferência pessoal ou opinião subjetiva, tornando difícil fazer uma defijulgamento nitivo sobre sua qualidade. No entanto, a singularidade dos ajustes pode ser digna de nota e vale a pena explorar mais.
Conclusão
- Stable Diffusion pode finalmente produzir um texto que faça sentido.
- O SDXL fornece imagens esteticamente mais agradáveis do que os modelos v2.1 e (em menor grau) v1.5.
- O novo modelo produz imagens mais precisas.
- A anatomia humana melhorou.
- Prompts negativos não são tão necessários quanto na v2.1.
- Pode criar retratos realistas.
- Algumas esquisitices no modelo serão corrigidas antes do lançamento.
Leia mais artigos relacionados:
Aviso Legal
Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.
Sobre o autor
Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet.
Mais artigosDamir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet.