Relatório de notícias Tecnologia
27 de julho de 2023

Stability AI Lança Stable Diffusion XL 1.0 para produzir rapidamente imagens de 1 megapixel

Em Breve

Stability AI lançou seu produto mais recente, SDXL 1.0, uma ferramenta de geração de texto para imagem com qualidade de imagem aprimorada e uma interface amigável.

Com 3.5 bilhões de parâmetros, ele pode produzir imagens de 1 megapixel em diferentes proporções.

O modelo é projetado para agilizar o texto para imagem processo de geração e inclui recursos de ajuste fino, como o ControlNet, derivado da pesquisa da Universidade de Stanford.

O SDXL 1.0 é otimizado para GPUs de consumo com capacidade de 8 GB de VRAM e é igualmente eficiente em instâncias de nuvem com preços razoáveis.

O software oferece ajuste fino aprimorado, permitindo a geração de Custom LoRA ou pontos de verificação com sobrecarga de dados reduzida.

A comunidade de IA pode esperar atualizações em um futuro próximo, e o SDXL 1.0 pode gerar conceitos avançados, como detalhes complexos ou composições espaciais complexas.

A ferramenta é de código aberto acessível no GitHub, promovendo transparência e colaboração dentro da comunidade.

Stable Diffusion XL 1.0 (SDXL 1.0), o mais novo produto da Stability AI, foi finalmente lançado. Esta ferramenta, que se posiciona como o mais recente desenvolvimento na geração de texto para imagem, destaca-se por sua melhor qualidade de imagem e interface amigável.

Stability AI Lança Stable Diffusion XL 1.0 para produzir rapidamente imagens de 1 megapixel
Crédito: Stability.ai
Relacionado: As ações da NVIDIA sobem 26% após fortes ganhos no primeiro trimestre, liderados pela crescente demanda por GPUs AI

Enquanto muitos na indústria de IA continuam melhorando suas plataformas, Stability AIO recente lançamento do SDXL 1.0 da empresa mostra um avanço promissor. Os impressionantes 3.5 bilhões de parâmetros do modelo permitem que ele produza rapidamente Imagens de 1 megapixel em diferentes proporções. Joe Penna, diretor de aprendizado de máquina aplicado da Stability AI, enfatizou as capacidades do modelo em uma conversa com o TechCrunch. Ele enfatizou como isso pode ser personalizado e como você pode ajustar conceitos e estilos de imagem usando dicas básicas de processamento de linguagem natural. Com a ajuda desses recursos, as tarefas dos usuários podem ser facilitadas enquanto seguem instruções claras para criar projetos complexos.

Stability AI parece ter abordado os desafios predominantes no setor de IA, particularmente no que diz respeito à geração de texto. Notavelmente, muitos modelos de ponta de texto para imagem muitas vezes falham quando encarregados de gerar texto legível, especialmente em estilos intrincados como caligrafia. No entanto, o SDXL 1.0 demonstrou proficiência na geração avançada de texto.

O que diferencia ainda mais o SDXL 1.0 é seu posicionamento competitivo em relação a outros concorrentes importantes, como Midjourney e Firefly da Adobe serviço. O novo modelo destaca os processos aprimorados de refinamento de imagem, resultando em cores mais ricas, iluminação superior e contraste aprimorado. Além disso, a inclusão de um recurso de ajuste fino facilita a geração de imagens personalizadas.

O desenvolvimento do SDXL 1.0 alavancou uma abordagem de treinamento simplificada, beneficiando-se de sua ampla base de parâmetros, posicionando-o como uma base ideal para várias ferramentas e recursos. Elaborando sobre seus atributos, Emad Mostaque, CEO da Stability AI, afirmou que o SDXL 1.0 foi meticulosamente elaborado para agilizar o geração de texto para imagem processo. Isso foi ainda mais enriquecido com o ControlNet, derivado da pesquisa da Universidade de Stanford, facilitando recursos aprimorados de ajuste fino e composição.

Uma característica notável do modelo SDXL 1.0 é seu design centrado no usuário. Ao contrário de exigir prompts longos para produzir resultados desejáveis, o modelo permite que os usuários emitam diretivas complexas de várias partes, capturando sucintamente a intenção com menos palavras do que os modelos anteriores. A partir de agora, esse modelo inovador pode ser acessado por meio de várias plataformas, incluindo os serviços Amazon Bedrock e Amazon SageMaker Jumpstart.

Desempenho aprimorado em GPUs de consumo e recursos avançados de ajuste fino

Imagem gerada por SDXL 1.0
Imagem gerada por SDXL 1.0
Relacionado: Stability AI levanta US$ 101 milhões e fecha avaliação em US$ 1 bilhão

Projetado com a compatibilidade em mente, o SDXL 1.0 é otimizado para GPUs de consumo com capacidade de VRAM de 8 GB e é igualmente eficiente em instâncias de nuvem com preços razoáveis.

Características e Compatibilidade:

O lançamento do SDXL 1.0 demonstra o compromisso da Stability em garantir soluções de IA eficientes e acessíveis para os usuários. Uma das principais conclusões do anúncio é a capacidade do software de operar perfeitamente em GPUs de consumo padrão. Para os usuários, isso significa o potencial de desempenho ideal sem a necessidade de hardware especializado ou de ponta.

Melhorias no ajuste fino:

A estabilidade incorporou recursos no SDXL 1.0 que simplificam o processo de retreinamento do modelo para conjuntos de dados exclusivos. O modelo atual permite a geração de Custom LoRA ou checkpoints com sobrecarga de dados diminuída, o que abre caminho para adaptações de modelos mais eficientes e rápidas para necessidades específicas. Além disso, há uma dica para o futuro como o Stability AI A equipe está desenvolvendo controles avançados para estruturas, estilos e composições específicas de tarefas. Especificamente, T2I/ControlNet, que é especializado para SDXL, está no horizonte. Embora esses avanços permaneçam na fase pré-beta, a comunidade de IA e os usuários podem antecipar atualizações em um futuro próximo.

Conceitos avançados de renderização:

O SDXL 1.0 mostra sua capacidade de gerar conceitos que antes eram desafiadores para modelos de imagem. Isso inclui a renderização de detalhes intrincados, como mãos e texto, ou composições espaciais ainda mais complexas, como cenas que retratam uma mulher ao fundo perseguindo um cachorro em primeiro plano. Esse recurso é particularmente significativo, pois indica um salto na capacidade do software de interpretar e renderizar cenários diferenciados e multifacetados.

Acessibilidade de código aberto:

Para desenvolvedores e entusiastas interessados ​​em se aprofundar, a Stability disponibilizou os pesos e o código do SDXL 1.0 no GitHub. Esse movimento não apenas promove a transparência, mas também incentiva o desenvolvimento colaborativo e a inovação dentro da comunidade.

Experimente:

Para aqueles ansiosos para testar os recursos do SDXL 1.0, o Stability o integrou a plataformas como DreamStudio e ClipDrop. Além disso, sessões interativas e demonstrações em potencial estão disponíveis no Discord, permitindo que os usuários experimentem os recursos da ferramenta em primeira mão.

Leia mais sobre IA:

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Mais artigos
Damir Yalalov
Damir Yalalov

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Cresce apetite institucional por ETFs de Bitcoin em meio à volatilidade

As divulgações por meio de registros 13F revelam investidores institucionais notáveis ​​​​que se envolvem em ETFs Bitcoin, ressaltando uma aceitação crescente de ...

Saber Mais

Chega o dia da sentença: o destino de CZ está em equilíbrio enquanto o tribunal dos EUA considera o apelo do DOJ

Changpeng Zhao está prestes a ser condenado hoje em um tribunal dos EUA em Seattle.

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
Side Protocol lança testnet incentivado e apresenta sistema de pontos internos, permitindo que os usuários ganhem pontos SIDE
Mercados Relatório de notícias Tecnologia
Side Protocol lança testnet incentivado e apresenta sistema de pontos internos, permitindo que os usuários ganhem pontos SIDE
9 de maio de 2024
Web3 e Crypto Events em maio de 2024: Explorando Novas Tecnologias e Tendências Emergentes em Blockchain e DeFi
Digerir O negócio Mercados Tecnologia
Web3 e Crypto Events em maio de 2024: Explorando Novas Tecnologias e Tendências Emergentes em Blockchain e DeFi
9 de maio de 2024
Notcoin será lançado no OKX Jumpstart e oferece 1.25% do fornecimento total de tokens para mineração
Mercados Relatório de notícias Tecnologia
Notcoin será lançado no OKX Jumpstart e oferece 1.25% do fornecimento total de tokens para mineração
9 de maio de 2024
Puffer Finance lança sua rede principal e aprimora a inclusão de operadores de nós para descentralização de rede
Relatório de notícias Tecnologia
Puffer Finance lança sua rede principal e aprimora a inclusão de operadores de nós para descentralização de rede
9 de maio de 2024
CRYPTOMERIA LABS PTE. LTDA.