Interview Arte SMW
01 de maio de 2023

DeepFloyd e além: explorando o que há de mais recente em arte de IA com o CEO do NightCafe Studio

Em Breve

Durante uma entrevista exclusiva, o CEO do NightCafe Studio forneceu informações e perspectivas valiosas sobre arte gerada por IA.

Angus Russell apresentou o DeepFloyd - um novo algoritmo desenvolvido pelo parceiro do NightCafe Studio, Stability AI, que opera em espaço de pixel e usa um Large Language Model (LLM) para gerar imagens.

Estúdio NightCafé é um AI Art Generator que permite aos usuários criar arte impressionante e futurista em segundos com a ajuda da inteligência artificial. Fundado por Angus Russel há quatro anos, o NightCafe Studio nasceu da própria frustração de Angus por não conseguir encontrar peças de arte que ressoassem com ele. Impulsionado pelo conhecimento da existência de algoritmos de transferência de estilo, ele procurou um site que lhe permitisse criar arte personalizada por meio da transferência de estilo e imprimi-la. 

Para sua decepção, ele não conseguiu encontrar tal plataforma. No entanto, esse revés despertou nele uma ideia inovadora. Ele decidiu criar um aplicativo de transferência de estilo neural para criar arte gerada por IA e o colocou no Reddit.

O NightCafe Studio se originou como uma plataforma de geração de texto para imagem, tornando-o o primeiro de seu tipo. Esse recurso exclusivo gerou um aumento significativo na receita e na base de usuários. Desde então, a plataforma permaneceu na vanguarda da IA ​​generativa, atraindo uma grande comunidade de entusiastas que se deliciam em usar o gerador para criar obras de arte impressionantes. Hoje, o NightCafe Studio é amplamente considerado como um dos geradores de imagem AI mais populares e inovadores disponíveis.

Durante uma entrevista com Angus Russell, exploramos os benefícios e as limitações da arte gerada por IA, o uso crescente de inteligência artificial no mundo da arte e o mais recente algoritmo de geração de imagens de IA, DeepFloyd.

estúdio de café noturno
Sydney Opera House: Uma das primeiras imagens geradas por IA de Angus

O surgimento da arte gerada por IA

Na última década, a indústria da arte testemunhou uma infiltração gradual de IA e aprendizado de máquina (ML). Essas tecnologias de ponta introduziram alguns novos conceitos fascinantes, como Deepfakes e DALL-E, que ganharam atenção significativa em todo o mundo. Hoje, a indústria da arte não pode se dar ao luxo de ignorar o imenso impacto da IA, que está desencadeando uma revolução há muito esperada no setor.

Angus discutiu como o NightCafe Studio experimentou picos de crescimento durante o lançamento de Stable Diffusion, um modelo de texto para imagem que sua empresa lançou no dia do lançamento. Desde então, a barreira de entrada para a criação de ferramentas semelhantes foi reduzida devido ao código aberto de algoritmos e códigos de amostra.

O fundador do NightCafe Studio acredita que criar arte de IA não é apenas sobre o produto final, mas também sobre o processo de criá-lo. Ele o vê como uma forma de terapia e relaxamento, permitindo que as pessoas se expressem de maneiras únicas e criativas. Muitas pessoas que nunca se consideraram criativas descobriram suas habilidades artísticas por meio de imagens geradas por IA. Essa filosofia se reflete na interface do usuário da plataforma, projetada para ser amigável e acessível a artistas de todos os níveis. 

Só no NightCafe Studio, já são entre dois e três milhões de usuários por mês, gerando cerca de um milhão de imagens por dia. Stability AI, uma empresa de IA geradora de código aberto, estabelecido que eles tinham mais de 10 milhões de usuários ativos diariamente logo após o lançamento do Stable Diffusion.

Recomendado: 10+ Melhores Geradores de Arte AI de 2023: Midjourney, DALL-E, NightCafe, Artbreeder

DeepFloyd IF: o novo algoritmo de geração de imagem AI que mudou o jogo

NightCafe Studio está implementando um novo algoritmo por Stability AI chamado DeepFloyd, que promete revolucionar a forma como geramos imagens com inteligência artificial.

O DeepFloyd, que está atualmente em versão beta, é um novo modelo de texto para imagem que pode gerar imagens impressionantes a partir de descrições em linguagem natural. É baseado em uma nova arquitetura que combina um grande modelo de linguagem com três modelos de difusão. É inspirado no Imagen, um modelo semelhante desenvolvido pelo Google Research, mas nunca divulgado ao público.

O modelo pode gerar imagens claras e coerentes com texto e objetos em várias relações espaciais, o que é uma tarefa desafiadora para a maioria dos outros modelos de texto para imagem. Isso é obtido usando o modelo de linguagem grande T5-XXL-1.1 como um codificador de texto e uma quantidade significativa de camadas de atenção cruzada texto-imagem que fornecem uma melhor aliança de prompt e imagem. 

O DeepFloyd também pode criar imagens com uma proporção fora do padrão e possui um alto grau de fotorrealismo. Além disso, permite traduções de imagem para imagem de captura zero, o que significa que o estilo, os padrões e os detalhes de uma imagem de saída podem ser modificados, mantendo a forma básica da imagem de origem sem a necessidade de ajustes finos.

O novo algoritmo opera de maneira diferente do Stable Diffusion. O DeepFloyd usa espaço de pixel e um Large Language Model (LLM), enquanto Stable Diffusion usa espaço latente e um modelo CLIP fixo. O DeepFloyd também usa vários processos de difusão para criar imagens, enquanto Stable Diffusion usa apenas um.

DeepFloyd é o nome do grupo de pesquisa que construiu o algoritmo, e o próprio algoritmo é denominado IF. O grupo de pesquisa inclui muitas das mesmas pessoas que criaram GPT-3antecessor de, GPT-2, e um modelo de linguagem de última geração chamado RuGPT.

Algumas especulações sugerem que o nome IF pode ser inspirado por uma música do Pink Floyd com o mesmo nome, conforme sugerido pelas biografias de mídia social do grupo de pesquisa de algoritmos.

Leia mais sobre o algoritmo SUA PARTICIPAÇÃO FAZ A DIFERENÇA.

estúdio deepfloyd nightcafe
Imagens geradas com DeepFloyd IF. Fonte: Stability AI

Comparando as limitações de arte de IA e arte digital

Uma das principais limitações da IA ​​é o texto, embora o DeepFloyd resolva esse problema. Outra limitação é a dificuldade de obter uma imagem exatamente como imaginada, especialmente sem a orientação de especialistas. A IA também não tem a capacidade de compreender e interpretar o contextos culturais e sociais que moldam a arte humana. Portanto, a arte gerada pela IA pode por vezes produzir obras que parecem deslocadas ou culturalmente insensíveis.

No entanto, as imagens geradas por IA ainda podem ser bonitas e às vezes até melhores do que a ideia original, desde que o usuário esteja aberto a ser surpreendido, disse Angus. Além disso, existem maneiras de modificar o imagens geradas usando algoritmos de IA ou Photoshop. Embora a obtenção de uma imagem exata seja atualmente uma área de pesquisa ativa, estão sendo feitos progressos significativos. Em breve será possível ter controle total sobre todos os aspectos de uma imagem. 

A IA se baseia nas imagens e na arte que existem na web como inspiração, mas apenas naquelas em que foi treinada. Diferentes algoritmos, como Midjourney, DALL-E, e Stable Diffusion, são treinados em diferentes conjuntos de dados, o que significa que podem ter um desempenho melhor em tipos específicos de imagens. 

Recentemente, os pesquisadores investigaram o impacto da remoção de imagens de baixa qualidade dos conjuntos de dados de treinamento para melhorar os resultados da IA. Ao filtrar essas imagens de baixa qualidade, o conjunto de dados resultante pode se tornar menor, mas de maior qualidade, levando a melhores resultados sem aumentar o tamanho dos modelos de IA ou exigir hardware mais caro. Angus compartilhou que essa abordagem representa uma maneira promissora de melhorar a qualidade das imagens geradas por IA sem depender de modelos maiores e com uso intensivo de recursos.

Um problema com a IA na arte é que ela pode desvalorizar o trabalho de artistas humanos, que passam muito tempo criando arte, enquanto a IA é capaz de gerar arte em questão de segundos. No entanto, há uma certa qualidade intangível na arte humana que pode ser difícil para a IA replicar, como a profundidade emocional e a complexidade frequentemente presentes em obras criadas por humanos. O NightCafe Studio acredita que a IA é menos sobre a criação de arte para fins comerciais e mais sobre o prazer do próprio processo criativo.

“Sempre haverá valor na arte feita pelo homem, porque ela representa o esforço e a habilidade do artista, enquanto a arte gerada por IA não tem o mesmo valor intrínseco.”

Angus disse.

Uma questão ética em torno da IA ​​na arte é o uso de imagens públicas para treinar algoritmos de IA que podem não pertencer à empresa que está treinando a IA. Embora atualmente não haja nenhuma violação de leis, isso levanta questões sobre consentimento e privacidade. Empresas de código aberto como OpenAI e DALL-E estão trabalhando para tornar o processo mais ético, mas ainda é uma questão em aberto. Pode haver regulamentos futuros sobre o uso de imagens para treinar IA na arte.

Apesar dessas preocupações, Angus acredita que o processo de IA na arte não é fundamentalmente diferente de artistas humanos que se inspiram no trabalho de outros artistas. A IA sabe como as coisas se parecem e se lembra de partes das imagens, assim como os humanos. É simplesmente melhor recriá-los do zero.

Leia mais:

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Agne é uma jornalista que cobre as últimas tendências e desenvolvimentos no metaverso, IA e Web3 indústrias para o Metaverse Post. Sua paixão por contar histórias a levou a realizar inúmeras entrevistas com especialistas nessas áreas, sempre buscando descobrir histórias emocionantes e envolventes. Agne é bacharel em literatura e possui ampla experiência em redação sobre uma ampla variedade de tópicos, incluindo viagens, arte e cultura. Ela também foi voluntária como editora da organização de direitos dos animais, onde ajudou a aumentar a conscientização sobre questões de bem-estar animal. Entre em contato com ela [email protegido].

Mais artigos
Agne Cimerman
Agne Cimerman

Agne é uma jornalista que cobre as últimas tendências e desenvolvimentos no metaverso, IA e Web3 indústrias para o Metaverse Post. Sua paixão por contar histórias a levou a realizar inúmeras entrevistas com especialistas nessas áreas, sempre buscando descobrir histórias emocionantes e envolventes. Agne é bacharel em literatura e possui ampla experiência em redação sobre uma ampla variedade de tópicos, incluindo viagens, arte e cultura. Ela também foi voluntária como editora da organização de direitos dos animais, onde ajudou a aumentar a conscientização sobre questões de bem-estar animal. Entre em contato com ela [email protegido].

Hot Stories
Junte-se ao nosso boletim informativo.
Últimas notícias

Cresce apetite institucional por ETFs de Bitcoin em meio à volatilidade

As divulgações por meio de registros 13F revelam investidores institucionais notáveis ​​​​que se envolvem em ETFs Bitcoin, ressaltando uma aceitação crescente de ...

Saber Mais

Chega o dia da sentença: o destino de CZ está em equilíbrio enquanto o tribunal dos EUA considera o apelo do DOJ

Changpeng Zhao está prestes a ser condenado hoje em um tribunal dos EUA em Seattle.

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
Injective une forças com AltLayer para trazer segurança de restabelecimento para inEVM
O negócio Relatório de notícias Equipar
Injective une forças com AltLayer para trazer segurança de restabelecimento para inEVM
3 de maio de 2024
Masa se une ao Teller para introduzir o pool de empréstimos MASA, permitindo empréstimos em USDC na base
Mercados Relatório de notícias Equipar
Masa se une ao Teller para introduzir o pool de empréstimos MASA, permitindo empréstimos em USDC na base
3 de maio de 2024
Velodrome lança versão beta do Superchain nas próximas semanas e se expande para blockchains OP Stack Layer 2
Mercados Relatório de notícias Equipar
Velodrome lança versão beta do Superchain nas próximas semanas e se expande para blockchains OP Stack Layer 2
3 de maio de 2024
CARV anuncia parceria com Aethir para descentralizar sua camada de dados e distribuir recompensas
O negócio Relatório de notícias Equipar
CARV anuncia parceria com Aethir para descentralizar sua camada de dados e distribuir recompensas
3 de maio de 2024
CRYPTOMERIA LABS PTE. LTDA.