Interview L'art SMW
01 mai 2023

DeepFloyd et au-delà : exploration des dernières nouveautés en matière d'IA avec le PDG de NightCafe Studio

En bref

Au cours d'une interview exclusive, le PDG de NightCafe Studio a fourni des informations et des perspectives précieuses sur l'art généré par l'IA.

Angus Russell a présenté DeepFloyd - un nouvel algorithme développé par le partenaire de NightCafe Studio, Stability AI, qui fonctionne dans l'espace pixel et utilise un modèle de langage large (LLM) pour générer des images.

NightCafé Studio est un générateur d'art AI qui permet aux utilisateurs de créer de l'art époustouflant et futuriste en quelques secondes à l'aide de l'intelligence artificielle. Fondé par Angus Russel il y a quatre ans, NightCafe Studio est né de la propre frustration d'Angus de ne pas pouvoir trouver des œuvres d'art qui résonnaient avec lui. Poussé par la connaissance de l'existence d'algorithmes de transfert de style, il a recherché un site Web qui lui permettrait de créer de l'art personnalisé par transfert de style et de l'imprimer. 

À sa grande déception, il n'a pas pu trouver une telle plate-forme. Cependant, cet échec a suscité en lui une idée novatrice. Il a décidé de créer une application de transfert de style neuronal pour créer de l'art généré par l'IA, et il l'a mis en ligne sur Reddit.

NightCafe Studio est à l'origine une plate-forme de génération de texte en image, ce qui en fait la première du genre. Cette caractéristique unique a entraîné une augmentation significative des revenus et de la base d'utilisateurs. Depuis lors, la plate-forme est restée à la pointe de l'IA générative, attirant une large communauté de passionnés qui aiment utiliser le générateur pour créer de superbes œuvres d'art. Aujourd'hui, NightCafe Studio est largement considéré comme l'un des générateurs d'images AI les plus populaires et les plus innovants disponibles.

Lors d'un entretien avec Angus Russell, nous avons exploré les avantages et les limites de l'art généré par l'IA, l'utilisation croissante de l'intelligence artificielle dans le monde de l'art et le dernier algorithme de génération d'images d'IA, DeepFloyd.

studio de café de nuit
Opéra de Sydney : l'une des premières images générées par l'IA d'Angus

L'émergence de l'art généré par l'IA

Au cours de la dernière décennie, l'industrie de l'art a été témoin d'une infiltration progressive de l'IA et de l'apprentissage automatique (ML). Ces technologies de pointe ont introduit de nouveaux concepts fascinants, tels que Deepfakes et DALL-E, qui ont suscité une attention considérable dans le monde entier. Aujourd'hui, l'industrie de l'art ne peut se permettre d'ignorer l'immense impact de l'IA, qui déclenche maintenant une révolution attendue depuis longtemps dans le secteur.

Angus a expliqué comment NightCafe Studio a connu des pics de croissance lors de la sortie de Stable Diffusion, un modèle texte-image que son entreprise a mis en ligne le jour du lancement. Depuis lors, la barrière à l'entrée pour la création d'outils similaires a été abaissée grâce à l'open source d'algorithmes et d'exemples de codes.

Le fondateur de NightCafe Studio pense que la création d'art IA ne concerne pas seulement le produit final, mais également le processus de création. Il y voit une forme de thérapie et de relaxation, permettant aux gens de s'exprimer de manière unique et créative. De nombreuses personnes qui ne s'étaient jamais considérées comme créatives ont découvert leurs capacités artistiques grâce à des images générées par l'IA. Cette philosophie se reflète dans l'interface utilisateur de la plateforme, qui est conçue pour être conviviale et accessible aux artistes de tous niveaux. 

Rien que sur NightCafe Studio, il y a déjà entre deux et trois millions d'utilisateurs par mois, générant environ un million d'images par jour. Stability AI, une entreprise d'IA générative open source, A déclaré qu'ils avaient plus de 10 millions d'utilisateurs qui étaient actifs quotidiennement peu de temps après le lancement de Stable Diffusion.

Recommandée: 10+ meilleurs générateurs d'art IA de 2023 : Midjourney, DALL-E, NightCafe, Artbreeder

DeepFloyd IF : le nouvel algorithme de génération d'images d'IA qui change la donne

NightCafe Studio implémente un nouvel algorithme en Stability AI appelé DeepFloyd, qui promet de révolutionner la façon dont nous générons des images avec l'intelligence artificielle.

DeepFloyd, qui est actuellement en version bêta, est un nouveau modèle texte-image qui peut générer des images impressionnantes à partir de descriptions en langage naturel. Il est basé sur une nouvelle architecture qui combine un grand modèle de langage avec trois modèles de diffusion. Il est inspiré d'Imagen, un modèle similaire développé par Google Research mais jamais rendu public.

Le modèle peut générer des images claires et cohérentes avec du texte et des objets dans diverses relations spatiales, ce qui est une tâche difficile pour la plupart des autres modèles texte-image. Ceci est réalisé en utilisant le grand modèle de langage T5-XXL-1.1 comme encodeur de texte et une quantité importante de couches d'attention croisée texte-image qui offrent une meilleure alliance entre les invites et les images. 

DeepFloyd peut également créer des images avec un rapport d'aspect non standard et a un haut degré de photoréalisme. De plus, il permet des traductions d'image à image sans prise de vue, ce qui signifie que le style, les motifs et les détails d'une image de sortie peuvent être modifiés tout en conservant la forme de base de l'image source sans avoir besoin d'un réglage fin.

Le nouvel algorithme fonctionne différemment de Stable Diffusion. DeepFloyd utilise l'espace pixel et un Large Language Model (LLM), alors que Stable Diffusion utilise l'espace latent et un modèle CLIP fixe. DeepFloyd utilise également plusieurs processus de diffusion pour créer des images, tandis que Stable Diffusion n'en utilise qu'un seul.

DeepFloyd est le nom du groupe de recherche qui a construit l'algorithme, et l'algorithme lui-même s'appelle IF. Le groupe de recherche comprend bon nombre des mêmes personnes qui ont créé GPT-3le prédécesseur, GPT-2, et un précédent modèle de langage de pointe appelé RuGPT.

Certaines spéculations suggèrent que le nom IF pourrait être inspiré par une chanson de Pink Floyd du même nom, comme le suggèrent les biographies des médias sociaux du groupe de recherche sur les algorithmes.

En savoir plus sur l'algorithme ici.

studio de café de nuit deepfloyd
Images générées avec DeepFloyd IF. Source: Stability AI

Comparaison des limites de l'art de l'IA et de l'art numérique

L'une des principales limitations de l'IA est le texte, bien que DeepFloyd s'attaque à ce problème. Une autre limitation est la difficulté d’obtenir une image exactement comme envisagée, surtout sans l’aide d’un expert. L’IA n’a pas non plus la capacité de comprendre et d’interpréter les contextes culturels et sociaux qui façonnent l’art humain. Par conséquent, l’art généré par l’IA peut parfois produire des œuvres qui semblent déplacées ou insensibles à la culture.

Cependant, les images générées par l'IA peuvent toujours être belles et parfois même meilleures que l'idée originale, à condition que l'utilisateur soit prêt à être surpris, a déclaré Angus. En outre, il existe des moyens de modifier le images générées à l'aide d'algorithmes d'IA ou de Photoshop. Bien que l’obtention d’une image exacte soit actuellement un domaine de recherche actif, des progrès significatifs sont réalisés. Il sera peut-être bientôt possible d’avoir un contrôle total sur tous les aspects d’une image. 

L'IA s'appuie sur les images et l'art qui existent sur le Web comme source d'inspiration, mais uniquement sur ceux sur lesquels elle a été formée. Différents algorithmes, tels que Midjourney, DALL-E et Stable Diffusion, sont formés sur différents ensembles de données, ce qui signifie qu'ils peuvent être plus performants sur des types d'images spécifiques. 

Récemment, des chercheurs ont étudié l'impact de la suppression des images de faible qualité des ensembles de données d'entraînement pour améliorer les résultats de l'IA. En filtrant ces images de faible qualité, l'ensemble de données résultant peut devenir plus petit mais de meilleure qualité, conduisant à de meilleurs résultats sans augmenter la taille des modèles d'IA ni nécessiter de matériel plus coûteux. Angus a partagé que cette approche représente un moyen prometteur d'améliorer la qualité des images générées par l'IA sans s'appuyer sur des modèles plus grands et plus gourmands en ressources.

L'un des problèmes de l'IA dans l'art est qu'elle peut dévaloriser le travail des artistes humains, qui passent beaucoup de temps à créer de l'art, alors que l'IA est capable de générer de l'art en quelques secondes. Cependant, il existe une certaine qualité intangible dans l'art humain qui peut être difficile à reproduire pour l'IA, comme la profondeur émotionnelle et la complexité souvent présentes dans les œuvres créées par l'homme. NightCafe Studio pense que l'IA concerne moins la création artistique à des fins commerciales que le plaisir du processus créatif lui-même.

"Il y aura toujours de la valeur dans l'art créé par l'homme car il représente l'effort et la compétence de l'artiste, alors que l'art généré par l'IA n'a pas la même valeur intrinsèque",

Dit Angus.

Un problème éthique entourant l'IA dans l'art est l'utilisation de l'image publique pour former des algorithmes d'IA qui peuvent ne pas appartenir à l'entreprise qui forme l'IA. Bien qu'aucune loi ne soit actuellement enfreinte, cela soulève des questions sur le consentement et la confidentialité. Les entreprises open source comme OpenAI et DALL-E travaillent à rendre le processus plus éthique, mais cela reste une question ouverte. Il pourrait y avoir de futures réglementations concernant l'utilisation d'images pour former l'IA à l'art.

Malgré ces préoccupations, Angus pense que le processus de l'IA dans l'art n'est pas fondamentalement différent des artistes humains s'inspirant du travail d'autres artistes. L'IA sait à quoi ressemblent les choses et mémorise des éléments sur les images, tout comme les humains. C'est simplement mieux de les recréer à partir de zéro.

Lire la suite:

Clause de non-responsabilité 

En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.

A propos de l'auteur

Agne est une journaliste qui couvre les dernières tendances et développements dans le métaverse, l'IA et Web3 industries pour la Metaverse Post. Sa passion pour la narration l'a amenée à mener de nombreux entretiens avec des experts dans ces domaines, cherchant toujours à découvrir des histoires passionnantes et engageantes. Agne est titulaire d'un baccalauréat en littérature et possède une vaste expérience en rédaction sur un large éventail de sujets, notamment les voyages, l'art et la culture. Elle s'est également portée volontaire en tant que rédactrice pour une organisation de défense des droits des animaux, où elle a contribué à sensibiliser les gens aux problèmes de bien-être animal. Contactez-la au [email protected].

Plus d'articles
Agne Cimerman
Agne Cimerman

Agne est une journaliste qui couvre les dernières tendances et développements dans le métaverse, l'IA et Web3 industries pour la Metaverse Post. Sa passion pour la narration l'a amenée à mener de nombreux entretiens avec des experts dans ces domaines, cherchant toujours à découvrir des histoires passionnantes et engageantes. Agne est titulaire d'un baccalauréat en littérature et possède une vaste expérience en rédaction sur un large éventail de sujets, notamment les voyages, l'art et la culture. Elle s'est également portée volontaire en tant que rédactrice pour une organisation de défense des droits des animaux, où elle a contribué à sensibiliser les gens aux problèmes de bien-être animal. Contactez-la au [email protected].

L’appétit institutionnel augmente pour les ETF Bitcoin dans un contexte de volatilité

Les divulgations via les dépôts 13F révèlent que des investisseurs institutionnels notables se sont lancés dans les ETF Bitcoin, soulignant une acceptation croissante de...

En savoir plus

Le jour de la détermination de la peine arrive : le sort de CZ est en jeu alors que le tribunal américain examine le plaidoyer du DOJ

Changpeng Zhao est sur le point d'être condamné aujourd'hui par un tribunal américain à Seattle.

En savoir plus
Rejoignez notre communauté technologique innovante
En savoir plus
En savoir plus
Injective s'associe à AltLayer pour apporter la restauration de la sécurité à inEVM
La Brochure Rapport de nouvelles Technologie
Injective s'associe à AltLayer pour apporter la restauration de la sécurité à inEVM
3 mai 2024
Masa s'associe à Teller pour présenter le pool de prêts MASA et permettre à l'USDC d'emprunter sur la base
Marchés Rapport de nouvelles Technologie
Masa s'associe à Teller pour présenter le pool de prêts MASA et permettre à l'USDC d'emprunter sur la base
3 mai 2024
Velodrome lance la version bêta de Superchain dans les semaines à venir et s'étend aux blockchains OP Stack Layer 2
Marchés Rapport de nouvelles Technologie
Velodrome lance la version bêta de Superchain dans les semaines à venir et s'étend aux blockchains OP Stack Layer 2
3 mai 2024
CARV annonce un partenariat avec Aethir pour décentraliser sa couche de données et distribuer des récompenses
La Brochure Rapport de nouvelles Technologie
CARV annonce un partenariat avec Aethir pour décentraliser sa couche de données et distribuer des récompenses
3 mai 2024
CRYPTOMERIA LABS PTE. LTD.