Stability AI Annonce Stable Diffusion Réinventer pour la génération d'image à image
En bref
Début mars, Stability AI a acquis le français Init ML, fabricant de la suite d'applications d'imagerie IA Clipdrop.
Cette collaboration entre Stability AI et Init ML mène au nouveau produit, Stable Diffusion Reimagined, qui est un générateur de nouvelles idées basées sur une seule image.
Début mars, Stability AI a acquise Le français Init ML, le créateur de la suite d'applications d'imagerie IA Clipdrop. C'est le premier achat de Stability AI depuis la levée de fonds.
Init ML, basée à Paris, a été fondée en juillet 2020 avec un financement de démarrage de la société de capital-risque Air Street Capital. Clipdrop compte plus de 15 millions d'utilisateurs sur ses outils Relight, Text Remover, Remove/Replace Background, Super Resolution et Clean Up depuis lors. Init ML fonctionnera comme une filiale indépendante en propriété exclusive de Stability AI, tous ses employés demeurant dans l'effectif. Selon le site Web ClipDrop, "Cette acquisition devrait rassembler l'expertise des deux sociétés pour améliorer leurs solutions basées sur l'IA". Stability AI vise à tirer parti des capacités d'Init ML pour fournir des services plus innovants et efficaces à ses clients.
Et maintenant, cette collaboration entre Stability AI et Init ML mène au nouveau produit, Stable Diffusion Réinventer. Stable Diffusion Reimagine ne recrée pas les images basées sur les données originales. Plutôt, Stable Diffusion Reimagine crée de nouvelles images inspirées des originaux.
C'est comme un générateur de nouvelles idées basées sur une seule image. En revanche, il peut être vu comme un copier-coller à vitesse maximale, une analogie complète de la demande de ChatGPT "Prends ça texte et réécriture c'est différent. Essentiellement, cet outil peut être perçu comme un catalyseur de créativité, suscitant de nouveaux concepts à partir d’un seul repère visuel. À l’inverse, cela peut également être assimilé à un processus de duplication rapide, semblable à l’acte de demander de l’aide à un ChatGPT reformuler ce passage.
Les images sont générées en fonction de l'image. Une fois que l'encodeur a traversé l'algorithme, du bruit est ajouté pour créer des variations. Cette approche donne des images similaires avec des détails et une composition différents. Contrairement à l'algorithme d'image à image, l'image d'origine est d'abord entièrement codée. Cela signifie que le générateur n'utilise aucun des pixels extraits de l'image d'origine. C'est pour que les artistes ne jurent pas de plagiat.
StabilityAI s'engage pour l'open source et promet de mettre le code sur GitHub, ce qui est très cool. En attendant, vous pouvez l'essayer gratuitement ici.
Voici des exemples fraîchement générés :
Pendant ce temps, les utilisateurs attendent un générateur de sites, de présentations, de pitch decks et de magazines glamour avec un seul bouton : "Entrez une URL ou un fichier ; notre IA réécrira les textes et régénérera les images.
- Stability AI, Hugging Face et Canva créent une nouvelle organisation à but non lucratif pour AI Research. EleutherAI, un groupe de recherche communautaire fondé par Connor Leahy, Leo Gao et Sid Black, crée une fondation à but non lucratif.
- En novembre, Stability AI a publié un nouvel article sur son blog à propos de Stable Diffusion 2.0, un nouvel algorithme plus efficace et robuste que le précédent, tout en le comparant à d'autres méthodes de pointe. Cette version présente des fonctionnalités robustes modèles texte-image formé avec un nouvel encodeur de texte (OpenCLIP) développé par LAION avec l'aide de Stability AI, ce qui améliore considérablement la qualité des images générées par rapport aux versions V1 précédentes. Ces modèles sont entraînés à l'aide d'un sous-ensemble esthétique de l'ensemble de données LAION-5B généré par Stability AIde l'équipe DeepFloyd, qui est ensuite filtrée pour exclure le contenu réservé aux adultes à l'aide du filtre NSFW de LAION.
- En octobre, Stability AI annoncé Générateur de musique AI Harmonai basé sur le modèle de diffusion de danse. Harmonai est une organisation communautaire qui publie des contenus open source audio génératif des outils pour accroître l'accès et le plaisir de tous à la composition musicale. Il est basé sur le modèle de diffusion de danse, qui génère des sons inédits dans un processus appelé diffusion.
Lire plus d'articles connexes:
Clause de non-responsabilité
En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.
A propos de l'auteur
Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet.
Plus d'articlesDamir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet.