StabilityAI annoncé AI Music Generator Harmonai basé sur le modèle de diffusion de danse
En bref
Harmonai apporte des modèles audio open source pour aider à façonner l'avenir de la musique
Dance Diffusion vise à rendre la production musicale plus accessible et agréable pour tous
Avec Harmonai, une nouvelle méthode astucieusement appelée pour, vous l'aurez deviné, créer un son à partir de rien, StabilityAILes chercheurs de ont fait de grands progrès dans le domaine de la génération audio par IA. Les résultats sont étonnants et variés, et ils sont tous un peu troublants.
Qu'est-ce qu'Harmonaï ?
Harmonaï est une organisation communautaire qui publie des outils audio génératifs open source pour accroître l'accès et le plaisir de chacun à composer de la musique. Pour le dire simplement, il génère des sons jamais entendus auparavant dans un processus appelé la diffusion, dans lequel le bruit blanc aléatoire est affiné en sons basés sur un modèle pré-entraîné qui contient des millions de paramètres qui ont été calculés au cours de son processus d'apprentissage pour encapsuler les caractéristiques du matériau source sur lequel il a été formé.
L'objectif du laboratoire de recherche en apprentissage profond Harmonai est de produire des modèles audio génératifs open source, de soutenir les chercheurs et les développeurs grâce à un financement informatique et une communauté et d'offrir de nouveaux outils créatifs aux artistes et aux professionnels de l'audio. L'objectif d'Harmonai est de rendre la production musicale plus accessible et agréable pour tous en développant des outils de synthèse et de manipulation audio open source.
C'est quoi Dance Diffusion ?
Imagine Stable Diffusion produisant uniquement du son au lieu d’images. Danse Diffusion est une collection de modèles de diffusion de musique générative accessibles au public. Les modèles initiaux génèrent 1 à 3 secondes d'audio et peuvent également être utilisés pour interpoler et transférer des enregistrements audio plus longs.
Est-ce donc similaire à l'IA text-to-image pour l'audio ?
Dans l'esprit, mais avec quelques variations importantes. Il n'existe pas de formulaire de saisie de texte dans lequel vous pouvez taper « caisse claire » et appuyer sur GO. Ce n'est donc pas un formulaire de saisie de texte. texte en audio ou générateur de synthèse vocale. Il ne faut jamais dire jamais, bien sûr - ce projet en est encore à ses débuts - mais pour l'instant, c'est à vous, l'utilisateur, de fournir un pool de fichiers audio (qu'il s'agisse de caisses claires ou de tout ce dont vous souhaitez générer des variations de ) sur lequel entraîner le modèle. Alternativement, vous pouvez utiliser l'un des 6 modèles pré-entraînés déjà présents dans le Cahier Diffusion Danse pour commencer - et il y a beaucoup de plaisir à jouer seul avec eux !
Harmonai est-il lié aux Dadabots ?
Ouais. Harmonai est Dadabots + plus de gens incroyables + 4000 GPU. Dans leur chaîne YouTube, les artistes de Dadabots utilisent déjà de la musique générée par l'IA :
Échantillons audio AI fraîchement générés par Harmonaï
Suivez la communauté canal de discorde pour écouter plus de fichiers audio.
Intéressé à lire plus? Voici quelques nouvelles supplémentaires à vérifier :
Clause de non-responsabilité
En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.
A propos de l'auteur
Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet.
Plus d'articlesDamir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet.