Rapport de nouvelles
21 octobre 2022

Google AI a annoncé le tout premier générateur de texte en musique AudioLM

En bref

AudioLM peut produire de la musique simplement en écoutant des sons

Mubert AI pour continuer la parole humaine et la musique de piano

Avec GPT-3 et d’autres, l’idée de l’IA générative a de bonnes chances d’avancer. Nous avons également découvert les concepts d'inpainting et d'outpainting ; L'IA complète habilement les images tout en gardant le thème et le style. Qu'en est-il de la musique?

Et encore une fois ! Comme tout cela est basé sur des modèles de langage IA qui conservent un sens, ce n'était qu'une question de temps avant que cette technologie ne soit appliquée à la musique. Et maintenant, le moment est venu.

Google AI a annoncé le tout premier générateur de texte en musique AudioLM

Selon des recherches récentes de Google, un nouveau cadre de production audio appelé AudioLM peut être enseigné pour créer de la parole réaliste et de la musique pour piano simplement en écoutant des sons. En raison de sa cohérence à long terme et de son excellente fidélité, AudioLM surpasse les systèmes antérieurs et fait progresser la création audio avec des applications de synthèse vocale et de musique assistée par ordinateur.

Nous avons développé un système pour reconnaître les sons synthétiques produits par AudioLM en utilisant les mêmes concepts d'IA qui ont sous-tendu la création de nos modèles précédents.

AudioLM de Google AI peut prolonger un passage acoustique tout en gardant "l'intention". À partir de maintenant, il a été formé pour continuer la parole humaine et la musique de piano, sur la base d'un échantillon limité de données d'entrée. Vérifiez l'exemple ci-dessous.

Les critères de la parole étaient simples : les auditeurs devaient évaluer si la suite ressemblait à une parole humaine. Avec la musique, on a découvert que la "suite" de la section fournie en entrée est de bien meilleure qualité que tous les générateurs de musique actuels à partir de zéro, tels que JukeBox. Avec une suggestion à l'entrée, l'IA continue considérablement mieux la musique.

Google AI a annoncé le tout premier générateur de texte en musique AudioLM

Les évaluateurs humains ont écouté des échantillons audio pour confirmer les résultats. Ils ont déterminé s'ils entendaient une vraie continuation d'une voix humaine qui avait été enregistrée ou une voix artificielle produite par AudioLM. Leurs données indiquent un taux de réussite de 51.2 %. En conséquence, il sera difficile pour l'auditeur moyen de faire la distinction entre la parole produite par AudioLM et la parole humaine réelle.

La technologie text-to-music modifie-t-elle l'industrie de la musique ?

Un générateur de texte en musique basé sur le API Mubert a été récemment annoncé par un autre modèle d'IA, Mubert. Mubert crée un ensemble de sons différent pour chaque demande que vous envoyez. La probabilité d’une répétition est vraiment mince. La musique est créée lorsqu'une demande est faite ; il n'est pas extrait d'une base de données de morceaux finis. Comme c'est vrai générative cette musique C'est une question courante.

La technologie text-to-music modifie-t-elle l'industrie de la musique ?

Les sons sont choisis avant d'être créés. L'invite d'entrée et les balises de l'API Mubert sont codées dans le vecteur d'espace latent d'un réseau neuronal de transformateur. Le vecteur de tags le plus proche pour chaque requête est alors choisi, et les tags qui l'accompagnent sont transmis à notre API pour créer de la musique. Aucun réseau neuronal n'a été utilisé pour construire l'un des sons (boucles séparées pour la basse, les leads, etc.); tous les sons ont été produits par des musiciens et des concepteurs sonores.

La prochaine étape importante de Mubert consiste à prendre des éléments du monde actuel, tels que des photos, des films, des scénarios et des présentations, et à créer la musique du monde qui vous entoure.

Voici ce que vous pouvez obtenir en mettant imprudemment des invites textuelles dans la bouche de l'IA musicale Mubert :

Il s'agit de la première étape du processus de construction d'un algorithme de génération plus sophistiqué et précis, mais cela prendra du temps et de l'argent.

Cependant, la technologie text-to-music est déjà disponible, vous pouvez donc générer des albums en masse en remplaçant "l'invite de saisie" par "écrire un script d'invite aléatoire". Il semble que les artistes ne soient plus nécessaires.

Lire plus d'actualités liées :

Clause de non-responsabilité 

En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.

A propos de l'auteur

Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet. 

Plus d'articles
Damir Yalalov
Damir Yalalov

Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet. 

L’appétit institutionnel augmente pour les ETF Bitcoin dans un contexte de volatilité

Les divulgations via les dépôts 13F révèlent que des investisseurs institutionnels notables se sont lancés dans les ETF Bitcoin, soulignant une acceptation croissante de...

En savoir plus

Le jour de la détermination de la peine arrive : le sort de CZ est en jeu alors que le tribunal américain examine le plaidoyer du DOJ

Changpeng Zhao est sur le point d'être condamné aujourd'hui par un tribunal américain à Seattle.

En savoir plus
Rejoignez notre communauté technologique innovante
En savoir plus
En savoir plus
Injective s'associe à AltLayer pour apporter la restauration de la sécurité à inEVM
La Brochure Rapport de nouvelles Technologie
Injective s'associe à AltLayer pour apporter la restauration de la sécurité à inEVM
3 mai 2024
Masa s'associe à Teller pour présenter le pool de prêts MASA et permettre à l'USDC d'emprunter sur la base
Marchés Rapport de nouvelles Technologie
Masa s'associe à Teller pour présenter le pool de prêts MASA et permettre à l'USDC d'emprunter sur la base
3 mai 2024
Velodrome lance la version bêta de Superchain dans les semaines à venir et s'étend aux blockchains OP Stack Layer 2
Marchés Rapport de nouvelles Technologie
Velodrome lance la version bêta de Superchain dans les semaines à venir et s'étend aux blockchains OP Stack Layer 2
3 mai 2024
CARV annonce un partenariat avec Aethir pour décentraliser sa couche de données et distribuer des récompenses
La Brochure Rapport de nouvelles Technologie
CARV annonce un partenariat avec Aethir pour décentraliser sa couche de données et distribuer des récompenses
3 mai 2024
CRYPTOMERIA LABS PTE. LTD.