Google AI va anunciar el primer generador de text a música AudioLM
En breu
AudioLM pot produir música només escoltant sons
Mubert AI per continuar la parla humana i la música de piano
Amb GPT-3 i d'altres, la idea d'IA generativa té moltes possibilitats d'avançar. També vam descobrir els conceptes d'inpainting i outpainting; La IA completa amb habilitat les imatges mantenint el tema i l'estil. Què passa amb la música?
I una altra vegada! Com que tot això es basa en models de llenguatge d'IA que conserven el significat, era només qüestió de temps que aquesta tecnologia s'apliqués a la música. I ara ha arribat el moment.
Segons una investigació recent de Google, es pot ensenyar un nou marc per a la producció d'àudio anomenat AudioLM per crear veu realista i música de piano simplement escoltant sons. A causa de la seva consistència a llarg termini i una excel·lent fidelitat, AudioLM supera els sistemes anteriors i avança la creació d'àudio amb aplicacions de síntesi de veu i música assistida per ordinador.
AudioLM de Google AI pot ampliar un passatge acústic mantenint la "intenció". A partir d'ara, s'ha entrenat per continuar la parla humana i la música de piano, a partir d'una mostra limitada de dades d'entrada. Comproveu la mostra a continuació.
Els criteris per a la parla eren senzills: es va demanar als oients que avaluessin si la continuació sonava com a parla humana. Amb la música, es va descobrir que la "continuació" de la secció subministrada per a l'entrada és molt superior en qualitat que tots els generadors de música actuals des de zero, com ara JukeBox. Amb un suggeriment a l'entrada, l'IA continua la música considerablement millor.
Els evaluadors humans van escoltar mostres d'àudio per confirmar els resultats. Van determinar si escoltaven una continuació real d'una veu humana que havia estat gravada o una veu artificial produïda per AudioLM. Les seves dades indiquen una taxa d'èxit del 51.2%. Com a resultat, serà un repte per a l'oient mitjà distingir entre la parla produïda per AudioLM i la parla humana real.
La tecnologia de text a música altera el negoci de la música?
Un generador de text a música basat en el API de Mubert va ser anunciat recentment per un altre model d'IA, Mubert. Mubert crea un conjunt diferent de sons per a cada sol·licitud que envieu. La probabilitat de repetició és molt reduïda. La música es crea quan es fa una sol·licitud; no s'extreu d'una base de dades de cançons acabades. Que de veritat genera aquesta música és una pregunta comuna.
Els sons es trien abans de ser creats. Tant l'indicador d'entrada com les etiquetes de l'API de Mubert estan codificats en el vector espacial latent d'una xarxa neuronal transformadora. Aleshores s'escull el vector d'etiquetes més proper per a cada consulta i les etiquetes que l'acompanyen es transmeten a la nostra API per crear música. No es va utilitzar cap xarxa neuronal per construir cap dels sons (bucles separats per a baix, sols, etc.); tots els sons van ser produïts per músics i dissenyadors de so.
El següent pas important de Mubert és agafar elements del món actual, com ara fotos, pel·lícules, escenaris i presentacions, i crear la música del món que t'envolta.
Això és el que podeu obtenir posant de manera temerària indicacions de text a la boca del musical Mubert AI:
Aquesta és l'etapa inicial del procés de construcció d'un algorisme de generació més sofisticat i precís, però això necessitarà temps i diners.
No obstant això, la tecnologia de text a música ja està disponible, de manera que podeu generar àlbums a granel canviant "indicació d'entrada" per "escriure un script de sol·licitud aleatòria". Sembla que els artistes ja no són necessaris.
Llegeix més notícies relacionades:
renúncia
En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.
About The Autor
Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet.
més articlesDamir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet.