Informe de notícies
Octubre 21, 2022

Google AI va anunciar el primer generador de text a música AudioLM

En breu

AudioLM pot produir música només escoltant sons

Mubert AI per continuar la parla humana i la música de piano

Amb GPT-3 i d'altres, la idea d'IA generativa té moltes possibilitats d'avançar. També vam descobrir els conceptes d'inpainting i outpainting; La IA completa amb habilitat les imatges mantenint el tema i l'estil. Què passa amb la música?

I una altra vegada! Com que tot això es basa en models de llenguatge d'IA que conserven el significat, era només qüestió de temps que aquesta tecnologia s'apliqués a la música. I ara ha arribat el moment.

Google AI va anunciar el primer generador de text a música AudioLM

Segons una investigació recent de Google, es pot ensenyar un nou marc per a la producció d'àudio anomenat AudioLM per crear veu realista i música de piano simplement escoltant sons. A causa de la seva consistència a llarg termini i una excel·lent fidelitat, AudioLM supera els sistemes anteriors i avança la creació d'àudio amb aplicacions de síntesi de veu i música assistida per ordinador.

Hem desenvolupat un sistema per reconèixer els sons sintètics produïts per AudioLM utilitzant els mateixos conceptes d'IA que van basar la creació dels nostres models anteriors.

AudioLM de Google AI pot ampliar un passatge acústic mantenint la "intenció". A partir d'ara, s'ha entrenat per continuar la parla humana i la música de piano, a partir d'una mostra limitada de dades d'entrada. Comproveu la mostra a continuació.

Els criteris per a la parla eren senzills: es va demanar als oients que avaluessin si la continuació sonava com a parla humana. Amb la música, es va descobrir que la "continuació" de la secció subministrada per a l'entrada és molt superior en qualitat que tots els generadors de música actuals des de zero, com ara JukeBox. Amb un suggeriment a l'entrada, l'IA continua la música considerablement millor.

Google AI va anunciar el primer generador de text a música AudioLM

Els evaluadors humans van escoltar mostres d'àudio per confirmar els resultats. Van determinar si escoltaven una continuació real d'una veu humana que havia estat gravada o una veu artificial produïda per AudioLM. Les seves dades indiquen una taxa d'èxit del 51.2%. Com a resultat, serà un repte per a l'oient mitjà distingir entre la parla produïda per AudioLM i la parla humana real.

La tecnologia de text a música altera el negoci de la música?

Un generador de text a música basat en el API de Mubert va ser anunciat recentment per un altre model d'IA, Mubert. Mubert crea un conjunt diferent de sons per a cada sol·licitud que envieu. La probabilitat de repetició és molt reduïda. La música es crea quan es fa una sol·licitud; no s'extreu d'una base de dades de cançons acabades. Que de veritat genera aquesta música és una pregunta comuna.

La tecnologia de text a música altera el negoci de la música?

Els sons es trien abans de ser creats. Tant l'indicador d'entrada com les etiquetes de l'API de Mubert estan codificats en el vector espacial latent d'una xarxa neuronal transformadora. Aleshores s'escull el vector d'etiquetes més proper per a cada consulta i les etiquetes que l'acompanyen es transmeten a la nostra API per crear música. No es va utilitzar cap xarxa neuronal per construir cap dels sons (bucles separats per a baix, sols, etc.); tots els sons van ser produïts per músics i dissenyadors de so.

El següent pas important de Mubert és agafar elements del món actual, com ara fotos, pel·lícules, escenaris i presentacions, i crear la música del món que t'envolta.

Això és el que podeu obtenir posant de manera temerària indicacions de text a la boca del musical Mubert AI:

Aquesta és l'etapa inicial del procés de construcció d'un algorisme de generació més sofisticat i precís, però això necessitarà temps i diners.

No obstant això, la tecnologia de text a música ja està disponible, de manera que podeu generar àlbums a granel canviant "indicació d'entrada" per "escriure un script de sol·licitud aleatòria". Sembla que els artistes ja no són necessaris.

Llegeix més notícies relacionades:

renúncia

En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.

About The Autor

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet. 

més articles
Damir Yalalov
Damir Yalalov

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet. 

L'apetit institucional creix cap als ETF de Bitcoin enmig de la volatilitat

Les divulgacions a través de les presentacions 13F revelen inversors institucionals notables que s'estan incursionant en els ETF de Bitcoin, subratllant una acceptació creixent de...

saber Més

Arriba el dia de la sentència: el destí de CZ està en equilibri mentre el tribunal nord-americà considera la petició del DOJ

Changpeng Zhao està a punt d'enfrontar-se avui a la sentència en un tribunal dels Estats Units a Seattle.

saber Més
Uneix-te a la nostra comunitat tecnològica innovadora
Més...
Llegeix més
Injective uneix forces amb AltLayer per aportar seguretat de restauració a inEVM
Negocis Informe de notícies Tecnologia
Injective uneix forces amb AltLayer per aportar seguretat de restauració a inEVM
Pot 3, 2024
Masa s'uneix amb Teller per presentar el grup de préstecs MASA, que permet l'endeutament de l'USDC a la base
mercats Informe de notícies Tecnologia
Masa s'uneix amb Teller per presentar el grup de préstecs MASA, que permet l'endeutament de l'USDC a la base
Pot 3, 2024
Velodrome llança la versió beta de Superchain en les properes setmanes i s'expandeix a les cadenes de blocs de la capa 2 de la pila OP
mercats Informe de notícies Tecnologia
Velodrome llança la versió beta de Superchain en les properes setmanes i s'expandeix a les cadenes de blocs de la capa 2 de la pila OP
Pot 3, 2024
CARV anuncia associació amb Aethir per descentralitzar la seva capa de dades i distribuir recompenses
Negocis Informe de notícies Tecnologia
CARV anuncia associació amb Aethir per descentralitzar la seva capa de dades i distribuir recompenses
Pot 3, 2024
CRYPTOMERIA LABS PTE. LTD.