Nieuwsverslag
21 oktober 2022

Google AI heeft de allereerste tekst-naar-muziekgenerator AudioLM aangekondigd

In het kort

AudioLM kan muziek produceren door gewoon naar geluiden te luisteren

Mubert AI gaat door met menselijke spraak en pianomuziek

met GPT-3 en anderen heeft het idee van generatieve AI een goede kans om vooruitgang te boeken. We ontdekten ook de concepten van in- en uitschilderen; AI voltooit de afbeeldingen vakkundig met behoud van het thema en de stijl. Hoe zit het met muziek?

En toch weer! Aangezien dit alles is gebaseerd op AI-taalmodellen die betekenis behouden, was het slechts een kwestie van tijd voordat deze technologie zou worden toegepast op muziek. En nu is het zover.

Google AI heeft de allereerste tekst-naar-muziekgenerator AudioLM aangekondigd

Volgens recent Google-onderzoek kan een nieuw raamwerk voor audioproductie, AudioLM genaamd, worden geleerd om realistische spraak- en pianomuziek te creëren door simpelweg naar geluiden te luisteren. Vanwege de consistentie op de lange termijn en uitstekende getrouwheid overtreft AudioLM eerdere systemen en bevordert het audiocreatie met toepassingen in spraaksynthese en computerondersteunde muziek.

We hebben een systeem ontwikkeld om door AudioLM geproduceerde synthetische geluiden te herkennen met behulp van dezelfde AI-concepten die ten grondslag lagen aan de creatie van onze vorige modellen.

AudioLM van Google AI kan een akoestische passage verlengen terwijl de 'intentie' behouden blijft. Vanaf nu is het getraind om menselijke spraak en pianomuziek voort te zetten, op basis van een beperkte steekproef van invoergegevens. Check onderstaand voorbeeld.

De criteria voor spraak waren eenvoudig: luisteraars werd gevraagd te beoordelen of de voortzetting klonk als menselijke spraak. Bij de muziek werd ontdekt dat de "voortzetting" van het gedeelte dat voor invoer wordt geleverd, veel beter is in kwaliteit dan alle huidige muziekgeneratoren vanaf nul, zoals JukeBox. Met een suggestie bij de ingang zet de AI de muziek aanzienlijk beter door.

Google AI heeft de allereerste tekst-naar-muziekgenerator AudioLM aangekondigd

Menselijke beoordelaars luisterden naar audiofragmenten om de resultaten te bevestigen. Ze bepaalden of ze een echte voortzetting hoorden van een menselijke stem die was opgenomen of een kunstmatige stem geproduceerd door AudioLM. Hun gegevens wijzen op een slagingspercentage van 51.2%. Als gevolg hiervan zal het voor de gemiddelde luisteraar een uitdaging zijn om onderscheid te maken tussen spraak geproduceerd door AudioLM en daadwerkelijke menselijke spraak.

Verandert tekst-naar-muziektechnologie de muziekbusiness?

Een tekst-naar-muziek generator gebaseerd op de Mubert-API werd onlangs aangekondigd door een ander AI-model, Mubert. Mubert maakt voor elk verzoek dat u verzendt een andere set geluiden. De kans op een herhaling is erg klein. Er wordt muziek gemaakt wanneer er een verzoek wordt gedaan; het wordt niet uit een database met voltooide melodieën gehaald. Hoe echt generatief deze muziek Het is een veel voorkomende vraag.

Verandert tekst-naar-muziektechnologie de muziekbusiness?

Geluiden worden gekozen voordat ze worden gemaakt. Zowel de invoerprompt als de Mubert API-tags zijn gecodeerd naar de latente ruimtevector van een neuraal netwerk van een transformator. De dichtstbijzijnde tagvector voor elke zoekopdracht wordt vervolgens gekozen en de bijbehorende tags worden naar onze API verzonden om muziek te maken. Er werd geen neuraal netwerk gebruikt om de geluiden te construeren (aparte loops voor bas, leads, enz.); alle geluiden zijn geproduceerd door muzikanten en geluidsontwerpers.

De volgende belangrijke stap van Mubert is om items uit de huidige wereld, zoals foto's, films, scenario's en presentaties, te nemen en de muziek van de wereld om je heen te creëren.

Dit is wat je kunt krijgen door roekeloos tekstprompts in de mond van de musical Mubert AI te stoppen:

Dit is de eerste fase in het proces van het bouwen van een meer geavanceerd en nauwkeurig genererend algoritme, maar dit kost tijd en geld.

Er is echter al tekst-naar-muziektechnologie beschikbaar, dus u kunt albums in bulk genereren door "invoerprompt" uit te schakelen voor "schrijf een willekeurig promptscript". Het lijkt erop dat artiesten niet langer nodig zijn.

Lees meer gerelateerd nieuws:

Disclaimer

In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.

Over de auteur

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

Meer artikelen
Damir Jalalov
Damir Jalalov

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

De institutionele belangstelling groeit richting Bitcoin ETF’s te midden van volatiliteit

Uit openbaarmakingen via 13F-registraties blijkt dat opmerkelijke institutionele beleggers zich bezighouden met Bitcoin ETF's, wat een groeiende acceptatie onderstreept van ...

Meer weten

De dag van de veroordeling breekt aan: het lot van CZ hangt in evenwicht terwijl de Amerikaanse rechtbank het pleidooi van DOJ in overweging neemt

Changpeng Zhao staat vandaag op het punt te worden veroordeeld door een Amerikaanse rechtbank in Seattle.

Meer weten
Sluit u aan bij onze innovatieve technologiegemeenschap
Lees meer
Lees meer
Injective bundelt krachten met AltLayer om de beveiliging van inEVM te herstellen
Business Nieuwsverslag Technologie
Injective bundelt krachten met AltLayer om de beveiliging van inEVM te herstellen
3 mei 2024
Masa werkt samen met Teller om MASA Lending Pool te introduceren, waardoor USDC-leningen op de basis mogelijk worden
Markten Nieuwsverslag Technologie
Masa werkt samen met Teller om MASA Lending Pool te introduceren, waardoor USDC-leningen op de basis mogelijk worden
3 mei 2024
Velodrome lanceert de komende weken de bètaversie van Superchain en breidt zich uit over OP Stack Layer 2 Blockchains
Markten Nieuwsverslag Technologie
Velodrome lanceert de komende weken de bètaversie van Superchain en breidt zich uit over OP Stack Layer 2 Blockchains
3 mei 2024
CARV kondigt partnerschap aan met Aethir om zijn datalaag te decentraliseren en beloningen te verdelen
Business Nieuwsverslag Technologie
CARV kondigt partnerschap aan met Aethir om zijn datalaag te decentraliseren en beloningen te verdelen
3 mei 2024