Google AI heeft de allereerste tekst-naar-muziekgenerator AudioLM aangekondigd
In het kort
AudioLM kan muziek produceren door gewoon naar geluiden te luisteren
Mubert AI gaat door met menselijke spraak en pianomuziek
met GPT-3 en anderen heeft het idee van generatieve AI een goede kans om vooruitgang te boeken. We ontdekten ook de concepten van in- en uitschilderen; AI voltooit de afbeeldingen vakkundig met behoud van het thema en de stijl. Hoe zit het met muziek?
En toch weer! Aangezien dit alles is gebaseerd op AI-taalmodellen die betekenis behouden, was het slechts een kwestie van tijd voordat deze technologie zou worden toegepast op muziek. En nu is het zover.
Volgens recent Google-onderzoek kan een nieuw raamwerk voor audioproductie, AudioLM genaamd, worden geleerd om realistische spraak- en pianomuziek te creëren door simpelweg naar geluiden te luisteren. Vanwege de consistentie op de lange termijn en uitstekende getrouwheid overtreft AudioLM eerdere systemen en bevordert het audiocreatie met toepassingen in spraaksynthese en computerondersteunde muziek.
AudioLM van Google AI kan een akoestische passage verlengen terwijl de 'intentie' behouden blijft. Vanaf nu is het getraind om menselijke spraak en pianomuziek voort te zetten, op basis van een beperkte steekproef van invoergegevens. Check onderstaand voorbeeld.
De criteria voor spraak waren eenvoudig: luisteraars werd gevraagd te beoordelen of de voortzetting klonk als menselijke spraak. Bij de muziek werd ontdekt dat de "voortzetting" van het gedeelte dat voor invoer wordt geleverd, veel beter is in kwaliteit dan alle huidige muziekgeneratoren vanaf nul, zoals JukeBox. Met een suggestie bij de ingang zet de AI de muziek aanzienlijk beter door.
Menselijke beoordelaars luisterden naar audiofragmenten om de resultaten te bevestigen. Ze bepaalden of ze een echte voortzetting hoorden van een menselijke stem die was opgenomen of een kunstmatige stem geproduceerd door AudioLM. Hun gegevens wijzen op een slagingspercentage van 51.2%. Als gevolg hiervan zal het voor de gemiddelde luisteraar een uitdaging zijn om onderscheid te maken tussen spraak geproduceerd door AudioLM en daadwerkelijke menselijke spraak.
Verandert tekst-naar-muziektechnologie de muziekbusiness?
Een tekst-naar-muziek generator gebaseerd op de Mubert-API werd onlangs aangekondigd door een ander AI-model, Mubert. Mubert maakt voor elk verzoek dat u verzendt een andere set geluiden. De kans op een herhaling is erg klein. Er wordt muziek gemaakt wanneer er een verzoek wordt gedaan; het wordt niet uit een database met voltooide melodieën gehaald. Hoe echt generatief deze muziek Het is een veel voorkomende vraag.
Geluiden worden gekozen voordat ze worden gemaakt. Zowel de invoerprompt als de Mubert API-tags zijn gecodeerd naar de latente ruimtevector van een neuraal netwerk van een transformator. De dichtstbijzijnde tagvector voor elke zoekopdracht wordt vervolgens gekozen en de bijbehorende tags worden naar onze API verzonden om muziek te maken. Er werd geen neuraal netwerk gebruikt om de geluiden te construeren (aparte loops voor bas, leads, enz.); alle geluiden zijn geproduceerd door muzikanten en geluidsontwerpers.
De volgende belangrijke stap van Mubert is om items uit de huidige wereld, zoals foto's, films, scenario's en presentaties, te nemen en de muziek van de wereld om je heen te creëren.
Dit is wat je kunt krijgen door roekeloos tekstprompts in de mond van de musical Mubert AI te stoppen:
Dit is de eerste fase in het proces van het bouwen van een meer geavanceerd en nauwkeurig genererend algoritme, maar dit kost tijd en geld.
Er is echter al tekst-naar-muziektechnologie beschikbaar, dus u kunt albums in bulk genereren door "invoerprompt" uit te schakelen voor "schrijf een willekeurig promptscript". Het lijkt erop dat artiesten niet langer nodig zijn.
Lees meer gerelateerd nieuws:
Disclaimer
In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.
Over de auteur
Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet.
Meer artikelenDamir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet.