Google AI annoncerede den første tekst-til-musik-generator AudioLM nogensinde
Kort sagt
AudioLM kan producere musik blot ved at lytte til lyde
Mubert AI til at fortsætte menneskelig tale og klavermusik
Med GPT-3 og andre har ideen om generativ AI en god chance for at komme videre. Vi opdagede også begreberne inpainting og outpainting; AI fuldender dygtigt billederne, mens temaet og stilen bevares. Hvad med musik?
Og endnu en gang! Da alt dette er baseret på AI-sprogmodeller, der bevarer betydningen, var det kun et spørgsmål om tid, før denne teknologi ville blive anvendt på musik. Og nu er tiden kommet.
Ifølge nyere Google-forskning kan en ny ramme for lydproduktion kaldet AudioLM læres at skabe realistisk tale og klavermusik ved blot at lytte til lyde. På grund af sin langsigtede konsistens og fremragende troskab overgår AudioLM tidligere systemer og fremmer lydoprettelse med applikationer inden for stemmesyntese og computerstøttet musik.
AudioLM fra Google AI kan forlænge en akustisk passage, mens du holder "hensigten". Lige nu er den blevet trænet til at fortsætte menneskelig tale og klavermusik, baseret på et begrænset udsnit af inputdata. Tjek prøven nedenfor.
Kriterierne for tale var ligetil: Lytterne blev bedt om at vurdere, om fortsættelsen lød som menneskelig tale. Med musikken blev det opdaget, at "fortsættelsen" af den sektion, der leveres til input, er langt overlegen i kvalitet end alle nuværende musikgeneratorer fra bunden, som f.eks. Jukebox. Med et forslag ved indgangen fortsætter AI'en musikken betydeligt bedre.
Menneskelige bedømmere lyttede til lydprøver for at bekræfte resultaterne. De afgjorde, om de hørte en reel fortsættelse af en menneskelig stemme, der var blevet optaget, eller en kunstig stemme produceret af AudioLM. Deres data indikerer en succesrate på 51.2%. Som følge heraf vil det være udfordrende for den gennemsnitlige lytter at skelne mellem tale produceret af AudioLM og faktisk menneskelig tale.
Ændrer tekst-til-musik-teknologi musikbranchen?
En tekst-til-musik-generator baseret på Mubert API blev for nylig annonceret af en anden AI-model, Mubert. Mubert opretter et andet sæt lyde for hver anmodning, du sender. Sandsynligheden for en gentagelse er virkelig lille. Musik oprettes, når en anmodning fremsættes; det er ikke hentet fra en database med færdige melodier. Hvor virkelig generativ denne musik er et almindeligt spørgsmål.
Lyde vælges, før de oprettes. Både input-prompten og Mubert API-tags er kodet til et transformer-neuralt netværks latente rumvektor. Den nærmeste tagvektor for hver forespørgsel vælges derefter, og de medfølgende tags overføres til vores API for at skabe musik. Intet neuralt netværk blev brugt til at konstruere nogen af lydene (separate sløjfer til bas, leads osv.); alle lydene blev produceret af musikere og lyddesignere.
Muberts næste vigtige skridt er at tage genstande fra den nuværende verden, såsom fotos, film, scenarier og præsentationer, og skabe musikken fra verden omkring dig.
Her er, hvad du kan få ved hensynsløst at lægge tekstbeskeder i munden på musicalen Mubert AI:
Dette er den indledende fase i processen med at bygge en mere sofistikeret og præcis genereringsalgoritme, men det vil tage tid og penge.
Tekst-til-musik-teknologi er dog allerede tilgængelig, så du kan generere album i bulk ved at skifte "input prompt" ud for "skriv et tilfældigt prompt script." Det ser ud til, at der ikke længere er behov for kunstnere.
Læs flere relaterede nyheder:
Ansvarsfraskrivelse
I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.
Om forfatteren
Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab.
Flere artiklerDamir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab.