Nyheds rapport
Oktober 21, 2022

Google AI annoncerede den første tekst-til-musik-generator AudioLM nogensinde

Kort sagt

AudioLM kan producere musik blot ved at lytte til lyde

Mubert AI til at fortsætte menneskelig tale og klavermusik

Med GPT-3 og andre har ideen om generativ AI en god chance for at komme videre. Vi opdagede også begreberne inpainting og outpainting; AI fuldender dygtigt billederne, mens temaet og stilen bevares. Hvad med musik?

Og endnu en gang! Da alt dette er baseret på AI-sprogmodeller, der bevarer betydningen, var det kun et spørgsmål om tid, før denne teknologi ville blive anvendt på musik. Og nu er tiden kommet.

Google AI annoncerede den første tekst-til-musik-generator AudioLM nogensinde

Ifølge nyere Google-forskning kan en ny ramme for lydproduktion kaldet AudioLM læres at skabe realistisk tale og klavermusik ved blot at lytte til lyde. På grund af sin langsigtede konsistens og fremragende troskab overgår AudioLM tidligere systemer og fremmer lydoprettelse med applikationer inden for stemmesyntese og computerstøttet musik.

Vi har udviklet et system til at genkende AudioLM-producerede syntetiske lyde ved hjælp af de samme AI-koncepter, som lå til grund for skabelsen af ​​vores tidligere modeller.

AudioLM fra Google AI kan forlænge en akustisk passage, mens du holder "hensigten". Lige nu er den blevet trænet til at fortsætte menneskelig tale og klavermusik, baseret på et begrænset udsnit af inputdata. Tjek prøven nedenfor.

Kriterierne for tale var ligetil: Lytterne blev bedt om at vurdere, om fortsættelsen lød som menneskelig tale. Med musikken blev det opdaget, at "fortsættelsen" af den sektion, der leveres til input, er langt overlegen i kvalitet end alle nuværende musikgeneratorer fra bunden, som f.eks. Jukebox. Med et forslag ved indgangen fortsætter AI'en musikken betydeligt bedre.

Google AI annoncerede den første tekst-til-musik-generator AudioLM nogensinde

Menneskelige bedømmere lyttede til lydprøver for at bekræfte resultaterne. De afgjorde, om de hørte en reel fortsættelse af en menneskelig stemme, der var blevet optaget, eller en kunstig stemme produceret af AudioLM. Deres data indikerer en succesrate på 51.2%. Som følge heraf vil det være udfordrende for den gennemsnitlige lytter at skelne mellem tale produceret af AudioLM og faktisk menneskelig tale.

Ændrer tekst-til-musik-teknologi musikbranchen?

En tekst-til-musik-generator baseret på Mubert API blev for nylig annonceret af en anden AI-model, Mubert. Mubert opretter et andet sæt lyde for hver anmodning, du sender. Sandsynligheden for en gentagelse er virkelig lille. Musik oprettes, når en anmodning fremsættes; det er ikke hentet fra en database med færdige melodier. Hvor virkelig generativ denne musik er et almindeligt spørgsmål.

Ændrer tekst-til-musik-teknologi musikbranchen?

Lyde vælges, før de oprettes. Både input-prompten og Mubert API-tags er kodet til et transformer-neuralt netværks latente rumvektor. Den nærmeste tagvektor for hver forespørgsel vælges derefter, og de medfølgende tags overføres til vores API for at skabe musik. Intet neuralt netværk blev brugt til at konstruere nogen af ​​lydene (separate sløjfer til bas, leads osv.); alle lydene blev produceret af musikere og lyddesignere.

Muberts næste vigtige skridt er at tage genstande fra den nuværende verden, såsom fotos, film, scenarier og præsentationer, og skabe musikken fra verden omkring dig.

Her er, hvad du kan få ved hensynsløst at lægge tekstbeskeder i munden på musicalen Mubert AI:

Dette er den indledende fase i processen med at bygge en mere sofistikeret og præcis genereringsalgoritme, men det vil tage tid og penge.

Tekst-til-musik-teknologi er dog allerede tilgængelig, så du kan generere album i bulk ved at skifte "input prompt" ud for "skriv et tilfældigt prompt script." Det ser ud til, at der ikke længere er behov for kunstnere.

Læs flere relaterede nyheder:

Ansvarsfraskrivelse

I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.

Om forfatteren

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Flere artikler
Damir Yalalov
Damir Yalalov

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Hot Stories
Tilmeld dig vores nyhedsbrev.
Seneste Nyheder

Institutionel appetit vokser mod Bitcoin ETF'er midt i volatilitet

Afsløringer gennem 13F-arkivering afslører bemærkelsesværdige institutionelle investorer, der dytter i Bitcoin ETF'er, hvilket understreger en voksende accept af ...

Vide mere

Straffeudmålingsdagen ankommer: CZ's skæbne hænger i balance, da amerikansk domstol overvejer DOJ's anbringende

Changpeng Zhao står klar til at blive dømt ved en amerikansk domstol i Seattle i dag.

Vide mere
Tilmeld dig vores innovative teknologifællesskab
Læs mere
Læs mere
Injective slår sig sammen med AltLayer for at give inEVM genskabende sikkerhed
Forretning Nyheds rapport Teknologier
Injective slår sig sammen med AltLayer for at give inEVM genskabende sikkerhed
Maj 3, 2024
Masa går sammen med Teller for at introducere MASA Lending Pool, muliggør USDC-lån på base
Markeder Nyheds rapport Teknologier
Masa går sammen med Teller for at introducere MASA Lending Pool, muliggør USDC-lån på base
Maj 3, 2024
Velodrome lancerer Superchain Beta-version i de kommende uger og udvider på tværs af OP Stack Layer 2 Blockchains
Markeder Nyheds rapport Teknologier
Velodrome lancerer Superchain Beta-version i de kommende uger og udvider på tværs af OP Stack Layer 2 Blockchains
Maj 3, 2024
CARV annoncerer partnerskab med Aethir for at decentralisere sit datalag og uddele belønninger
Forretning Nyheds rapport Teknologier
CARV annoncerer partnerskab med Aethir for at decentralisere sit datalag og uddele belønninger
Maj 3, 2024