Nyheds rapport Teknologier
Februar 15, 2023

SingSong: Google AI-forskere finder en måde at generere musik til at akkompagnere inputvokaler

Kort sagt

Det nye system kaldet SingSong bruger en dyb læringsmodel at generere musik, der er mere synkroniseret med sang end eksisterende systemer.

Forskerne siger, at systemet kunne bruges til at skabe karaoke-numre til professionelle sangere eller til at hjælpe amatørsangere med at finde akkompagnement, der matcher deres stemmer.

Forskere hos Google har fundet en måde at bruge kunstig intelligens til at generere musik, der er kompatibel med sang. Det nye system, kaldet SingSong, bruger en dyb læringsmodel til at generere akkompagnement, der er mere synkroniseret med sang end andre eksisterende systemer. Forskerne siger, at systemet kunne bruges til at skabe karaoke-numre til professionelle sangere eller til at hjælpe amatørsangere med at finde akkompagnement, der passer bedre til deres stemmer.

Karaoke omvendt: AI-forskere finder en måde at generere musik til at synge på
Tidligere systemer til at generere akkompagnement har været afhængige af algoritmer, der forsøger at matche timingen og tonehøjden for sangen.

Syng sang er et system udviklet af Google, der skaber instrumental musik til at akkompagnere inputvokal. Det kan give både musikere og ikke-musikere en enkel ny tilgang til at lave musik med deres egne stemmer. Udviklere bygger videre på de seneste fremskridt inden for musikalsk kildeadskillelse og lydproduktion for at opnå dette. Udviklere bruger specifikt en banebrydende kildeadskillelsesmetode til at bygge afstemte vokale og instrumentale kildepar fra et massivt korpus af musikoptagelser. Derefter ændrer udviklere AudioLM, en banebrydende metode til ubetinget lydproduktion, så den kan trænes i kildeseparerede (vokale, instrumentale) par til betingede "lyd-til-lyd"-genereringsopgaver.

Anbefalet indlæg: Top 5 AI-musik- og lydgeneratorer til at skabe royaltyfrie numre

AI-forskere undersøger forskellige funktioner i vokalinput, hvoraf det bedste forbedrer den kvantitative ydeevne på isolerede vokaler med 53 % sammenlignet med standard AudioLM-funktioner, for at forbedre systemets generalisering fra kildeseparerede træningsdata (hvor vokalerne indeholder artefakter af instrumental) til isolerede vokaler, som udviklere kan forvente af brugere. Lytterne udviste en væsentlig præference for instrumentaler produceret af SingSong frem for dem fra en stærk genfindingsbaseline i en parvis sammenligning med de samme stemmeinput.

Det nye system bruger derimod en dyb læringsmodel der er blevet trænet på et stort datasæt af musik. Dette gør det muligt for systemet at generere akkompagnement, der er synkroniseret med sangerens stemme og timing.

Til undersøgelsen får lytterne to 10-sekunders vokal-instrumentale mashups, hvor stemmerne (taget fra MUSDB18-testen) er de samme, mens instrumentalerne er forskellige og kommer fra forskellige kilder (grundsandhed, google modeller, eller basislinjer). Spørgsmålet beder lytterne om at vælge, hvilken af ​​de to kombinationer, de føler, at den instrumentale baggrund passer mere musikalsk til vokalen.

Anbefalet indlæg: Top 7 AI-stemmegeneratorer og stemmekloning til tekst-til-tale

SingSongs friske eksempler

Ved at bruge en række dybe neurale netværk og generative modeller, er udviklere i stand til at producere harmoniske akkompagnementer uden latens for længere segmenter.

MUSDB18-datasættets professionelle stemmer blev brugt i de foregående eksempler. Vi er også fascineret af SingSongs evne til at støtte og gøre det muligt for enhver at skabe musik med deres stemme. Her undersøger vi dette ved hjælp af stemmeprøver fra Vocadito-datasættet, som inkluderer optagelser af amatørvokalister lavet på forbrugerelektronik.

Systemet er stadig i de tidlige udviklingsstadier. Mens forskerne siger, at det skal forbedres, før det kan bruges kommercielt, mener de, at det har potentialet til at revolutionere karaokeindustrien og hjælpe amatørsangere med at finde akkompagnement, der fungerer godt for dem.

Læs flere relaterede artikler:

Ansvarsfraskrivelse

I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.

Om forfatteren

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Flere artikler
Damir Yalalov
Damir Yalalov

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Hot Stories
Tilmeld dig vores nyhedsbrev.
Seneste Nyheder

Institutionel appetit vokser mod Bitcoin ETF'er midt i volatilitet

Afsløringer gennem 13F-arkivering afslører bemærkelsesværdige institutionelle investorer, der dytter i Bitcoin ETF'er, hvilket understreger en voksende accept af ...

Vide mere

Straffeudmålingsdagen ankommer: CZ's skæbne hænger i balance, da amerikansk domstol overvejer DOJ's anbringende

Changpeng Zhao står klar til at blive dømt ved en amerikansk domstol i Seattle i dag.

Vide mere
Tilmeld dig vores innovative teknologifællesskab
Læs mere
Læs mere
Injective slår sig sammen med AltLayer for at give inEVM genskabende sikkerhed
Forretning Nyheds rapport Teknologier
Injective slår sig sammen med AltLayer for at give inEVM genskabende sikkerhed
Maj 3, 2024
Masa går sammen med Teller for at introducere MASA Lending Pool, muliggør USDC-lån på base
Markeder Nyheds rapport Teknologier
Masa går sammen med Teller for at introducere MASA Lending Pool, muliggør USDC-lån på base
Maj 3, 2024
Velodrome lancerer Superchain Beta-version i de kommende uger og udvider på tværs af OP Stack Layer 2 Blockchains
Markeder Nyheds rapport Teknologier
Velodrome lancerer Superchain Beta-version i de kommende uger og udvider på tværs af OP Stack Layer 2 Blockchains
Maj 3, 2024
CARV annoncerer partnerskab med Aethir for at decentralisere sit datalag og uddele belønninger
Forretning Nyheds rapport Teknologier
CARV annoncerer partnerskab med Aethir for at decentralisere sit datalag og uddele belønninger
Maj 3, 2024