Ziņojums Tehnoloģija
Februāris 15, 2023

Dziesma: Google AI pētnieki atrod veidu, kā radīt mūziku ievades vokāla pavadīšanai

Īsumā

Jaunā sistēma ar nosaukumu SingSong izmanto dziļu mācību modelis lai radītu mūziku, kas ir vairāk sinhronizēta ar dziedāšanu nekā esošās sistēmas.

Pētnieki saka, ka sistēmu varētu izmantot, lai izveidotu karaoke ierakstus profesionāliem dziedātājiem vai palīdzētu dziedātājiem amatieru atrast viņu balsīm atbilstošu pavadījumu.

Google pētnieki ir atraduši veidu, kā izmantot mākslīgo intelektu, lai radītu mūziku, kas ir saderīga ar dziedāšanu. Jaunā sistēma, ko sauc par SingSong, izmanto dziļas mācīšanās modeli, lai radītu pavadījumu, kas ir vairāk sinhronizēts ar dziedāšanu nekā citas esošās sistēmas. Pētnieki saka, ka sistēmu varētu izmantot, lai izveidotu karaoke celiņus profesionāliem dziedātājiem vai palīdzētu amatieru dziedātājiem atrast pavadījumu, kas labāk atbilst viņu balsij.

Karaoke otrādi: AI pētnieki atrod veidu, kā radīt mūziku dziedāšanai
Iepriekšējās pavadījuma ģenerēšanas sistēmas ir balstījušās uz algoritmiem, kas cenšas saskaņot dziedāšanas laiku un augstumu.

Dziedāt dziesmu ir Google izstrādāta sistēma, kas rada instrumentālu mūziku ievades vokāla pavadīšanai. Tas var sniegt gan mūziķiem, gan nemūziķiem vienkāršu jaunu pieeju mūzikas veidošanai, kurā ir viņu pašu balsis. Lai to panāktu, izstrādātāji izmanto jaunākos sasniegumus mūzikas avotu atdalīšanas un audio producēšanas jomā. Izstrādātāji īpaši izmanto visprogresīvāko avotu atdalīšanas metodi, lai izveidotu saskaņotus vokālo un instrumentālo avotu pārus no milzīga mūzikas ierakstu korpusa. Pēc tam izstrādātāji veic izmaiņas AudioLM, visprogresīvākā metode beznosacījumu audio producēšanai, lai to varētu apmācīt no avota atdalītiem (vokāla, instrumentāla) pāriem nosacīti “audio-audio” ģenerēšanas uzdevumiem.

Ieteicamā ziņa: 5 populārākie mākslīgā intelekta mūzikas un audio ģeneratori, kas rada bezatlīdzības ierakstus

AI pētnieki pēta dažādas balss ievades funkcijas, no kurām labākā izolēta vokāla kvantitatīvo veiktspēju uzlabo par 53%, salīdzinot ar noklusējuma AudioLM funkciju, lai uzlabotu sistēmas vispārināšanu no avota atdalītiem apmācības datiem (ja vokāls satur vokāla artefaktus instrumentāls) uz izolētu vokālu, ko izstrādātāji varētu sagaidīt no lietotājiem. Klausītāji izrādīja būtisku priekšroku SingSong radītajiem instrumentāliem, nevis tiem, kas iegūti no spēcīgas izguves bāzes līnijas, salīdzinot pārus ar vienādām balss ievadēm.

Turpretim jaunā sistēma izmanto a dziļās mācīšanās modelis kas ir apmācīts par lielu mūzikas datu kopu. Tas ļauj sistēmai ģenerēt pavadījumu, kas ir sinhronizēts ar dziedātāja balsi un laiku.

Pētījumam klausītājiem tiek doti divi 10 sekunžu vokāli instrumentālie maisījumi, kuros balsis (ņemtas no MUSDB18 testa) ir vienādas, savukārt instrumentālie materiāli atšķiras un nāk no dažādiem avotiem (patiesība, google modeļivai bāzes līnijas). Jautājums liek klausītājiem izvēlēties, kura no abām kombinācijām, viņuprāt, instrumentālā aizmugure muzikāli atbilst vokālam.

Ieteicamā ziņa: 7 populārākie AI balss ģeneratori un balss klonēšana teksta pārveidošanai runā

SingSong svaigi piemēri

Izmantojot virkni dziļu neironu tīklu un ģeneratīvie modeļi, izstrādātāji spēj radīt harmoniskus pavadījumus bez latentuma garākiem segmentiem.

Iepriekšējos piemēros tika izmantotas MUSDB18 datu kopas profesionālās balsis. Mūs interesē arī SingSong spēja atbalstīt un dot iespēju ikvienam radīt mūziku ar savu balsi. Šeit mēs to pārbaudām, izmantojot Vocadito datu kopas vokālos paraugus, kas ietver amatieru vokālistu ierakstus, kas veikti plaša patēriņa elektronikā.

Sistēma joprojām ir attīstības sākuma stadijā. Lai gan pētnieki saka, ka tas būs jāuzlabo, pirms to varēs izmantot komerciāli, viņi uzskata, ka tas var revolucionizēt karaoke nozari un palīdzēt amatieru dziedātājiem atrast viņiem piemērotu pavadījumu.

Lasiet vairāk saistītos rakstus:

Atbildības noraidīšana

Atbilstīgi Uzticības projekta vadlīnijas, lūdzu, ņemiet vērā, ka šajā lapā sniegtā informācija nav paredzēta un to nedrīkst interpretēt kā juridisku, nodokļu, ieguldījumu, finanšu vai jebkāda cita veida padomu. Ir svarīgi ieguldīt tikai to, ko varat atļauties zaudēt, un meklēt neatkarīgu finanšu padomu, ja jums ir šaubas. Lai iegūtu papildinformāciju, iesakām skatīt pakalpojumu sniegšanas noteikumus, kā arī palīdzības un atbalsta lapas, ko nodrošina izdevējs vai reklāmdevējs. MetaversePost ir apņēmies sniegt precīzus, objektīvus pārskatus, taču tirgus apstākļi var tikt mainīti bez iepriekšēja brīdinājuma.

Par Autors

Damirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē. 

Vairāk rakstus
Damirs Jalalovs
Damirs Jalalovs

Damirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē. 

Hot Stories
Pievienojieties mūsu informatīvajam izdevumam.
Jaunākās ziņas

Nepastāvības apstākļos institucionālā apetīte pieaug pret Bitcoin ETF

Informācijas atklāšana, izmantojot 13F pieteikumus, atklāj ievērojamus institucionālos investorus, kas iesaistās Bitcoin ETF, uzsverot pieaugošo pieņemšanu ...

Uzziniet vairāk

Pienāk notiesāšanas diena: CZ liktenis ir līdzsvarā, jo ASV tiesa izskata DOJ lūgumu

Šodien ASV tiesā Sietlā Čanpens Džao ir gatavs notiesāt.

Uzziniet vairāk
Pievienojieties mūsu novatoriskajai tehnoloģiju kopienai
Lasīt vairāk
Vairāk
Injective apvieno spēkus ar AltLayer, lai nodrošinātu atkārtotu inEVM drošību
bizness Ziņojums Tehnoloģija
Injective apvieno spēkus ar AltLayer, lai nodrošinātu atkārtotu inEVM drošību
3. gada 2024. maijs
Masa sadarbojas ar Teller, lai ieviestu MASA aizdevumu fondu, ļaujot USDC aizņemties bāzē
Markets Ziņojums Tehnoloģija
Masa sadarbojas ar Teller, lai ieviestu MASA aizdevumu fondu, ļaujot USDC aizņemties bāzē
3. gada 2024. maijs
Velodrome nākamajās nedēļās izlaiž Superchain Beta versiju un izvēršas visās OP Stack Layer 2 blokķēdes
Markets Ziņojums Tehnoloģija
Velodrome nākamajās nedēļās izlaiž Superchain Beta versiju un izvēršas visās OP Stack Layer 2 blokķēdes
3. gada 2024. maijs
CARV paziņo par sadarbību ar Aethir, lai decentralizētu savu datu slāni un sadalītu atlīdzības
bizness Ziņojums Tehnoloģija
CARV paziņo par sadarbību ar Aethir, lai decentralizētu savu datu slāni un sadalītu atlīdzības
3. gada 2024. maijs
CRYPTOMERIA LABS PTE. LTD.