Google AI paziņoja par pirmo teksta-mūzikas ģeneratoru AudioLM
Īsumā
AudioLM var radīt mūziku, vienkārši klausoties skaņas
Mubert AI turpināt cilvēka runu un klaviermūziku
ar GPT-3 un citiem, idejai par ģeneratīvo AI ir labas izredzes virzīties uz priekšu. Mēs atklājām arī inpainting un outpainting jēdzienus; AI prasmīgi papildina attēlus, vienlaikus saglabājot motīvu un stilu. Kā ar mūziku?
Un vēl atkal! Tā kā tas viss ir balstīts uz AI valodas modeļiem, kas saglabā nozīmi, tas bija tikai laika jautājums, kad šī tehnoloģija tiks piemērota mūzikā. Un tagad ir pienācis laiks.
Saskaņā ar jaunākajiem Google pētījumiem jaunu audio producēšanas sistēmu AudioLM var iemācīt radīt reālistisku runu un klaviermūziku, vienkārši klausoties skaņas. Pateicoties savai ilgstošai konsekvencei un lieliskajai precizitātei, AudioLM pārspēj iepriekšējās sistēmas un uzlabo audio izveidi, izmantojot balss sintēzes un datorizētas mūzikas lietojumprogrammas.
AudioLM no Google AI var paplašināt akustisko eju, vienlaikus saglabājot "nodomu". Šobrīd tas ir apmācīts turpināt cilvēka runu un klaviermūziku, pamatojoties uz ierobežotu ievades datu paraugu. Pārbaudiet tālāk redzamo paraugu.
Runas kritēriji bija vienkārši: klausītājiem tika lūgts novērtēt, vai turpinājums izklausās pēc cilvēka runas. Ar mūziku tika atklāts, ka ievadei piegādātās sadaļas “turpinājums” kvalitātē ir daudz labāks par visiem pašreizējiem mūzikas ģeneratoriem no nulles, piemēram, JukeBox. Ar ieteikumu ieejā AI turpina mūziku ievērojami labāk.
Cilvēku vērtētāji klausījās audio paraugus, lai apstiprinātu rezultātus. Viņi noteica, vai viņi dzird reālu cilvēka balss turpinājumu, kas bija ierakstīts, vai mākslīgu balsi, ko radījis AudioLM. Viņu dati liecina par 51.2% panākumu līmeni. Rezultātā vidusmēra klausītājam būs grūti atšķirt AudioLM radīto runu no faktiskās cilvēka runas.
Vai teksta pārvēršanas mūzikā tehnoloģija maina mūzikas biznesu?
Teksta pārveides mūzika ģenerators, kura pamatā ir Mubert API nesen paziņoja cits AI modelis Muberts. Muberts katram jūsu nosūtītajam pieprasījumam izveido atšķirīgu skaņu kopu. Atkārtošanās iespējamība ir ļoti maza. Mūzika tiek radīta, kad tiek izteikts pieprasījums; tas nav izvilkts no gatavo melodiju datu bāzes. Cik patiesi radoša šī mūzika ir izplatīts jautājums.
Skaņas tiek izvēlētas pirms radīšanas. Gan ievades uzvedne, gan Mubert API tagi ir kodēti transformatora neironu tīkla latentā telpas vektorā. Pēc tam katram vaicājumam tiek izvēlēts tuvākais tagu vektors, un pievienotie tagi tiek pārsūtīti uz mūsu API, lai izveidotu mūziku. Neironu tīkls netika izmantots, lai izveidotu nevienu no skaņām (atsevišķas cilpas basam, vadiem utt.); visas skaņas producēja mūziķi un skaņu dizaineri.
Nākamais nozīmīgais Muberta solis ir paņemt priekšmetus no pašreizējās pasaules, piemēram, fotogrāfijas, filmas, scenārijus un prezentācijas, un radīt apkārtējās pasaules mūziku.
Lūk, ko jūs varat iegūt, neapdomīgi ievietojot teksta uzvednes mūzikla Mubert AI mutē:
Šis ir sākuma posms sarežģītāka un precīzāka ģenerēšanas algoritma izveides procesā, taču tas prasīs laiku un naudu.
Tomēr teksta pārveides mūzika jau ir pieejama, tāpēc varat ģenerēt albumus lielapjomā, izslēdzot “ievades uzvedni” uz “rakstīt nejaušu uzvednes skriptu”. Šķiet, ka mākslinieki vairs nav vajadzīgi.
Lasiet vairāk saistīto ziņu:
Atbildības noraidīšana
Atbilstīgi Uzticības projekta vadlīnijas, lūdzu, ņemiet vērā, ka šajā lapā sniegtā informācija nav paredzēta un to nedrīkst interpretēt kā juridisku, nodokļu, ieguldījumu, finanšu vai jebkāda cita veida padomu. Ir svarīgi ieguldīt tikai to, ko varat atļauties zaudēt, un meklēt neatkarīgu finanšu padomu, ja jums ir šaubas. Lai iegūtu papildinformāciju, iesakām skatīt pakalpojumu sniegšanas noteikumus, kā arī palīdzības un atbalsta lapas, ko nodrošina izdevējs vai reklāmdevējs. MetaversePost ir apņēmies sniegt precīzus, objektīvus pārskatus, taču tirgus apstākļi var tikt mainīti bez iepriekšēja brīdinājuma.
Par Autors
Damirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē.
Vairāk rakstusDamirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē.