„Google AI“ paskelbė pirmąjį teksto į muziką generatorių AudioLM
Trumpai
AudioLM gali kurti muziką tiesiog klausydamasis garsų
Mubert AI tęs žmogaus kalbą ir fortepijono muziką
Su GPT-3 ir kiti, generatyvaus AI idėja turi gerą galimybę judėti į priekį. Taip pat atradome inpainting ir outpainting sąvokas; AI sumaniai užbaigia vaizdus išlaikant temą ir stilių. O kaip muzika?
Ir dar kartą! Kadangi visa tai pagrįsta AI kalbos modeliais, kurie išlaiko prasmę, buvo tik laiko klausimas, kada ši technologija bus pritaikyta muzikai. Ir dabar atėjo laikas.
Remiantis naujausiais „Google“ tyrimais, nauja garso kūrimo sistema, vadinama „AudioLM“, gali būti išmokyta sukurti tikrovišką kalbą ir fortepijoninę muziką tiesiog klausantis garsų. Dėl savo ilgalaikio nuoseklumo ir puikios ištikimybės AudioLM pranoksta ankstesnes sistemas ir patobulina garso kūrimą naudodama balso sintezės ir kompiuterinės muzikos programas.
AudioLM iš „Google“ AI gali išplėsti akustinį praėjimą, išlaikydamas „ketinimą“. Nuo šiol jis buvo išmokytas tęsti žmogaus kalbą ir fortepijono muziką, remiantis ribotu įvesties duomenų pavyzdžiu. Patikrinkite toliau pateiktą pavyzdį.
Kalbos kriterijai buvo aiškūs: klausytojų buvo paprašyta įvertinti, ar tęsinys skamba kaip žmogaus kalba. Su muzika buvo nustatyta, kad įvedimui pateiktos sekcijos „tęsinys“ yra daug pranašesnis už visus dabartinius muzikos generatorius nuo nulio, pvz. „JukeBox“. Su pasiūlymu prie įvesties AI tęsia muziką žymiai geriau.
Vertintojai klausėsi garso pavyzdžių, kad patvirtintų rezultatus. Jie nustatė, ar jie girdi tikrą žmogaus balso tęsinį, kuris buvo įrašytas, ar dirbtinį balsą, sukurtą AudioLM. Jų duomenys rodo, kad sėkmės rodiklis yra 51.2%. Todėl paprastam klausytojui bus sunku atskirti „AudioLM“ sukurtą kalbą nuo tikrosios žmogaus kalbos.
Ar teksto į muziką technologija keičia muzikos verslą?
Teksto į muziką generatorius, pagrįstas Mubert API neseniai paskelbė kitas AI modelis Mubertas. Mubertas sukuria skirtingą garsų rinkinį kiekvienai jūsų siunčiamai užklausai. Pasikartojimo tikimybė tikrai nedidelė. Muzika kuriama, kai pateikiamas prašymas; jis nėra paimtas iš baigtų melodijų duomenų bazės. Kaip tikrai generatyvi ši muzika yra dažnas klausimas.
Garsai parenkami prieš juos sukuriant. Tiek įvesties raginimas, tiek Mubert API žymos yra užkoduotos transformatoriaus neuroninio tinklo latentiniame erdvės vektoriuje. Tada parenkamas artimiausias kiekvienos užklausos žymų vektorius, o pridedamos žymos perduodamos į mūsų API, kad būtų sukurta muzika. Joks neuroninis tinklas nebuvo naudojamas jokiam garsui sukonstruoti (atskiros kilpos bosams, laidams ir kt.); visus garsus gamino muzikantai ir garso dizaineriai.
Kitas svarbus Muberto žingsnis – paimti daiktus iš dabartinio pasaulio, pavyzdžiui, nuotraukas, filmus, scenarijus ir pristatymus, ir sukurti aplinkinio pasaulio muziką.
Štai ką galite gauti beatodairiškai įdėję tekstinius raginimus į miuziklo Mubert AI burną:
Tai yra pradinis sudėtingesnio ir tikslesnio generavimo algoritmo kūrimo proceso etapas, tačiau tai pareikalaus laiko ir pinigų.
Tačiau teksto į muziką technologija jau pasiekiama, todėl galite generuoti albumus masiškai, išjungę „įvesties raginimą“ į „rašyti atsitiktinį raginimo scenarijų“. Atrodo, kad menininkai nebereikalingi.
Skaitykite daugiau susijusių naujienų:
Atsakomybės neigimas
Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.
Apie autorių
Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže.
Daugiau straipsniųDamiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže.