Naujienų ataskaita
Spalis 21, 2022

„Google AI“ paskelbė pirmąjį teksto į muziką generatorių AudioLM

Trumpai

AudioLM gali kurti muziką tiesiog klausydamasis garsų

Mubert AI tęs žmogaus kalbą ir fortepijono muziką

Su GPT-3 ir kiti, generatyvaus AI idėja turi gerą galimybę judėti į priekį. Taip pat atradome inpainting ir outpainting sąvokas; AI sumaniai užbaigia vaizdus išlaikant temą ir stilių. O kaip muzika?

Ir dar kartą! Kadangi visa tai pagrįsta AI kalbos modeliais, kurie išlaiko prasmę, buvo tik laiko klausimas, kada ši technologija bus pritaikyta muzikai. Ir dabar atėjo laikas.

„Google AI“ paskelbė pirmąjį teksto į muziką generatorių „AudioLM“.

Remiantis naujausiais „Google“ tyrimais, nauja garso kūrimo sistema, vadinama „AudioLM“, gali būti išmokyta sukurti tikrovišką kalbą ir fortepijoninę muziką tiesiog klausantis garsų. Dėl savo ilgalaikio nuoseklumo ir puikios ištikimybės AudioLM pranoksta ankstesnes sistemas ir patobulina garso kūrimą naudodama balso sintezės ir kompiuterinės muzikos programas.

Sukūrėme sistemą, skirtą atpažinti „AudioLM“ sukurtus sintetinius garsus, naudodami tas pačias dirbtinio intelekto koncepcijas, kuriomis buvo grindžiami ankstesni modeliai.

AudioLM iš „Google“ AI gali išplėsti akustinį praėjimą, išlaikydamas „ketinimą“. Nuo šiol jis buvo išmokytas tęsti žmogaus kalbą ir fortepijono muziką, remiantis ribotu įvesties duomenų pavyzdžiu. Patikrinkite toliau pateiktą pavyzdį.

Kalbos kriterijai buvo aiškūs: klausytojų buvo paprašyta įvertinti, ar tęsinys skamba kaip žmogaus kalba. Su muzika buvo nustatyta, kad įvedimui pateiktos sekcijos „tęsinys“ yra daug pranašesnis už visus dabartinius muzikos generatorius nuo nulio, pvz. „JukeBox“. Su pasiūlymu prie įvesties AI tęsia muziką žymiai geriau.

„Google AI“ paskelbė pirmąjį teksto į muziką generatorių „AudioLM“.

Vertintojai klausėsi garso pavyzdžių, kad patvirtintų rezultatus. Jie nustatė, ar jie girdi tikrą žmogaus balso tęsinį, kuris buvo įrašytas, ar dirbtinį balsą, sukurtą AudioLM. Jų duomenys rodo, kad sėkmės rodiklis yra 51.2%. Todėl paprastam klausytojui bus sunku atskirti „AudioLM“ sukurtą kalbą nuo tikrosios žmogaus kalbos.

Ar teksto į muziką technologija keičia muzikos verslą?

Teksto į muziką generatorius, pagrįstas Mubert API neseniai paskelbė kitas AI modelis Mubertas. Mubertas sukuria skirtingą garsų rinkinį kiekvienai jūsų siunčiamai užklausai. Pasikartojimo tikimybė tikrai nedidelė. Muzika kuriama, kai pateikiamas prašymas; jis nėra paimtas iš baigtų melodijų duomenų bazės. Kaip tikrai generatyvi ši muzika yra dažnas klausimas.

Ar teksto į muziką technologija keičia muzikos verslą?

Garsai parenkami prieš juos sukuriant. Tiek įvesties raginimas, tiek Mubert API žymos yra užkoduotos transformatoriaus neuroninio tinklo latentiniame erdvės vektoriuje. Tada parenkamas artimiausias kiekvienos užklausos žymų vektorius, o pridedamos žymos perduodamos į mūsų API, kad būtų sukurta muzika. Joks neuroninis tinklas nebuvo naudojamas jokiam garsui sukonstruoti (atskiros kilpos bosams, laidams ir kt.); visus garsus gamino muzikantai ir garso dizaineriai.

Kitas svarbus Muberto žingsnis – paimti daiktus iš dabartinio pasaulio, pavyzdžiui, nuotraukas, filmus, scenarijus ir pristatymus, ir sukurti aplinkinio pasaulio muziką.

Štai ką galite gauti beatodairiškai įdėję tekstinius raginimus į miuziklo Mubert AI burną:

Tai yra pradinis sudėtingesnio ir tikslesnio generavimo algoritmo kūrimo proceso etapas, tačiau tai pareikalaus laiko ir pinigų.

Tačiau teksto į muziką technologija jau pasiekiama, todėl galite generuoti albumus masiškai, išjungę „įvesties raginimą“ į „rašyti atsitiktinį raginimo scenarijų“. Atrodo, kad menininkai nebereikalingi.

Skaitykite daugiau susijusių naujienų:

Atsakomybės neigimas

Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.

Apie autorių

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Daugiau straipsnių
Damiras Jalalovas
Damiras Jalalovas

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Institucinis apetitas Bitcoin ETF atžvilgiu auga dėl nepastovumo

13F paraiškų atskleidimas atskleidžia žymius institucinius investuotojus, kurie naudojasi Bitcoin ETF, o tai rodo, kad vis labiau pritariama...

Žinoti daugiau

Ateina nuosprendžio paskelbimo diena: CZ likimas subalansuotas, nes JAV teismas svarsto DOJ prašymą

Changpeng Zhao šiandien laukia nuosprendžio JAV teisme Sietle.

Žinoti daugiau
Prisijunkite prie mūsų naujoviškų technologijų bendruomenės
Skaityti daugiau
Skaityti daugiau
Injective sujungia jėgas su AltLayer, kad padidintų inEVM saugumą
Atsakingas verslas Naujienų ataskaita Technologija
Injective sujungia jėgas su AltLayer, kad padidintų inEVM saugumą
Gali 3, 2024
„Masa“ bendradarbiauja su „Teller“, kad pristatytų MASA skolinimo fondą, leidžiantį skolintis USDC pagrindu
rinkos Naujienų ataskaita Technologija
„Masa“ bendradarbiauja su „Teller“, kad pristatytų MASA skolinimo fondą, leidžiantį skolintis USDC pagrindu
Gali 3, 2024
„Velodrome“ ateinančiomis savaitėmis pristato „Superchain“ beta versiją ir išplečiama visose „OP Stack Layer 2 Blockchains“
rinkos Naujienų ataskaita Technologija
„Velodrome“ ateinančiomis savaitėmis pristato „Superchain“ beta versiją ir išplečiama visose „OP Stack Layer 2 Blockchains“
Gali 3, 2024
CARV praneša apie partnerystę su Aethir, kad decentralizuotų savo duomenų sluoksnį ir paskirstytų atlygį
Atsakingas verslas Naujienų ataskaita Technologija
CARV praneša apie partnerystę su Aethir, kad decentralizuotų savo duomenų sluoksnį ir paskirstytų atlygį
Gali 3, 2024
CRYPTOMERIA LABS PTE. LTD.