Naujienų ataskaita Technologija
Sausis 31, 2023

MusicLM: naujas „Google“ sukurtas „teksto į muziką“ ir „vaizdo į muziką“ AI modelis

Trumpai

„Google“ pristato „MusicLM“ – modelį, leidžiantį generuoti aukštos kokybės muziką iš tekstinių aprašymų.

„MusicLM“ gali būti priklausomas nuo teksto ir melodijos, nes jis gali pakeisti švilpiamas ir niūniuojamas melodijas pagal stilių, aprašytą teksto antraštėje.

Modelis gali generuoti muziką įvairiuose žanruose, įskaitant klasiką, džiazą ir roką.

„Google“ pristato „MusicLM“ – modelį, skirtą sukurti aukštos kokybės muziką iš teksto aprašymų, tokių kaip „ramina smuiko melodija, paremta iškreiptu gitaros rifu“. „MusicLM“ sąlyginės muzikos generavimo procesą pateikia kaip hierarchinę sekos į seką modeliavimo užduotį ir generuoja muziką 24 kHz dažniu, kuri išlieka pastovi kelias minutes.

MusicLM: naujas „Google“ sukurtas „teksto į muziką“ ir „vaizdo į muziką“ AI modelis

Google eksperimentai rodo, kad MusicLM lenkia ankstesnes sistemas tiek garso kokybe, tiek teksto aprašymo laikymusi. Be to, tai parodo, kad „MusicLM“ gali būti priklausomas nuo teksto ir melodijos, nes jis gali pakeisti švilpiamas ir niūniuojamas melodijas pagal stilių, aprašytą teksto antraštėje. Siekdami paremti būsimus tyrimus, viešai išleidžiame „MusicCaps“ – duomenų rinkinį, sudarytą iš 5.5 XNUMX muzikos ir teksto porų su raiškiojo teksto aprašymais, kuriuos pateikė žmonių ekspertai.

Susijęs straipsnis: Tekstas į 3D: „Google“ sukūrė neuroninį tinklą, kuris generuoja 3D modelius iš teksto aprašymų

„MusicLM“ modelis buvo parengtas naudojant didelį muzikos natų korpusą, o tai leido AI išmokti muzikos struktūrą. Modelis gali generuoti muziką įvairiuose žanruose, įskaitant klasiką, džiazą ir roką. Be to, dirbtinio intelekto modelis gali sukurti naujas, originalias kompozicijas.

„MusicLM“ modelis yra svarbi plėtra dirbtinio intelekto sukurtos muzikos srityje. Šis modelis yra reikšmingas pažanga, palyginti su ankstesniais modeliais, kurie buvo apriboti trumpesniais muzikos kūriniais arba galinčiais generuoti tik paprastas melodijas. Naujasis modelis atveria galimybę naudoti dirbtinį intelektą kuriant ilgus, sudėtingus muzikos kūrinius, kurie gali būti naudojami filmuose, vaizdo žaidimuose ar kitoje medijoje.

Naujasis AI modelis gali generuoti ilgą muziką kartoms iki penkių minučių.

Susijęs straipsnis: Stable Diffusion gali kurti naują muziką generuodamas spektrogramas pagal tekstą

AI modelis gali kurti muziką naudojant antraštes iš žaidimų ir filmų.

Be to, AI modelis gali generuoti muziką naudodamas vaizdus kaip įvestį.

Skaitykite daugiau apie AI muzikos pramonėje:

Atsakomybės neigimas

Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.

Apie autorių

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Daugiau straipsnių
Damiras Jalalovas
Damiras Jalalovas

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Hot Stories
Prisijunkite prie mūsų naujienlaiškio.
Paskutinės naujienos

„DOGE Frenzy“: „Dogecoin“ (DOGE) pastarojo meto vertės padidėjimo analizė

Kriptovaliutų pramonė sparčiai plečiasi, o memų monetos ruošiasi reikšmingam pakilimui. Dogecoin (DOGE), ...

Žinoti daugiau

Dirbtinio intelekto sukurto turinio raida metaverse

Generatyvaus dirbtinio intelekto turinio atsiradimas yra vienas įspūdingiausių įvykių virtualioje aplinkoje...

Žinoti daugiau
Prisijunkite prie mūsų naujoviškų technologijų bendruomenės
Skaityti daugiau
Skaityti daugiau
Šios savaitės geriausi pasiūlymai, didelės investicijos į AI, IT, Web3ir kriptovaliuta (22–26.04)
Virškinimas Atsakingas verslas rinkos Technologija
Šios savaitės geriausi pasiūlymai, didelės investicijos į AI, IT, Web3ir kriptovaliuta (22–26.04)
Balandis 26, 2024
Vitalikas Buterinas komentuoja belaisvių centralizavimą, pažymi, kad tai buvo laikinas etapas iki PoS
Naujienų ataskaita Technologija
Vitalikas Buterinas komentuoja belaisvių centralizavimą, pažymi, kad tai buvo laikinas etapas iki PoS
Balandis 26, 2024
„Offchain Labs“ atskleidė dvi svarbias „Optimism OP Stack“ sukčiavimo įrodymų spragas
Naujienų ataskaita programinė įranga Technologija
„Offchain Labs“ atskleidė dvi svarbias „Optimism OP Stack“ sukčiavimo įrodymų spragas
Balandis 26, 2024
„Dymension“ atvira rinka, skirta likvidumui perjungti iš „RollApps eIBC“ paleidžiama „Mainnet“
Naujienų ataskaita Technologija
„Dymension“ atvira rinka, skirta likvidumui perjungti iš „RollApps eIBC“ paleidžiama „Mainnet“ 
Balandis 26, 2024
CRYPTOMERIA LABS PTE. LTD.