Novinová správa Technológia
Januára 31, 2023

MusicLM: nový model umelej inteligencie pre prevod textu na hudbu a obrázok na hudbu od spoločnosti Google

Stručne

Google predstavuje MusicLM, model na generovanie hudby s vysokou vernosťou z textových popisov.

MusicLM môže byť podmienené textom aj melódiou tým, že dokáže premeniť pískané a bzučiace melódie podľa štýlu opísaného v textovom titulku.

Model môže vytvárať hudbu v rôznych žánroch vrátane klasiky, jazzu a rocku.

Google predstavuje MusicLM, model na vytváranie vernej hudby z textových popisov, ako napríklad „upokojujúca husľová melódia podporená skresleným gitarovým riffom“. MusicLM vrhá proces podmieneného generovania hudby ako hierarchickú úlohu modelovania medzi sekvenciami a generuje hudbu pri 24 kHz, ktorá zostáva konzistentná počas niekoľkých minút.

MusicLM: nový model umelej inteligencie pre prevod textu na hudbu a obrázok na hudbu od spoločnosti Google

Experimenty Google ukazujú, že MusicLM prekonáva predchádzajúce systémy, a to ako v kvalite zvuku, tak aj v dodržiavaní textového popisu. Okrem toho demonštruje, že MusicLM môže byť podmienený textom aj melódiou tým, že dokáže transformovať pískané a bzučiace melódie podľa štýlu opísaného v textovom titulku. Na podporu budúceho výskumu verejne vydávame MusicCaps, súbor údajov zložený z 5.5 XNUMX párov hudby a textu s popismi vo formáte RTF, ktoré poskytli odborníci na ľudí.

Súvisiaci článok: Text-to-3D: Google vyvinul neurónovú sieť, ktorá generuje 3D modely z textových popisov

Model MusicLM bol trénovaný na veľkom súbore hudobných partitúr, čo umožnilo AI naučiť sa štruktúru hudby. Model môže vytvárať hudbu v rôznych žánroch vrátane klasiky, jazzu a rocku. Model AI navyše dokáže vytvárať nové, originálne kompozície.

Model MusicLM je dôležitým vývojom v oblasti hudby generovanej AI. Model predstavuje výrazný pokrok oproti predchádzajúcim modelom, ktoré boli obmedzené na kratšie hudobné skladby alebo boli schopné generovať iba jednoduché melódie. Nový model otvára možnosť využitia AI na generovanie dlhých, zložitých hudobných skladieb, ktoré by sa dali použiť vo filmoch, videohrách alebo iných médiách.

Nový model AI dokáže generovať dlhú hudbu generácie do piatich minút.

Súvisiaci článok: Stable Diffusion môže vytvárať novú hudbu generovaním spektrogramov na základe textu

Model AI dokáže vytvárať hudbu pomocou titulkov z hier a filmov.

Okrem toho môže model AI generovať hudbu pomocou obrázkov ako vstupu.

Prečítajte si viac o AI v hudobnom priemysle:

Vylúčenie zodpovednosti

V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.

O autorovi

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Ďalšie články
Damir Yalalov
Damir Yalalov

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Hot Stories
Pridajte sa k nášmu newsletteru.
Novinky

Inštitucionálny apetít rastie smerom k bitcoinovým ETF uprostred volatility

Zverejnenia prostredníctvom podaní 13F odhaľujú pozoruhodných inštitucionálnych investorov, ktorí sa venujú bitcoinovým ETF, čo podčiarkuje rastúcu akceptáciu ...

vedieť viac

Prichádza deň odsúdenia: Osud CZ visí v rovnováhe, pretože americký súd zvažuje žalobu ministerstva spravodlivosti

Changpeng Zhao dnes čaká na americkom súde v Seattli odsúdenie.

vedieť viac
Pripojte sa k našej komunite inovatívnych technológií
Čítaj viac
Čítaj viac
Posun Donalda Trumpa ku kryptomenám: od oponenta k advokátovi a čo to znamená pre americký trh s kryptomenami
firmy trhy Príbehy a recenzie Technológia
Posun Donalda Trumpa ku kryptomenám: od oponenta k advokátovi a čo to znamená pre americký trh s kryptomenami
Môže 10, 2024
Layer3 na spustenie tokenu L3 toto leto, pričom komunite pridelí 51 % celkovej ponuky
trhy Novinová správa Technológia
Layer3 na spustenie tokenu L3 toto leto, pričom komunite pridelí 51 % celkovej ponuky
Môže 10, 2024
Posledné varovanie Edwarda Snowdena pre vývojárov bitcoínov: „Urobte zo súkromia prioritu na úrovni protokolu alebo riskujte jeho stratu
trhy zabezpečenia Wiki Softvér Príbehy a recenzie Technológia
Posledné varovanie Edwarda Snowdena pre vývojárov bitcoínov: „Urobte zo súkromia prioritu na úrovni protokolu alebo riskujte jeho stratu
Môže 10, 2024
Optimizmom poháňaná sieť Ethereum Layer 2 Mint spustí svoju hlavnú sieť 15. mája
Novinová správa Technológia
Optimizmom poháňaná sieť Ethereum Layer 2 Mint spustí svoju hlavnú sieť 15. mája
Môže 10, 2024
CRYPTOMERIA LABS PTE. LTD.