Novinová správa Technológia
Januára 31, 2023

MusicLM: nový model umelej inteligencie pre prevod textu na hudbu a obrázok na hudbu od spoločnosti Google

Stručne

Google predstavuje MusicLM, model na generovanie hudby s vysokou vernosťou z textových popisov.

MusicLM môže byť podmienené textom aj melódiou tým, že dokáže premeniť pískané a bzučiace melódie podľa štýlu opísaného v textovom titulku.

Model môže vytvárať hudbu v rôznych žánroch vrátane klasiky, jazzu a rocku.

Google predstavuje MusicLM, model na vytváranie vernej hudby z textových popisov, ako napríklad „upokojujúca husľová melódia podporená skresleným gitarovým riffom“. MusicLM vrhá proces podmieneného generovania hudby ako hierarchickú úlohu modelovania medzi sekvenciami a generuje hudbu pri 24 kHz, ktorá zostáva konzistentná počas niekoľkých minút.

MusicLM: nový model umelej inteligencie pre prevod textu na hudbu a obrázok na hudbu od spoločnosti Google

Experimenty Google ukazujú, že MusicLM prekonáva predchádzajúce systémy, a to ako v kvalite zvuku, tak aj v dodržiavaní textového popisu. Okrem toho demonštruje, že MusicLM môže byť podmienený textom aj melódiou tým, že dokáže transformovať pískané a bzučiace melódie podľa štýlu opísaného v textovom titulku. Na podporu budúceho výskumu verejne vydávame MusicCaps, súbor údajov zložený z 5.5 XNUMX párov hudby a textu s popismi vo formáte RTF, ktoré poskytli odborníci na ľudí.

Súvisiaci článok: Text-to-3D: Google vyvinul neurónovú sieť, ktorá generuje 3D modely z textových popisov

Model MusicLM bol trénovaný na veľkom súbore hudobných partitúr, čo umožnilo AI naučiť sa štruktúru hudby. Model môže vytvárať hudbu v rôznych žánroch vrátane klasiky, jazzu a rocku. Model AI navyše dokáže vytvárať nové, originálne kompozície.

Model MusicLM je dôležitým vývojom v oblasti hudby generovanej AI. Model predstavuje výrazný pokrok oproti predchádzajúcim modelom, ktoré boli obmedzené na kratšie hudobné skladby alebo boli schopné generovať iba jednoduché melódie. Nový model otvára možnosť využitia AI na generovanie dlhých, zložitých hudobných skladieb, ktoré by sa dali použiť vo filmoch, videohrách alebo iných médiách.

Nový model AI dokáže generovať dlhú hudbu generácie do piatich minút.

Súvisiaci článok: Stable Diffusion môže vytvárať novú hudbu generovaním spektrogramov na základe textu

Model AI dokáže vytvárať hudbu pomocou titulkov z hier a filmov.

Okrem toho môže model AI generovať hudbu pomocou obrázkov ako vstupu.

Prečítajte si viac o AI v hudobnom priemysle:

Vylúčenie zodpovednosti

V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.

O autorovi

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Ďalšie články
Damir Yalalov
Damir Yalalov

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Hot Stories
Pridajte sa k nášmu newsletteru.
Novinky

DOGE Frenzy: Analýza nedávneho nárastu hodnoty dogecoinu (DOGE).

Odvetvie kryptomien sa rýchlo rozširuje a meme coiny sa pripravujú na výrazný vzostup. Dogecoin (DOGE),...

vedieť viac

Vývoj obsahu generovaného AI v Metaverse

Vznik generatívneho obsahu AI je jedným z najfascinujúcejších objavov vo virtuálnom prostredí...

vedieť viac
Pripojte sa k našej komunite inovatívnych technológií
Čítaj viac
Čítaj viac
Najlepšie ponuky tohto týždňa, hlavné investície do AI, IT, Web3a kryptomeny (22-26.04)
výťah firmy trhy Technológia
Najlepšie ponuky tohto týždňa, hlavné investície do AI, IT, Web3a kryptomeny (22-26.04)
Apríla 26, 2024
Vitalik Buterin komentuje centralizáciu PoW a poznamenáva, že to bolo dočasné štádium až do PoS
Novinová správa Technológia
Vitalik Buterin komentuje centralizáciu PoW a poznamenáva, že to bolo dočasné štádium až do PoS
Apríla 26, 2024
Offchain Labs odhaľuje objav dvoch kritických zraniteľností v dôkazoch o podvodoch OP Stack Optimism
Novinová správa Softvér Technológia
Offchain Labs odhaľuje objav dvoch kritických zraniteľností v dôkazoch o podvodoch OP Stack Optimism
Apríla 26, 2024
Otvorený trh spoločnosti Dymension na premostenie likvidity z RollApps eIBC sa spúšťa na sieti Mainnet
Novinová správa Technológia
Otvorený trh spoločnosti Dymension na premostenie likvidity z RollApps eIBC sa spúšťa na sieti Mainnet 
Apríla 26, 2024
CRYPTOMERIA LABS PTE. LTD.