Novinky Technika
Ledna 31, 2023

MusicLM: nový model umělé inteligence pro převod textu na hudbu a obrázek na hudbu od společnosti Google

Stručně

Google představuje MusicLM, model pro generování vysoce věrné hudby z textových popisů.

MusicLM může být podmíněno textem i melodií v tom smyslu, že dokáže transformovat pískané a bzučící melodie podle stylu popsaného v textovém popisku.

Model umí vytvářet hudbu v různých žánrech, včetně klasiky, jazzu a rocku.

Google představuje MusicLM, model pro generování vysoce věrné hudby z textových popisů, jako je „uklidňující houslová melodie podpořená zkresleným kytarovým riffem“. MusicLM vrhá proces podmíněného generování hudby jako hierarchické modelování sekvencí a generuje hudbu při 24 kHz, která zůstává konzistentní po několik minut.

MusicLM: nový model umělé inteligence pro převod textu na hudbu a obrázek na hudbu od společnosti Google

Experimenty Google ukazují, že MusicLM předčí předchozí systémy, a to jak kvalitou zvuku, tak dodržováním textového popisu. Navíc demonstruje, že MusicLM může být podmíněno textem i melodií tím, že dokáže transformovat pískané a bzučící melodie podle stylu popsaného v textovém titulku. Abychom podpořili budoucí výzkum, veřejně vydáváme MusicCaps, datovou sadu složenou z 5.5 XNUMX párů hudba-text s popisy ve formátu RTF, které poskytli odborníci na lidi.

Související článek: Text-to-3D: Google vyvinul neuronovou síť, která generuje 3D modely z textových popisů

Model MusicLM byl trénován na velkém korpusu hudebních partitur, což umožnilo umělé inteligenci naučit se strukturu hudby. Model umí vytvářet hudbu v různých žánrech, včetně klasiky, jazzu a rocku. Model AI navíc dokáže vytvářet nové, originální kompozice.

Model MusicLM je důležitým vývojem v oblasti hudby generované umělou inteligencí. Model představuje výrazný pokrok oproti předchozím modelům, které byly omezeny na kratší hudební skladby nebo byly schopny generovat pouze jednoduché melodie. Nový model otevírá možnost použití umělé inteligence ke generování dlouhých, komplexních hudebních skladeb, které lze použít ve filmech, videohrách nebo jiných médiích.

Nový model umělé inteligence dokáže generovat dlouhou hudbu generace do pěti minut.

Související článek: Stable Diffusion může vytvářet novou hudbu generováním spektrogramů na základě textu

Model AI dokáže vytvářet hudbu pomocí titulků z her a filmů.

Model AI navíc dokáže generovat hudbu pomocí obrázků jako vstupu.

Přečtěte si více o AI v hudebním průmyslu:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Další články
Damir Yalalov
Damir Yalalov

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Institucionální apetit roste směrem k bitcoinovým ETF uprostřed volatility

Zveřejnění prostřednictvím podání 13F odhaluje, že pozoruhodní institucionální investoři fušují do bitcoinových ETF, což podtrhuje rostoucí akceptaci...

Vědět více

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Optimismem poháněná síť Ethereum Layer 2 Network Mint spustí svou hlavní síť 15. května
Novinky Technika
Optimismem poháněná síť Ethereum Layer 2 Network Mint spustí svou hlavní síť 15. května
10
Nejlepší nabídky tohoto týdne, velké investice do AI, IT, Web3a kryptoměny (06-10.04)
Strávit Business Trhy Vývoj Technika
Nejlepší nabídky tohoto týdne, velké investice do AI, IT, Web3a kryptoměny (06-10.04)
10
StaFi integruje podporu pro LRT společnosti EigenLayer ve svém zásobníku Liquid-Staking-as-a-Service
Trhy Novinky Technika
StaFi integruje podporu pro LRT společnosti EigenLayer ve svém zásobníku Liquid-Staking-as-a-Service
10
Aktivní bitcoiny se propadly na čtyřleté minimum, předpovídá se, že v současném cyklu dosáhne pouze 1.3 milionu, odhaluje kryptoanalytik Bloomberg
Trhy Novinky Technika
Aktivní bitcoiny se propadly na čtyřleté minimum, předpovídá se, že v současném cyklu dosáhne pouze 1.3 milionu, odhaluje kryptoanalytik Bloomberg
10
CRYPTOMERIA LABS PTE. LTD.