Tudósítást Technológia
Január 31, 2023

MusicLM: a Google új szöveg-zene és kép-zene AI modellje

Röviden

A Google bemutatja a MusicLM-et, egy modellt, amellyel szöveges leírásokból nagy hűségű zenét lehet előállítani.

A MusicLM szövegre és dallamra egyaránt kondicionálható annyiban, hogy képes a sípolt és dúdolt dallamokat a szövegfeliratban leírt stílusnak megfelelően átalakítani.

A modell képes zenét generálni sokféle műfajban, beleértve a klasszikust, a jazzt és a rockot.

A Google bemutatja a MusicLM-et, egy olyan modellt, amellyel szöveges leírásokból, például „egy torz gitárriffel megtámadott nyugtató hegedűdallamból nagy hűségű zenét lehet generálni”. A MusicLM a feltételes zenegenerálás folyamatát hierarchikus szekvencia-modellezési feladatként adja meg, és 24 kHz-en generál zenét, amely több percen keresztül konzisztens marad.

MusicLM: a Google új szöveg-zene és kép-zene AI modellje

A Google kísérletei azt mutatják, hogy a MusicLM felülmúlja a korábbi rendszereket, mind hangminőségben, mind a szöveges leíráshoz való ragaszkodásban. Sőt, azt is bemutatja, hogy a MusicLM szövegre és dallamra egyaránt feltétele lehet, mivel képes a sípolt és dúdolt dallamokat a szövegfeliratban leírt stílusnak megfelelően átalakítani. A jövőbeli kutatások támogatása érdekében nyilvánosan kiadjuk a MusicCaps adatkészletet, amely 5.5 XNUMX zene-szöveg párból áll, humán szakértők által biztosított gazdag szöveges leírásokkal.

Kapcsolódó cikk: Szöveg 3D-be: A Google kifejlesztett egy neurális hálózatot, amely szöveges leírásokból 3D modelleket generál

A MusicLM-modellt egy nagy zenei partitúrán képezték ki, ami lehetővé tette az AI számára, hogy megtanulja a zene szerkezetét. A modell képes zenét generálni sokféle műfajban, beleértve a klasszikust, a jazzt és a rockot. Ezenkívül az AI-modell új, eredeti kompozíciókat tud létrehozni.

A MusicLM modell fontos fejlesztés az AI által generált zene területén. A modell jelentős előrelépést jelent a korábbi modellekhez képest, amelyek rövidebb zeneművekre korlátozódtak, vagy csak egyszerű dallamok generálására voltak képesek. Az új modell lehetővé teszi, hogy az AI segítségével hosszú, összetett zeneműveket állítsanak elő, amelyeket filmekben, videojátékokban vagy más médiában is felhasználhatnak.

Az új AI-modell hosszú zenét tud generálni legfeljebb öt perces generációk.

Kapcsolódó cikk: Stable Diffusion szöveg alapján spektrogramok generálásával új zenéket hozhat létre

Az AI modell képes zenét létrehozni játékok és filmek felirataival.

Ezenkívül az AI modell képes zenét generálni képek bemenetként történő felhasználásával.

MusicLM: a Google új szöveg-zene és kép-zene AI modellje
MusicLM: a Google új szöveg-zene és kép-zene AI modellje
MusicLM: a Google új szöveg-zene és kép-zene AI modellje

További információ az AI-ról a zeneiparban:

Jogi nyilatkozat

Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.

A szerzőről

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

További cikkek
Damir Jalalov
Damir Jalalov

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

Hot Stories
Csatlakozzon hírlevelünkhöz.
Legfrissebb hírek

A Solana-vihar előtti csend: Mit mondanak most a grafikonok, a bálnák és a láncon lévő jelek?

A Solana erős teljesítményt mutatott, amelyet a növekvő elfogadás, az intézményi érdeklődés és a kulcsfontosságú partnerségek vezéreltek, miközben potenciális ...

Tudjon meg többet

Kriptovaluták 2025 áprilisában: Főbb trendek, változások és mi következik?

2025 áprilisában a kriptovilág az alapvető infrastruktúra megerősítésére összpontosított, az Ethereum pedig a Pectra ...

Tudjon meg többet
További információk
Részletek
A Bitget elindítja a Gracy mesterséges intelligenciát, hogy vezetői stílusú útmutatást nyújtson beszélgetős digitális avatáron keresztül
Tudósítást Technológia
A Bitget elindítja a Gracy mesterséges intelligenciát, hogy vezetői stílusú útmutatást nyújtson beszélgetős digitális avatáron keresztül
Február 16, 2026
A kockázati tőke figyelmét felkeltő kriptobefektetési témák 2026-ban
Top listák üzleti Technológia
A kockázati tőke figyelmét felkeltő kriptobefektetési témák 2026-ban
Február 16, 2026
Polinom leáll DeFi A származtatott platform lemondta a token bevezetését és bejelentette a felhasználók számára a kifizetési határidőt
Tudósítást Technológia
Polinom leáll DeFi A származtatott platform lemondta a token bevezetését és bejelentette a felhasználók számára a kifizetési határidőt
Február 16, 2026
A HSC Asset Management befejezte a hongkongi kiadását, bemutatva az intézményi részvétel ösztönzésére vonatkozó meglátásait. Web3 És feltörekvő technológiák
Featured Hack Seasons üzleti Életmód Alkalmazás Tudósítást Technológia
A HSC Asset Management befejezte a hongkongi kiadását, bemutatva az intézményi részvétel ösztönzésére vonatkozó meglátásait. Web3 És feltörekvő technológiák
Február 13, 2026
CRYPTOMERIA LABS PTE. KFT.