Ulat sa Balita Teknolohiya
Enero 31, 2023

MusicLM: isang bagong text-to-music at image-to-music AI model mula sa Google

Sa madaling sabi

Ipinakilala ng Google ang MusicLM, isang modelo para sa pagbuo ng high-fidelity na musika mula sa mga paglalarawan ng teksto.

Maaaring ikondisyon ang MusicLM sa parehong teksto at isang melody dahil maaari nitong baguhin ang mga whistled at hummed melodies ayon sa istilong inilarawan sa isang text caption.

Ang modelo ay maaaring makabuo ng musika sa iba't ibang genre, kabilang ang classical, jazz, at rock.

Ipinakilala ng Google ang MusicLM, isang modelo para sa pagbuo ng high-fidelity na musika mula sa mga paglalarawan ng teksto tulad ng "isang nakakakalmang violin melody na sinusuportahan ng isang baluktot na riff ng gitara." Itinatanghal ng MusicLM ang proseso ng conditional music generation bilang isang hierarchical sequence-to-sequence modelling task, at bumubuo ito ng musika sa 24 kHz na nananatiling pare-pareho sa loob ng ilang minuto.

MusicLM: isang bagong text-to-music at image-to-music AI model mula sa Google

Ipinapakita ng mga eksperimento ng Google na ang MusicLM ay higit na gumaganap sa mga nakaraang system, parehong sa kalidad ng audio at pagsunod sa paglalarawan ng teksto. Bukod dito, ipinapakita nito na ang MusicLM ay maaaring makondisyon sa parehong teksto at isang melody na maaari nitong baguhin ang whistled at hummed melodies ayon sa istilong inilarawan sa isang text caption. Para suportahan ang pananaliksik sa hinaharap, inilabas namin sa publiko ang MusicCaps, isang dataset na binubuo ng 5.5k na pares ng musika-text na may mga rich text na paglalarawan na ibinigay ng mga eksperto ng tao.

Kaugnay na artikulo: Text-to-3D: Nakabuo ang Google ng neural network na bumubuo ng mga 3D na modelo mula sa mga paglalarawan ng teksto

Ang modelo ng MusicLM ay sinanay sa isang malaking corpus ng mga musical score, na nagbigay-daan sa AI na matutunan ang istraktura ng musika. Ang modelo ay maaaring makabuo ng musika sa iba't ibang genre, kabilang ang classical, jazz, at rock. Bilang karagdagan, ang modelo ng AI ay maaaring lumikha ng mga bago, orihinal na komposisyon.

Ang modelo ng MusicLM ay isang mahalagang pag-unlad sa larangan ng musikang binuo ng AI. Ang modelo ay kumakatawan sa isang makabuluhang pag-unlad kaysa sa mga nakaraang modelo, na limitado sa mas maiikling piraso ng musika o kaya lamang na bumuo ng mga simpleng melodies. Binubuksan ng bagong modelo ang posibilidad ng paggamit ng AI upang makabuo ng mahaba, kumplikadong mga piraso ng musika, na maaaring magamit sa mga pelikula, video game, o iba pang media.

Ang bagong modelo ng AI ay maaaring makabuo ng mahabang musika henerasyon hanggang limang minuto.

Kaugnay na artikulo: Stable Diffusion maaaring lumikha ng bagong musika sa pamamagitan ng pagbuo ng mga spectrogram batay sa teksto

Ang modelo ng AI ay maaaring lumikha ng musika gamit ang mga caption mula sa mga laro at pelikula.

Bilang karagdagan, ang modelo ng AI ay maaaring makabuo ng musika gamit ang mga imahe bilang input.

Magbasa pa tungkol sa AI sa industriya ng musika:

Pagtanggi sa pananagutan

Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.

Tungkol sa Ang May-akda

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Mas marami pang artikulo
Damir Yalalov
Damir Yalalov

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

The DOGE Frenzy: Pagsusuri sa Kamakailang Pagtaas ng Halaga ng Dogecoin (DOGE).

Ang industriya ng cryptocurrency ay mabilis na lumalawak, at ang mga meme coins ay naghahanda para sa isang makabuluhang pagtaas. Dogecoin (DOGE), ...

Malaman Higit Pa

Ang Ebolusyon ng AI-Generated Content sa Metaverse

Ang paglitaw ng generative na nilalaman ng AI ay isa sa mga pinaka-kamangha-manghang pag-unlad sa loob ng virtual na kapaligiran ...

Malaman Higit Pa
Sumali sa Aming Innovative Tech Community
Magbasa Pa
Magbasa nang higit pa
Mga Nangungunang Deal ngayong Linggo, Mga Pangunahing Pamumuhunan sa AI, IT, Web3, at Crypto (22-26.04)
Digest Negosyo markets Teknolohiya
Mga Nangungunang Deal ngayong Linggo, Mga Pangunahing Pamumuhunan sa AI, IT, Web3, at Crypto (22-26.04)
Abril 26, 2024
Mga Komento ni Vitalik Buterin Tungkol sa Sentralisasyon Ng PoW, Mga Tala na Ito ay Pansamantalang Yugto Hanggang sa PoS
Ulat sa Balita Teknolohiya
Mga Komento ni Vitalik Buterin Tungkol sa Sentralisasyon Ng PoW, Mga Tala na Ito ay Pansamantalang Yugto Hanggang sa PoS
Abril 26, 2024
Inihayag ng Offchain Labs ang Pagtuklas ng Dalawang Kritikal na Kahinaan Sa Mga Patunay ng Panloloko ng OP Stack ng Optimism
Ulat sa Balita software Teknolohiya
Inihayag ng Offchain Labs ang Pagtuklas ng Dalawang Kritikal na Kahinaan Sa Mga Patunay ng Panloloko ng OP Stack ng Optimism
Abril 26, 2024
Ang Open Market ng Dymension Para sa Bridging Liquidity Mula sa RollApps eIBC Inilunsad Sa Mainnet
Ulat sa Balita Teknolohiya
Ang Open Market ng Dymension Para sa Bridging Liquidity Mula sa RollApps eIBC Inilunsad Sa Mainnet 
Abril 26, 2024
CRYPTOMERIA LABS PTE. LTD.