Novice Tehnologija
Januar 31, 2023

MusicLM: nov Googlov model umetne inteligence za pretvorbo besedila v glasbo in slike v glasbo

Na kratko

Google predstavlja MusicLM, model za ustvarjanje glasbe visoke ločljivosti iz besedilnih opisov.

MusicLM je lahko pogojen tako z besedilom kot z melodijo, saj lahko preoblikuje žvižgane in zabrenčane melodije glede na slog, opisan v besedilnem napisu.

Model lahko ustvarjanje glasbe v različnih žanrih, vključno s klasiko, jazzom in rockom.

Google predstavlja MusicLM, model za ustvarjanje glasbe visoke ločljivosti iz besedilnih opisov, kot je »pomirjujoča melodija violine, podprta s popačenim kitarskim rifom«. MusicLM uvršča proces pogojnega ustvarjanja glasbe kot hierarhično nalogo modeliranja od zaporedja do zaporedja in ustvarja glasbo pri 24 kHz, ki ostane dosledna več minut.

MusicLM: nov Googlov model umetne inteligence za pretvorbo besedila v glasbo in slike v glasbo

Googlovi poskusi kažejo, da MusicLM prekaša prejšnje sisteme, tako v kakovosti zvoka kot pri upoštevanju besedilnega opisa. Poleg tega dokazuje, da je MusicLM lahko pogojen tako z besedilom kot z melodijo, saj lahko preoblikuje žvižgane in zabrenčane melodije glede na slog, opisan v besedilnem napisu. Za podporo prihodnjim raziskavam javno objavljamo MusicCaps, nabor podatkov, sestavljen iz 5.5k parov glasba-besedilo z obogatenimi besedilnimi opisi, ki so jih zagotovili človeški strokovnjaki.

Povezani članek: Besedilo v 3D: Google je razvil nevronsko mrežo, ki ustvarja 3D modele iz besedilnih opisov

Model MusicLM je bil učen na velikem korpusu glasbenih partitur, kar je AI omogočilo učenje strukture glasbe. Model lahko ustvarjanje glasbe v različnih žanrih, vključno s klasiko, jazzom in rockom. Poleg tega lahko model AI ustvari nove, izvirne kompozicije.

Model MusicLM je pomemben razvoj na področju glasbe, ustvarjene z umetno inteligenco. Model predstavlja bistven napredek v primerjavi s prejšnjimi modeli, ki so bili omejeni na krajše glasbene komade ali pa so bili zmožni ustvarjati le preproste melodije. Novi model odpira možnost uporabe umetne inteligence za ustvarjanje dolgih, kompleksnih glasbenih del, ki bi jih lahko uporabili v filmih, video igrah ali drugih medijih.

Novi model AI lahko ustvarja dolgo glasbo generacije do pet minut.

Povezani članek: Stable Diffusion lahko ustvari novo glasbo z ustvarjanjem spektrogramov na podlagi besedila

Model AI lahko ustvarja glasbo z uporabo napisov iz iger in filmov.

Poleg tega lahko model AI ustvarja glasbo z uporabo slik kot vhodnih podatkov.

Preberite več o AI v glasbeni industriji:

Zavrnitev odgovornosti

V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.

O avtorju

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

več člankov
Damir Yalalov
Damir Yalalov

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

Institucionalni apetit raste proti Bitcoin ETF-jem sredi volatilnosti

Razkritja prek vlog 13F razkrivajo pomembne institucionalne vlagatelje, ki se ukvarjajo z Bitcoin ETF, kar poudarja vse večje sprejemanje ...

Več o tem

Prihaja dan obsodbe: usoda CZ visi na ravnovesju, ko ameriško sodišče obravnava tožbeni razlog DOJ

Changpeng Zhao se danes sooča z obsodbo na ameriškem sodišču v Seattlu.

Več o tem
Pridružite se naši inovativni tehnološki skupnosti
Preberi več
Preberi več
Prehod Donalda Trumpa na kripto: od nasprotnika do zagovornika in kaj to pomeni za ameriški trg kriptovalut
ŽELITE POSTATI PARTNER Prisotnost Zgodbe in ocene Tehnologija
Prehod Donalda Trumpa na kripto: od nasprotnika do zagovornika in kaj to pomeni za ameriški trg kriptovalut
Maj 10, 2024
Layer3 bo lansiral žeton L3 to poletje in 51 % celotne ponudbe namenil skupnosti
Prisotnost Novice Tehnologija
Layer3 bo lansiral žeton L3 to poletje in 51 % celotne ponudbe namenil skupnosti
Maj 10, 2024
Zadnje opozorilo Edwarda Snowdna razvijalcem bitcoinov: »Naj bo zasebnost prednostna naloga na ravni protokola ali pa tvegajte, da jo izgubite
Prisotnost Varnost Wiki Software Zgodbe in ocene Tehnologija
Zadnje opozorilo Edwarda Snowdna razvijalcem bitcoinov: »Naj bo zasebnost prednostna naloga na ravni protokola ali pa tvegajte, da jo izgubite
Maj 10, 2024
Omrežna kovnica Ethereum Layer 2, ki jo poganja optimizem, bo svojo glavno mrežo predstavila 15. maja
Novice Tehnologija
Omrežna kovnica Ethereum Layer 2, ki jo poganja optimizem, bo svojo glavno mrežo predstavila 15. maja
Maj 10, 2024
CRYPTOMERIA LABS PTE. LTD.