MusicLM: Googlen uusi tekstistä musiikiksi ja kuvasta musiikiksi tekoälymalli
Lyhyesti
Google esittelee MusicLM:n, mallin korkealaatuisen musiikin luomiseen tekstikuvauksista.
MusicLM voidaan ehdollistaa sekä tekstiin että melodiaan siten, että se pystyy muuntamaan vihellyttäviä ja hyrättyjä melodioita tekstitekstissä kuvatun tyylin mukaan.
Malli voi tuottaa musiikkia monissa genreissä, mukaan lukien klassinen, jazz ja rock.
Google esittelee MusicLM:n, mallin korkealaatuisen musiikin luomiseen tekstikuvauksista, kuten "rauhoittava viulumelodia, jota tukee vääristynyt kitarariffi". MusicLM esittää ehdollisen musiikin luomisen prosessin hierarkkisena sekvenssistä sekvenssiin -mallinnustehtävänä, ja se tuottaa musiikkia 24 kHz:n taajuudella, joka pysyy yhtenäisenä useiden minuuttien ajan.
Googlen kokeet osoittavat, että MusicLM ylittää aiemmat järjestelmät sekä äänenlaadun että tekstikuvauksen noudattamisen suhteen. Lisäksi se osoittaa, että MusicLM voidaan ehdollistaa sekä tekstille että melodialle siten, että se voi muuntaa vihellyttäviä ja huminaisia melodioita tekstin kuvatekstissä kuvatun tyylin mukaisesti. Tukeaksemme tulevaa tutkimusta julkaisemme julkisesti MusicCaps-tietojoukon, joka koostuu 5.5 XNUMX musiikki-teksti-parista ja ihmisten asiantuntijoiden toimittamista runsaista tekstikuvauksista.
Aiheeseen liittyvä artikkeli: Tekstistä 3D:ksi: Google on kehittänyt hermoverkon, joka luo 3D-malleja tekstikuvauksista |
MusicLM-mallia on koulutettu laajalle musiikkikappalekorpukselle, mikä on antanut tekoälylle mahdollisuuden oppia musiikin rakennetta. Malli voi tuottaa musiikkia monissa genreissä, mukaan lukien klassinen, jazz ja rock. Lisäksi tekoälymallilla voidaan luoda uusia, omaperäisiä sävellyksiä.
MusicLM-malli on tärkeä kehitys tekoälyn tuottaman musiikin alalla. Malli edustaa merkittävää edistystä aiempiin malleihin verrattuna, jotka rajoittuivat lyhyempiin musiikkikappaleisiin tai pystyivät luomaan vain yksinkertaisia melodioita. Uusi malli avaa mahdollisuuden käyttää tekoälyä tuottamaan pitkiä, monimutkaisia musiikkikappaleita, joita voitaisiin käyttää elokuvissa, videopeleissä tai muussa mediassa.
Uusi tekoälymalli voi tuottaa pitkää musiikkia jopa viiden minuutin sukupolville.
Aiheeseen liittyvä artikkeli: Stable Diffusion voi luoda uutta musiikkia luomalla spektrogrammeja tekstin perusteella |
Tekoälymalli voi luoda musiikkia pelien ja elokuvien kuvatekstien avulla.
Lisäksi tekoälymalli voi tuottaa musiikkia käyttämällä kuvia syötteenä.
Lue lisää tekoälystä musiikkiteollisuudessa:
Vastuun kieltäminen
Mukaisesti Luottamusprojektin ohjeetHuomaa, että tällä sivulla annettuja tietoja ei ole tarkoitettu eikä niitä tule tulkita oikeudellisiksi, verotukselliseksi, sijoitus-, rahoitus- tai minkään muun muodon neuvoiksi. On tärkeää sijoittaa vain sen verran, mitä sinulla on varaa menettää, ja pyytää riippumatonta talousneuvontaa, jos sinulla on epäilyksiä. Lisätietoja saat käyttöehdoista sekä myöntäjän tai mainostajan tarjoamista ohje- ja tukisivuista. MetaversePost on sitoutunut tarkkaan, puolueettomaan raportointiin, mutta markkinaolosuhteet voivat muuttua ilman erillistä ilmoitusta.
Author
Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa.
lisää artikkeleitaDamir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa.