Buletin de stiri Tehnologia
Ianuarie 31, 2023

MusicLM: un nou model AI text-în-muzică și imagine-în-muzică de la Google

Pe scurt

Google introduce MusicLM, un model pentru generarea de muzică de înaltă fidelitate din descrierile de text.

MusicLM poate fi condiționat atât de text, cât și de o melodie, deoarece poate transforma melodiile fluierate și fredonate conform stilului descris într-o legendă a textului.

Modelul poate genera muzica într-o varietate de genuri, inclusiv clasică, jazz și rock.

Google introduce MusicLM, un model pentru generarea de muzică de înaltă fidelitate din descrieri de text, cum ar fi „o melodie liniştitoare de vioară susţinută de un riff de chitară distorsionat”. MusicLM prezintă procesul de generare condiționată a muzicii ca o sarcină de modelare ierarhică secvență-la-secvență și generează muzică la 24 kHz care rămâne constantă timp de câteva minute.

MusicLM: un nou model AI text-în-muzică și imagine-în-muzică de la Google

Experimentele Google arată că MusicLM depășește sistemele anterioare, atât în ​​ceea ce privește calitatea audio, cât și respectarea descrierea textului. Mai mult, demonstrează că MusicLM poate fi condiționat atât de text, cât și de o melodie, prin faptul că poate transforma melodiile fluierate și fredonate conform stilului descris într-o legendă a textului. Pentru a sprijini cercetările viitoare, lansăm în mod public MusicCaps, un set de date compus din 5.5k perechi muzică-text cu descrieri de text îmbogățit furnizate de experți umani.

Articol asociat: Text-to-3D: Google a dezvoltat o rețea neuronală care generează modele 3D din descrierile de text

Modelul MusicLM a fost antrenat pe un corp mare de partituri muzicale, ceea ce a permis AI să învețe structura muzicii. Modelul poate genera muzica într-o varietate de genuri, inclusiv clasică, jazz și rock. În plus, modelul AI poate crea compoziții noi, originale.

Modelul MusicLM este o dezvoltare importantă în domeniul muzicii generate de AI. Modelul reprezintă un avans semnificativ față de modelele anterioare, care erau limitate la piese muzicale mai scurte sau capabile doar să genereze melodii simple. Noul model deschide posibilitatea utilizării AI pentru a genera piese muzicale lungi și complexe, care ar putea fi folosite în filme, jocuri video sau alte medii.

Noul model AI poate genera muzică lungă generații de până la cinci minute.

Articol asociat: Stable Diffusion poate crea muzică nouă prin generarea de spectrograme bazate pe text

Modelul AI poate crea muzică folosind subtitrări din jocuri și filme.

În plus, modelul AI poate genera muzică folosind imagini ca intrare.

Citiți mai multe despre AI în industria muzicală:

Declinare a responsabilităţii

În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.

Despre autor

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Mai multe articole
Damir Yalalov
Damir Yalalov

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Apetitul instituțional crește față de ETF-urile Bitcoin pe fondul volatilității

Dezvăluirile prin dosarele 13F dezvăluie investitori instituționali de seamă care se amestecă în ETF-uri Bitcoin, subliniind o acceptare tot mai mare a...

Aflați mai multe

Sosește ziua sentinței: soarta lui CZ este în echilibru, în timp ce tribunalul american ia în considerare pledoaria DOJ

Changpeng Zhao este pe cale de a fi condamnat astăzi într-un tribunal american din Seattle.

Aflați mai multe
Alăturați-vă comunității noastre tehnologice inovatoare
Citeste mai mult
Află mai multe
Trecerea lui Donald Trump la criptomonede: de la oponent la avocat și ce înseamnă aceasta pentru piața criptomonedelor din SUA
Afaceri pieţe Povești și recenzii Tehnologia
Trecerea lui Donald Trump la criptomonede: de la oponent la avocat și ce înseamnă aceasta pentru piața criptomonedelor din SUA
10 Mai, 2024
Layer3 va lansa tokenul L3 vara aceasta, alocand 51% din totalul aprovizionării comunității
pieţe Buletin de stiri Tehnologia
Layer3 va lansa tokenul L3 vara aceasta, alocand 51% din totalul aprovizionării comunității
10 Mai, 2024
Avertismentul final al lui Edward Snowden pentru dezvoltatorii Bitcoin: „Faceți din confidențialitate o prioritate la nivel de protocol sau riscați să o pierdeți
pieţe Securitate Wiki Software Povești și recenzii Tehnologia
Avertismentul final al lui Edward Snowden pentru dezvoltatorii Bitcoin: „Faceți din confidențialitate o prioritate la nivel de protocol sau riscați să o pierdeți
10 Mai, 2024
Ethereum Layer 2 Network Mint, alimentat de optimism, își va lansa rețeaua principală pe 15 mai
Buletin de stiri Tehnologia
Ethereum Layer 2 Network Mint, alimentat de optimism, își va lansa rețeaua principală pe 15 mai
10 Mai, 2024
CRYPTOMERIA LABS PTE. LTD.