Buletin de stiri
Octombrie 21, 2022

Google AI a anunțat primul generator de text în muzică AudioLM

Pe scurt

AudioLM poate produce muzică doar ascultând sunete

Mubert AI va continua vorbirea umană și muzica de pian

cu GPT-3 și alții, ideea de IA generativă are șanse mari să avanseze. De asemenea, am descoperit conceptele de inpainting și outpainting; AI completează cu pricepere imaginile păstrând în același timp tema și stilul. Dar muzica?

Și încă din nou! Deoarece toate acestea se bazează pe modele de limbaj AI care păstrează semnificația, era doar o chestiune de timp până când această tehnologie să fie aplicată muzicii. Și acum a sosit momentul.

Google AI a anunțat primul generator de text în muzică AudioLM

Conform cercetărilor recente Google, un nou cadru pentru producția audio numit AudioLM poate fi învățat să creeze vorbire realistă și muzică de pian pur și simplu ascultând sunete. Datorită consistenței sale pe termen lung și fidelității excelente, AudioLM depășește sistemele anterioare și avansează crearea audio cu aplicații în sinteza vocii și muzica asistată de computer.

Am dezvoltat un sistem pentru a recunoaște sunetele sintetice produse de AudioLM folosind aceleași concepte AI care au stat la baza creării modelelor noastre anterioare.

AudioLM de la Google AI poate extinde un pasaj acustic păstrând în același timp „intenția”. Începând de acum, a fost antrenat să continue vorbirea umană și muzica de pian, pe baza unui eșantion limitat de date de intrare. Verificați eșantionul de mai jos.

Criteriile pentru vorbire au fost simple: ascultătorii au fost rugați să evalueze dacă continuarea suna ca vorbire umană. Odată cu muzica, s-a descoperit că „continuarea” secțiunii furnizate pentru intrare este cu mult superioară ca calitate decât toate generatoarele de muzică actuale de la zero, cum ar fi JukeBox. Cu o sugestie la intrare, AI continuă muzica mult mai bine.

Google AI a anunțat primul generator de text în muzică AudioLM

Evaluatorii umani au ascultat mostre audio pentru a confirma rezultatele. Ei au stabilit dacă auzeau o continuare reală a unei voci umane care fusese înregistrată sau o voce artificială produsă de AudioLM. Datele lor indică o rată de succes de 51.2%. Ca urmare, va fi o provocare pentru ascultătorul obișnuit să facă distincția între vorbirea produsă de AudioLM și vorbirea umană reală.

Tehnologia text-to-music modifică afacerea muzicală?

Un generator de text în muzică bazat pe Mubert API a fost anunțat recent de un alt model AI, Mubert. Mubert creează un set diferit de sunete pentru fiecare cerere pe care o trimiteți. Probabilitatea repetării este foarte mică. Muzica este creată atunci când se face o cerere; nu este extras dintr-o bază de date de melodii terminate. Cat de adevarat generativ această muzică este o întrebare comună.

Tehnologia text-to-music modifică afacerea muzicală?

Sunetele sunt alese înainte de a fi create. Atât promptul de intrare, cât și etichetele Mubert API sunt codificate în vectorul spațiu latent al unei rețele neuronale transformatoare. Este apoi ales cel mai apropiat vector de etichete pentru fiecare interogare, iar etichetele însoțitoare sunt transmise către API-ul nostru pentru a crea muzică. Nu a fost folosită nicio rețea neuronală pentru a construi niciunul dintre sunete (bucle separate pentru bas, lead-uri etc.); toate sunetele au fost produse de muzicieni și designeri de sunet.

Următorul pas important al lui Mubert este să luați elemente din lumea actuală, cum ar fi fotografii, filme, scenarii și prezentări și să creați muzica lumii din jurul vostru.

Iată ce poți obține punând cu nesăbuință mesaje text în gura muzicalului Mubert AI:

Aceasta este etapa inițială a procesului de construire a unui algoritm de generare mai sofisticat și mai precis, dar acest lucru va necesita timp și bani.

Cu toate acestea, tehnologia text-to-muzică este deja disponibilă, așa că puteți genera albume în vrac prin comutarea „prompt de introducere” pentru „scrieți un script de prompt aleatoriu”. Se pare că nu mai sunt necesari artiștii.

Citiți mai multe știri legate:

Declinare a responsabilităţii

În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.

Despre autor

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Mai multe articole
Damir Yalalov
Damir Yalalov

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Apetitul instituțional crește față de ETF-urile Bitcoin pe fondul volatilității

Dezvăluirile prin dosarele 13F dezvăluie investitori instituționali de seamă care se amestecă în ETF-uri Bitcoin, subliniind o acceptare tot mai mare a...

Aflați mai multe

Sosește ziua sentinței: soarta lui CZ este în echilibru, în timp ce tribunalul american ia în considerare pledoaria DOJ

Changpeng Zhao este pe cale de a fi condamnat astăzi într-un tribunal american din Seattle.

Aflați mai multe
Alăturați-vă comunității noastre tehnologice inovatoare
Citeste mai mult
Află mai multe
Injective își unește forțele cu AltLayer pentru a aduce securitatea refacerii în EVM
Afaceri Buletin de stiri Tehnologia
Injective își unește forțele cu AltLayer pentru a aduce securitatea refacerii în EVM
3 Mai, 2024
Masa face echipă cu Teller pentru a introduce grupul de împrumuturi MASA, care permite împrumuturile USDC pe bază
pieţe Buletin de stiri Tehnologia
Masa face echipă cu Teller pentru a introduce grupul de împrumuturi MASA, care permite împrumuturile USDC pe bază
3 Mai, 2024
Velodrome lansează versiunea Beta a Superchain în săptămânile următoare și se extinde în blockchainurile OP Stack Layer 2
pieţe Buletin de stiri Tehnologia
Velodrome lansează versiunea Beta a Superchain în săptămânile următoare și se extinde în blockchainurile OP Stack Layer 2
3 Mai, 2024
CARV anunță parteneriat cu Aethir pentru a-și descentraliza stratul de date și a distribui recompense
Afaceri Buletin de stiri Tehnologia
CARV anunță parteneriat cu Aethir pentru a-și descentraliza stratul de date și a distribui recompense
3 Mai, 2024
CRYPTOMERIA LABS PTE. LTD.