Google AI a anunțat primul generator de text în muzică AudioLM
Pe scurt
AudioLM poate produce muzică doar ascultând sunete
Mubert AI va continua vorbirea umană și muzica de pian
cu GPT-3 și alții, ideea de IA generativă are șanse mari să avanseze. De asemenea, am descoperit conceptele de inpainting și outpainting; AI completează cu pricepere imaginile păstrând în același timp tema și stilul. Dar muzica?
Și încă din nou! Deoarece toate acestea se bazează pe modele de limbaj AI care păstrează semnificația, era doar o chestiune de timp până când această tehnologie să fie aplicată muzicii. Și acum a sosit momentul.
Conform cercetărilor recente Google, un nou cadru pentru producția audio numit AudioLM poate fi învățat să creeze vorbire realistă și muzică de pian pur și simplu ascultând sunete. Datorită consistenței sale pe termen lung și fidelității excelente, AudioLM depășește sistemele anterioare și avansează crearea audio cu aplicații în sinteza vocii și muzica asistată de computer.
AudioLM de la Google AI poate extinde un pasaj acustic păstrând în același timp „intenția”. Începând de acum, a fost antrenat să continue vorbirea umană și muzica de pian, pe baza unui eșantion limitat de date de intrare. Verificați eșantionul de mai jos.
Criteriile pentru vorbire au fost simple: ascultătorii au fost rugați să evalueze dacă continuarea suna ca vorbire umană. Odată cu muzica, s-a descoperit că „continuarea” secțiunii furnizate pentru intrare este cu mult superioară ca calitate decât toate generatoarele de muzică actuale de la zero, cum ar fi JukeBox. Cu o sugestie la intrare, AI continuă muzica mult mai bine.
Evaluatorii umani au ascultat mostre audio pentru a confirma rezultatele. Ei au stabilit dacă auzeau o continuare reală a unei voci umane care fusese înregistrată sau o voce artificială produsă de AudioLM. Datele lor indică o rată de succes de 51.2%. Ca urmare, va fi o provocare pentru ascultătorul obișnuit să facă distincția între vorbirea produsă de AudioLM și vorbirea umană reală.
Tehnologia text-to-music modifică afacerea muzicală?
Un generator de text în muzică bazat pe Mubert API a fost anunțat recent de un alt model AI, Mubert. Mubert creează un set diferit de sunete pentru fiecare cerere pe care o trimiteți. Probabilitatea repetării este foarte mică. Muzica este creată atunci când se face o cerere; nu este extras dintr-o bază de date de melodii terminate. Cat de adevarat generativ această muzică este o întrebare comună.
Sunetele sunt alese înainte de a fi create. Atât promptul de intrare, cât și etichetele Mubert API sunt codificate în vectorul spațiu latent al unei rețele neuronale transformatoare. Este apoi ales cel mai apropiat vector de etichete pentru fiecare interogare, iar etichetele însoțitoare sunt transmise către API-ul nostru pentru a crea muzică. Nu a fost folosită nicio rețea neuronală pentru a construi niciunul dintre sunete (bucle separate pentru bas, lead-uri etc.); toate sunetele au fost produse de muzicieni și designeri de sunet.
Următorul pas important al lui Mubert este să luați elemente din lumea actuală, cum ar fi fotografii, filme, scenarii și prezentări și să creați muzica lumii din jurul vostru.
Iată ce poți obține punând cu nesăbuință mesaje text în gura muzicalului Mubert AI:
Aceasta este etapa inițială a procesului de construire a unui algoritm de generare mai sofisticat și mai precis, dar acest lucru va necesita timp și bani.
Cu toate acestea, tehnologia text-to-muzică este deja disponibilă, așa că puteți genera albume în vrac prin comutarea „prompt de introducere” pentru „scrieți un script de prompt aleatoriu”. Se pare că nu mai sunt necesari artiștii.
Citiți mai multe știri legate:
Declinare a responsabilităţii
În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.
Despre autor
Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului.
Mai multe articoleDamir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului.