Vijesti
Listopada 21, 2022

Google AI najavio je prvi generator teksta u glazbu AudioLM

Ukratko

AudioLM može proizvoditi glazbu samo slušajući zvukove

Mubert AI nastaviti ljudski govor i klavirsku glazbu

S GPT-3 i drugi, ideja generativne umjetne inteligencije ima dobre izglede za napredak. Također smo otkrili pojmove inpainting i outpainting; AI vješto dovršava slike zadržavajući temu i stil. Što je s glazbom?

I opet! Budući da se sve ovo temelji na AI jezičnim modelima koji zadržavaju značenje, bilo je samo pitanje vremena kada će se ova tehnologija primijeniti na glazbu. I sada je došlo vrijeme.

Google AI najavio je prvi generator teksta u glazbu AudioLM

Prema nedavnom Googleovom istraživanju, novi okvir za audio produkciju nazvan AudioLM može se naučiti stvarati realističan govor i klavirsku glazbu jednostavnim slušanjem zvukova. Zbog svoje dugoročne dosljednosti i izvrsne vjernosti, AudioLM nadmašuje ranije sustave i unapređuje stvaranje zvuka s aplikacijama u glasovnoj sintezi i računalno potpomognutoj glazbi.

Razvili smo sustav za prepoznavanje sintetičkih zvukova koje proizvodi AudioLM koristeći iste koncepte umjetne inteligencije koji su poduprli stvaranje naših prethodnih modela.

AudioLM iz Googlea AI može produžiti akustični prolaz zadržavajući "namjeru". Do sada je osposobljen za nastavak ljudskog govora i klavirske glazbe, na temelju ograničenog uzorka ulaznih podataka. Provjerite uzorak u nastavku.

Kriteriji za govor bili su jasni: od slušatelja se tražilo da procijene zvuči li nastavak kao ljudski govor. S glazbom je otkriveno da je "nastavak" odjeljka danog za unos daleko superiorniji u kvaliteti od svih trenutnih glazbenih generatora od nule, kao što je JukeBox. Uz sugestiju na ulazu, AI nastavlja glazbu znatno bolje.

Google AI najavio je prvi generator teksta u glazbu AudioLM

Ljudski ocjenjivači slušali su audio uzorke kako bi potvrdili rezultate. Odredili su čuju li stvarni nastavak ljudskog glasa koji je snimljen ili umjetni glas koji je proizveo AudioLM. Njihovi podaci pokazuju stopu uspješnosti od 51.2%. Kao rezultat toga, prosječnom će slušatelju biti teško razlikovati govor koji proizvodi AudioLM od stvarnog ljudskog govora.

Mijenja li tehnologija pretvaranja teksta u glazbu glazbeni biznis?

Generator teksta u glazbu temeljen na Mubert API nedavno je najavio još jedan AI model, Mubert. Mubert stvara drugačiji skup zvukova za svaki zahtjev koji pošaljete. Vjerojatnost ponavljanja je stvarno mala. Glazba se stvara kada se postavi zahtjev; ne izvlači se iz baze podataka gotovih pjesama. Kako istinski generativna ova glazba to je često pitanje.

Mijenja li tehnologija pretvaranja teksta u glazbu glazbeni biznis?

Zvukovi se biraju prije stvaranja. I upit za unos i Mubert API oznake kodirani su u vektor latentnog prostora transformatorske neuronske mreže. Zatim se bira najbliži vektor oznaka za svaki upit, a popratne oznake se prenose u naš API za stvaranje glazbe. Nikakva neuronska mreža nije korištena za konstruiranje bilo kojeg zvuka (odvojene petlje za bas, vode, itd.); sve su zvukove proizveli glazbenici i dizajneri zvuka.

Mubertov sljedeći značajan korak je preuzimanje predmeta iz trenutnog svijeta, kao što su fotografije, filmovi, scenariji i prezentacije, i stvaranje glazbe svijeta oko vas.

Evo što možete dobiti nepromišljenim stavljanjem tekstualnih upita u usta glazbenog Muberta AI:

Ovo je početna faza u procesu izgradnje sofisticiranijeg i preciznijeg algoritma za generiranje, ali će trebati vremena i novca.

Međutim, tehnologija pretvaranja teksta u glazbu već je dostupna, tako da možete grupno generirati albume tako da isključite "upit za unos" za "napišite skriptu s nasumičnim upitom". Čini se da umjetnici više nisu potrebni.

Pročitajte još povezanih vijesti:

Izjava o odricanju od odgovornosti

U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.

O autoru

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Više članaka
Damir Yalalov
Damir Yalalov

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Institucionalni apetit raste prema Bitcoin ETF-ovima usred volatilnosti

Objave putem 13F prijava otkrivaju značajne institucionalne ulagače koji se upuštaju u Bitcoin ETF-ove, naglašavajući sve veće prihvaćanje ...

Znati više

Stiže dan izricanja presude: CZ-ova sudbina visi na ravnoteži dok američki sud razmatra izjavu DOJ-a

Changpeng Zhao danas će se suočiti s kaznom na američkom sudu u Seattleu.

Znati više
Pridružite se našoj zajednici inovativnih tehnologija
opširnije
Čitaj više
Injective udružuje snage s AltLayerom kako bi unio sigurnost ponovnog postavljanja na inEVM
posao Vijesti Tehnologija
Injective udružuje snage s AltLayerom kako bi unio sigurnost ponovnog postavljanja na inEVM
Neka 3, 2024
Masa se udružuje s Tellerom kako bi uveli MASA Lending Pool, omogućujući USDC posuđivanje na bazi
tržišta Vijesti Tehnologija
Masa se udružuje s Tellerom kako bi uveli MASA Lending Pool, omogućujući USDC posuđivanje na bazi
Neka 3, 2024
Velodrome lansira Superchain Beta verziju u nadolazećim tjednima i proširuje se na OP Stack Layer 2 Blockchains
tržišta Vijesti Tehnologija
Velodrome lansira Superchain Beta verziju u nadolazećim tjednima i proširuje se na OP Stack Layer 2 Blockchains
Neka 3, 2024
CARV najavljuje partnerstvo s Aethirom za decentralizaciju svog podatkovnog sloja i distribuciju nagrada
posao Vijesti Tehnologija
CARV najavljuje partnerstvo s Aethirom za decentralizaciju svog podatkovnog sloja i distribuciju nagrada
Neka 3, 2024
CRYPTOMERIA LABS PTE. LTD.