Google AI kuulutas välja kõigi aegade esimese teksti-muusika generaatori AudioLM
Põgusalt
AudioLM suudab muusikat toota lihtsalt helisid kuulates
Mubert AI jätkab inimkõnet ja klaverimuusikat
koos GPT-3 ja teised, generatiivse AI ideel on hea võimalus edasi liikuda. Avastasime ka mõisted inpainting ja outpainting; AI lõpetab pildid oskuslikult, säilitades samal ajal teema ja stiili. Aga muusika?
Ja veelkord! Kuna see kõik põhineb AI keelemudelitel, mis säilitavad tähenduse, oli selle tehnoloogia muusikas rakendamine vaid aja küsimus. Ja nüüd on aeg käes.
Hiljutiste Google'i uuringute kohaselt saab uut helitootmise raamistikku nimega AudioLM õpetada looma realistlikku kõnet ja klaverimuusikat lihtsalt helide kuulamise abil. Tänu oma pikaajalisele järjepidevusele ja suurepärasele täpsusele ületab AudioLM varasemaid süsteeme ja täiustab heliloomet häälsünteesi ja arvutipõhise muusika rakendustega.
AudioLM Google'i tehisintellekt võib laiendada akustilist läbipääsu, säilitades samal ajal "kavatsuse". Praeguse seisuga on seda piiratud sisendandmete valimi põhjal koolitatud jätkama inimkõnet ja klaverimuusikat. Kontrollige allolevat näidist.
Kõne kriteeriumid olid sirgjoonelised: kuulajatel paluti hinnata, kas jätk kõlab nagu inimkõne. Muusikaga avastati, et sisendiks pakutava jaotise "jätk" on kvaliteedilt palju parem kui kõik praegused nullist pärit muusikageneraatorid, nagu näiteks JukeBox. Kui sisendis on soovitus, jätkab AI muusikat tunduvalt paremini.
Inimeste hindajad kuulasid tulemuste kinnitamiseks helinäidiseid. Nad tegid kindlaks, kas nad kuulevad tõelist jätk lindistatud inimhäälele või AudioLM-i toodetud tehishäält. Nende andmed näitavad 51.2% edukuse määra. Selle tulemusena on keskmisel kuulajal raske eristada AudioLM-i toodetud kõnet tegelikust inimkõnest.
Kas tekstist muusikaks muutmise tehnoloogia muudab muusikaäri?
Tekstist muusikaks generaator, mis põhineb Muberti API teatas hiljuti teine AI mudel Mubert. Mubert loob iga teie saadetud päringu jaoks erineva helikomplekti. Korduse tõenäosus on väga väike. Muusika luuakse siis, kui esitatakse päring; seda ei tõmmata valmis lugude andmebaasist. Kui tõeliselt generatiivne see muusika on tavaline küsimus.
Helid valitakse enne loomist. Nii sisendviip kui ka Muberti API sildid on kodeeritud trafo närvivõrgu varjatud ruumivektorisse. Seejärel valitakse iga päringu jaoks lähim sildivektor ja kaasnevad sildid edastatakse muusika loomiseks meie API-le. Ühegi heli konstrueerimiseks ei kasutatud närvivõrku (eraldi silmuseid bassi, juhtmete jms jaoks); kõik helid on produtseeritud muusikute ja helikujundajate poolt.
Muberti järgmine oluline samm on võtta praegusest maailmast esemeid, nagu fotod, filmid, stsenaariumid ja esitlused, ning luua ümbritseva maailma muusika.
Siin on see, mida saate, kui panete muusikali Mubert AI hoolimatult tekstiviipasid suhu:
See on keerukama ja täpsema genereerimisalgoritmi loomise protsessi algetapp, kuid see võtab aega ja raha.
Tekstist muusikaks muutmise tehnoloogia on aga juba saadaval, nii et saate luua albumeid hulgi, lülitades välja valiku „juhusliku viipa skripti kirjutamine” välja „sisestusviiba”. Näib, et kunstnikke pole enam vaja.
Loe rohkem seotud uudiseid:
Kaebused
Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.
Umbes Autor
Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks.
Veel artikleidDamir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks.