Inanunsyo ng Google AI ang First-ever Text-to-Music Generator AudioLM
Sa madaling sabi
Ang AudioLM ay maaaring makagawa ng musika sa pamamagitan lamang ng pakikinig sa mga tunog
Mubert AI na ipagpatuloy ang pagsasalita ng tao at musika ng piano
may GPT-3 at iba pa, ang ideya ng generative AI ay may magandang pagkakataon na sumulong. Natuklasan din namin ang mga konsepto ng inpainting at outpainting; Mahusay na kinukumpleto ng AI ang mga larawan habang pinapanatili ang tema at istilo. Paano ang musika?
At muli pa! Dahil ang lahat ng ito ay nakabatay sa mga modelo ng wikang AI na nagpapanatili ng kahulugan, ilang sandali lang bago mailapat ang teknolohiyang ito sa musika. At ngayon ay dumating na ang oras.
Ayon sa kamakailang pananaliksik ng Google, ang isang bagong balangkas para sa paggawa ng audio na tinatawag na AudioLM ay maaaring ituro upang lumikha ng makatotohanang pagsasalita at musika ng piano sa pamamagitan lamang ng pakikinig sa mga tunog. Dahil sa pangmatagalang pagkakapare-pareho nito at mahusay na katapatan, nahihigitan ng AudioLM ang mga naunang system at isinusulong ang paggawa ng audio gamit ang mga application sa voice synthesis at computer-assisted music.
AudioLM mula sa Google AI ay maaaring mag-extend ng acoustic passage habang pinapanatili ang "intent." Sa ngayon, sinanay na itong ipagpatuloy ang pagsasalita ng tao at musika ng piano, batay sa limitadong sample ng input data. Suriin ang sample sa ibaba.
Ang pamantayan para sa pagsasalita ay tuwiran: Ang mga tagapakinig ay hiniling na tasahin kung ang pagpapatuloy ay parang pananalita ng tao. Sa musika, natuklasan na ang "pagpapatuloy" ng seksyong ibinigay para sa input ay higit na mataas sa kalidad kaysa sa lahat ng kasalukuyang mga generator ng musika mula sa simula, tulad ng JukeBox. Sa isang mungkahi sa input, ang AI ay nagpatuloy sa musika nang mas mahusay.
Ang mga taga-rate ng tao ay nakinig sa mga sample ng audio upang kumpirmahin ang mga resulta. Natukoy nila kung naririnig nila ang isang tunay na pagpapatuloy ng boses ng tao na na-record o isang artipisyal na boses na ginawa ng AudioLM. Ang kanilang data ay nagpapahiwatig ng 51.2% na rate ng tagumpay. Bilang resulta, magiging mahirap para sa karaniwang tagapakinig na makilala ang pagitan ng pagsasalita na ginawa ng AudioLM at ang aktwal na pagsasalita ng tao.
Binabago ba ng teknolohiya ng text-to-music ang negosyo ng musika?
Isang text-to-music generator batay sa Mubert API ay inihayag kamakailan ng isa pang modelo ng AI, si Mubert. Gumagawa si Mubert ng ibang hanay ng mga tunog para sa bawat kahilingang ipapadala mo. Ang posibilidad ng pag-ulit ay talagang maliit. Ang musika ay nilikha kapag ang isang kahilingan ay ginawa; hindi ito kinukuha mula sa isang database ng mga natapos na himig. Paano tunay generative ang musikang ito ay isang karaniwang tanong.
Pinipili ang mga tunog bago likhain. Parehong naka-encode ang input prompt at ang Mubert API tag sa latent space vector ng isang transpormer neural network. Ang pinakamalapit na tag vector para sa bawat query ay pipiliin, at ang mga kasamang tag ay ipinapadala sa aming API upang lumikha ng musika. Walang neural network ang ginamit upang bumuo ng alinman sa mga tunog (hiwalay na mga loop para sa bass, lead, atbp.); lahat ng mga tunog ay ginawa ng mga musikero at sound designer.
Ang susunod na makabuluhang hakbang ni Mubert ay ang kumuha ng mga item mula sa kasalukuyang mundo, tulad ng mga larawan, pelikula, senaryo, at mga presentasyon, at lumikha ng musika ng mundo sa paligid mo.
Narito kung ano ang maaari mong makuha sa pamamagitan ng walang ingat na paglalagay ng mga text prompt sa bibig ng musikal na Mubert AI:
Ito ang unang yugto sa proseso ng pagbuo ng isang mas sopistikado at tumpak na pagbuo ng algorithm, ngunit ito ay mangangailangan ng oras at pera.
Gayunpaman, available na ang teknolohiyang text-to-music, kaya maaari kang bumuo ng mga album nang maramihan sa pamamagitan ng paglipat sa "input prompt" para sa "write a random prompt script." Mukhang hindi na kailangan ng mga artista.
Magbasa ng higit pang mga kaugnay na balita:
Pagtanggi sa pananagutan
Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.
Tungkol sa Ang May-akda
Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet.
Mas marami pang artikuloSi Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet.