Ulat sa Balita
Oktubre 21, 2022

Inanunsyo ng Google AI ang First-ever Text-to-Music Generator AudioLM

Sa madaling sabi

Ang AudioLM ay maaaring makagawa ng musika sa pamamagitan lamang ng pakikinig sa mga tunog

Mubert AI na ipagpatuloy ang pagsasalita ng tao at musika ng piano

may GPT-3 at iba pa, ang ideya ng generative AI ay may magandang pagkakataon na sumulong. Natuklasan din namin ang mga konsepto ng inpainting at outpainting; Mahusay na kinukumpleto ng AI ang mga larawan habang pinapanatili ang tema at istilo. Paano ang musika?

At muli pa! Dahil ang lahat ng ito ay nakabatay sa mga modelo ng wikang AI na nagpapanatili ng kahulugan, ilang sandali lang bago mailapat ang teknolohiyang ito sa musika. At ngayon ay dumating na ang oras.

Inihayag ng Google AI ang kauna-unahang text-to-music generator na AudioLM

Ayon sa kamakailang pananaliksik ng Google, ang isang bagong balangkas para sa paggawa ng audio na tinatawag na AudioLM ay maaaring ituro upang lumikha ng makatotohanang pagsasalita at musika ng piano sa pamamagitan lamang ng pakikinig sa mga tunog. Dahil sa pangmatagalang pagkakapare-pareho nito at mahusay na katapatan, nahihigitan ng AudioLM ang mga naunang system at isinusulong ang paggawa ng audio gamit ang mga application sa voice synthesis at computer-assisted music.

Bumuo kami ng isang sistema upang makilala ang mga synthetic na tunog na ginawa ng AudioLM gamit ang parehong mga konsepto ng AI na naging batayan sa paglikha ng aming mga nakaraang modelo.

AudioLM mula sa Google AI ay maaaring mag-extend ng acoustic passage habang pinapanatili ang "intent." Sa ngayon, sinanay na itong ipagpatuloy ang pagsasalita ng tao at musika ng piano, batay sa limitadong sample ng input data. Suriin ang sample sa ibaba.

Ang pamantayan para sa pagsasalita ay tuwiran: Ang mga tagapakinig ay hiniling na tasahin kung ang pagpapatuloy ay parang pananalita ng tao. Sa musika, natuklasan na ang "pagpapatuloy" ng seksyong ibinigay para sa input ay higit na mataas sa kalidad kaysa sa lahat ng kasalukuyang mga generator ng musika mula sa simula, tulad ng JukeBox. Sa isang mungkahi sa input, ang AI ay nagpatuloy sa musika nang mas mahusay.

Inihayag ng Google AI ang kauna-unahang text-to-music generator na AudioLM

Ang mga taga-rate ng tao ay nakinig sa mga sample ng audio upang kumpirmahin ang mga resulta. Natukoy nila kung naririnig nila ang isang tunay na pagpapatuloy ng boses ng tao na na-record o isang artipisyal na boses na ginawa ng AudioLM. Ang kanilang data ay nagpapahiwatig ng 51.2% na rate ng tagumpay. Bilang resulta, magiging mahirap para sa karaniwang tagapakinig na makilala ang pagitan ng pagsasalita na ginawa ng AudioLM at ang aktwal na pagsasalita ng tao.

Binabago ba ng teknolohiya ng text-to-music ang negosyo ng musika?

Isang text-to-music generator batay sa Mubert API ay inihayag kamakailan ng isa pang modelo ng AI, si Mubert. Gumagawa si Mubert ng ibang hanay ng mga tunog para sa bawat kahilingang ipapadala mo. Ang posibilidad ng pag-ulit ay talagang maliit. Ang musika ay nilikha kapag ang isang kahilingan ay ginawa; hindi ito kinukuha mula sa isang database ng mga natapos na himig. Paano tunay generative ang musikang ito ay isang karaniwang tanong.

Binabago ba ng teknolohiya ng text-to-music ang negosyo ng musika?

Pinipili ang mga tunog bago likhain. Parehong naka-encode ang input prompt at ang Mubert API tag sa latent space vector ng isang transpormer neural network. Ang pinakamalapit na tag vector para sa bawat query ay pipiliin, at ang mga kasamang tag ay ipinapadala sa aming API upang lumikha ng musika. Walang neural network ang ginamit upang bumuo ng alinman sa mga tunog (hiwalay na mga loop para sa bass, lead, atbp.); lahat ng mga tunog ay ginawa ng mga musikero at sound designer.

Ang susunod na makabuluhang hakbang ni Mubert ay ang kumuha ng mga item mula sa kasalukuyang mundo, tulad ng mga larawan, pelikula, senaryo, at mga presentasyon, at lumikha ng musika ng mundo sa paligid mo.

Narito kung ano ang maaari mong makuha sa pamamagitan ng walang ingat na paglalagay ng mga text prompt sa bibig ng musikal na Mubert AI:

Ito ang unang yugto sa proseso ng pagbuo ng isang mas sopistikado at tumpak na pagbuo ng algorithm, ngunit ito ay mangangailangan ng oras at pera.

Gayunpaman, available na ang teknolohiyang text-to-music, kaya maaari kang bumuo ng mga album nang maramihan sa pamamagitan ng paglipat sa "input prompt" para sa "write a random prompt script." Mukhang hindi na kailangan ng mga artista.

Magbasa ng higit pang mga kaugnay na balita:

Pagtanggi sa pananagutan

Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.

Tungkol sa Ang May-akda

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Mas marami pang artikulo
Damir Yalalov
Damir Yalalov

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Ang Institutional Appetite ay Lumalaki Patungo sa Bitcoin ETFs Sa gitna ng Volatility

Ang mga pagsisiwalat sa pamamagitan ng 13F filing ay nagpapakita ng mga kilalang institusyonal na mamumuhunan na nakikipag-ugnayan sa mga Bitcoin ETF, na binibigyang-diin ang lumalaking pagtanggap ng ...

Malaman Higit Pa

Dumating na ang Araw ng Pagsentensiya: Ang Kapalaran ni CZ ay Nagbabalanse habang Isinasaalang-alang ng Korte ng US ang Panawagan ng DOJ

Si Changpeng Zhao ay handang harapin ang sentensiya sa korte ng US sa Seattle ngayon.

Malaman Higit Pa
Sumali sa Aming Innovative Tech Community
Magbasa Pa
Magbasa nang higit pa
Pinagsama-sama ng Injective ang AltLayer Upang Magdala ng Restaking Security Sa inEVM
Negosyo Ulat sa Balita Teknolohiya
Pinagsama-sama ng Injective ang AltLayer Upang Magdala ng Restaking Security Sa inEVM
Mayo 3, 2024
Nakipagtulungan ang Masa Sa Teller Upang Ipakilala ang MASA Lending Pool, Pinapagana ang USDC Borrowing On Base
markets Ulat sa Balita Teknolohiya
Nakipagtulungan ang Masa Sa Teller Upang Ipakilala ang MASA Lending Pool, Pinapagana ang USDC Borrowing On Base
Mayo 3, 2024
Inilunsad ng Velodrome ang Superchain Beta na Bersyon Sa Mga Paparating na Linggo At Lumalawak sa OP Stack Layer 2 Blockchain
markets Ulat sa Balita Teknolohiya
Inilunsad ng Velodrome ang Superchain Beta na Bersyon Sa Mga Paparating na Linggo At Lumalawak sa OP Stack Layer 2 Blockchain
Mayo 3, 2024
Inanunsyo ng CARV ang Pakikipagsosyo Sa Aethir Upang I-desentralisa ang Layer ng Data Nito At Ipamahagi ang Mga Gantimpala
Negosyo Ulat sa Balita Teknolohiya
Inanunsyo ng CARV ang Pakikipagsosyo Sa Aethir Upang I-desentralisa ang Layer ng Data Nito At Ipamahagi ang Mga Gantimpala
Mayo 3, 2024
CRYPTOMERIA LABS PTE. LTD.