Ulat sa Balita Teknolohiya
Enero 08, 2023

VALL-E: Ang bagong zero-shot na text-to-speech na modelo ng Microsoft ay maaaring duplicate ang boses ng lahat sa loob ng tatlong segundo

Sa madaling sabi

Sa tatlong segundong sample lang ng anumang boses, ang modelong TTS na nakabatay sa transformer Ang VALL-E ay maaaring makagawa ng pagsasalita sa bawat boses.

Ito ay isang makabuluhang pagsulong sa direksyon ng mas natural-tunog na mga TTS system.

Gayunpaman, ang Microsoft ay nagbigay ng ilang sample ng modelong ginagamit, at maliwanag na ito ay kumakatawan sa isang makabuluhang pag-unlad sa teknolohiya ng TTS.

Mula nang ilabas ang unang text-to-speech (TTS) na modelo, ang mga mananaliksik ay naghahanap ng mga paraan upang mapabuti ang paraan ng pagbuo ng pagsasalita ng mga system na ito. Ang pinakabagong modelo mula sa Microsoft, LABA, ay isang makabuluhang hakbang pasulong sa bagay na ito.

Ang VALL-E ay isang modelong TTS na nakabatay sa transformer na maaaring makabuo ng pagsasalita sa anumang boses pagkatapos lamang makarinig ng tatlong segundong sample ng boses na iyon. Ito ay isang makabuluhang pagpapabuti sa mga nakaraang modelo, na nangangailangan ng mas mahabang panahon ng pagsasanay upang makabuo ng isang bagong boses.

Ang VALL-E ay isang kamangha-manghang teknolohikal na gawa na may potensyal na baguhin ang paraan ng pakikipag-ugnayan natin sa digital media.
Kaugnay na artikulo: Naglabas ang Microsoft ng diffusion model na maaaring bumuo ng 3D avatar mula sa isang larawan ng isang tao

Bukod pa rito, ang intonasyon, karisma, at istilo ng boses ay pinananatiling buo sa nabuong pananalita. Ito ay isang mahalagang hakbang pasulong upang gawing mas natural ang mga TTS system.

Ang modelong ito ay batay sa transpormer at may hitsura ng Dale-1. Hindi dapat malito sa diffusion-based na Dalle-2. Kulang pa ang code. At ang mga gumagamit ay may ilang pag-aalinlangan na ipo-post nila ito.

Kaugnay na artikulo: Ang VALL-E ng Microsoft ay lumilitaw na ang pinaka-mapanganib na software ng scam kailanman

Gayunpaman, ang Microsoft ay naglabas ng ilang mga halimbawa ng modelo sa pagkilos, at malinaw na ito ay isang malaking pagsulong sa teknolohiya ng TTS.

Halimbawa #1:

Halimbawa #2:

Halimbawa #3:

Magbasa pa tungkol sa AI:

Pagtanggi sa pananagutan

Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.

Tungkol sa Ang May-akda

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Mas marami pang artikulo
Damir Yalalov
Damir Yalalov

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Dumating na ang Araw ng Pagsentensiya: Ang Kapalaran ni CZ ay Nagbabalanse habang Isinasaalang-alang ng Korte ng US ang Panawagan ng DOJ

Si Changpeng Zhao ay handang harapin ang sentensiya sa korte ng US sa Seattle ngayon.

Malaman Higit Pa

Ang Mga Tagapagtatag ng Samourai Wallet ay Inakusahan na Nagpapadali ng $2B sa Darknet Deals

Ang pangamba ng mga tagapagtatag ng Samourai Wallet ay kumakatawan sa isang kapansin-pansing pag-urong para sa industriya, na binibigyang-diin ang patuloy na ...

Malaman Higit Pa
Sumali sa Aming Innovative Tech Community
Magbasa Pa
Magbasa nang higit pa
Nakahanda ang Med-Gemini ng Google na Magsimula sa GPT-4 Sa Superior na Pagganap nito sa Pangangalagang Pangkalusugan
AI Wiki Balita software Teknolohiya
Nakahanda ang Med-Gemini ng Google na Magsimula sa GPT-4 Sa Superior na Pagganap nito sa Pangangalagang Pangkalusugan
Mayo 2, 2024
Ang Miyembro ng Legislative Council ng Hong Kong na si Wu Jiezhuang ay Nag-signal ng Civil Suit Laban sa JPEX Crypto Exchange
Negosyo Ulat sa Balita Teknolohiya
Ang Miyembro ng Legislative Council ng Hong Kong na si Wu Jiezhuang ay Nag-signal ng Civil Suit Laban sa JPEX Crypto Exchange
Mayo 2, 2024
Pumasok ang AltLayer sa Ikalawang Yugto ng Inisyatiba nito sa Staking, Ipinakilala ang reALT Token
markets Ulat sa Balita Teknolohiya
Pumasok ang AltLayer sa Ikalawang Yugto ng Inisyatiba nito sa Staking, Ipinakilala ang reALT Token
Mayo 2, 2024
Inilabas ng BNB Chain ang Q1 2024 na Ulat, Itinatampok ang 55.8% na Pagbawas sa Pagkawala Nito sa Halaga, Habang ang BSC TVL ay Tumataas Ng 70.8%
markets Ulat sa Balita Teknolohiya
Inilabas ng BNB Chain ang Q1 2024 na Ulat, Itinatampok ang 55.8% na Pagbawas sa Pagkawala Nito sa Halaga, Habang ang BSC TVL ay Tumataas Ng 70.8%
Mayo 2, 2024
CRYPTOMERIA LABS PTE. LTD.