Ulat sa Balita Teknolohiya
Marso 15, 2023

Ang Bagong AI Model ay Nag-synthesize ng Makatotohanang Pagsasalita Gamit ang YouTube at Mga Podcast

Sa madaling sabi

Ang mga mananaliksik mula sa Carnegie Mellon University ay lumikha ng isang bagong modelo ng artificial intelligence na nakakagawa ng makatotohanang pananalita sa pamamagitan ng pag-aaral mula sa mga video sa YouTube at podcast.

Natutunan ng modelo ang mga nuances ng natural na mga pattern ng pagsasalita sa pamamagitan ng pakikinig sa halos 900 oras ng nilalaman ng YouTube at podcast, na nagreresulta sa isang mas makatotohanan at parang buhay na sintetikong boses.

Mga mananaliksik mula sa Carnegie Mellon University sa USA ginawa isang bagong modelo ng artificial intelligence na nakakagawa ng makatotohanang pananalita sa pamamagitan ng pag-aaral mula sa mga video at podcast sa YouTube. Ang modelo ay may kakayahang gumawa ng pagsasalita sa iba't ibang boses at accent, na ginagawa itong potensyal na kapaki-pakinabang na tool para sa mga industriya tulad ng entertainment at advertising. Maaari rin itong magkaroon ng mga implikasyon para sa mga umaasa sa pantulong na teknolohiya upang makipag-usap.

Isang bagong modelo ng AI ang nagsi-synthesize ng makatotohanang pagsasalita gamit ang YouTube at mga podcast
Ang modelo ng AI ay may kakayahang gayahin ang mga pattern ng pagsasalita at intonasyon ng tao na may mataas na katumpakan.

Ito ay isang makabuluhang pag-unlad, dahil ang karamihan sa mga talumpati na nabuo ng AI ay napag-alamang walang emosyon at monotonous dahil sa katotohanang ito ay karaniwang sinanay sa mga dataset kung saan ang pagsasalita ng mga propesyonal na aktor ay naitala. Ang bagong teknolohiya ay maaaring gamitin upang mapabuti ang pagganap ng mga virtual na katulong at chatbot, na ginagawa silang mas nakakaengganyo at parang tao. Mayroon din itong mga potensyal na aplikasyon sa mga larangan tulad ng paglalaro, edukasyon, at libangan.

Magbasa nang higit pa: 15 Pinakamahusay na Crypto Podcast na Kailangan Mong Pakinggan sa 2023

Ang bagong modelo, gayunpaman, ay natutunan ang mga nuances ng natural na mga pattern ng pagsasalita, tulad ng mga pag-pause, interjections, at mga parasitiko na salita, sa pamamagitan ng pakikinig sa halos 900 oras ng nilalaman ng YouTube at podcast. Nagresulta ito sa isang mas makatotohanan at parang buhay na sintetikong boses, na na-rate na 3.89 sa limang-puntong sukat ng mga taong hinilingang suriin ito. Mas mataas ito kaysa sa average na marka na natanggap ng mga katulad na modelo ng AI (isang tunay na boses ng tao ay nakakuha ng 4.01).

Ang mga potensyal na aplikasyon ng teknolohiyang ito ay malawak at kasama ang pagtulong sa mga taong may kapansanan sa pagsasalita, pagpapabuti ng mga sistema ng nabigasyon, at paglikha ng mas natural na tunog na mga virtual assistant.

  • PodcastAI ay ang unang podcast na ginawa ng AI, na nagtatampok ng spoof ni Joe Rogan na nag-interbyu kay Steve Jobs. Ang podcast na ito ay ganap na ginawa ng AI computer algorithm. Ang AI ay sinanay para sa Steve Jobs episode gamit ang kanyang talambuhay at anumang pag-record sa internet tungkol sa kanya na maaaring matuklasan. Pinahintulutan nito ang AI na matapat na muling likhain ang kanyang personalidad.

Magbasa nang higit pa mga nauugnay na artikulo:

Pagtanggi sa pananagutan

Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.

Tungkol sa Ang May-akda

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Mas marami pang artikulo
Damir Yalalov
Damir Yalalov

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

The DOGE Frenzy: Pagsusuri sa Kamakailang Pagtaas ng Halaga ng Dogecoin (DOGE).

Ang industriya ng cryptocurrency ay mabilis na lumalawak, at ang mga meme coins ay naghahanda para sa isang makabuluhang pagtaas. Dogecoin (DOGE), ...

Malaman Higit Pa

Ang Ebolusyon ng AI-Generated Content sa Metaverse

Ang paglitaw ng generative na nilalaman ng AI ay isa sa mga pinaka-kamangha-manghang pag-unlad sa loob ng virtual na kapaligiran ...

Malaman Higit Pa
Sumali sa Aming Innovative Tech Community
Magbasa Pa
Magbasa nang higit pa
Nakumpleto ng Scroll ang Bernoulli Mainnet Upgrade, Inaasahan ang 10x na Pagbawas sa Mga Gastos sa Transaksyon
Ulat sa Balita Teknolohiya
Nakumpleto ng Scroll ang Bernoulli Mainnet Upgrade, Inaasahan ang 10x na Pagbawas sa Mga Gastos sa Transaksyon
Abril 29, 2024
Ang OKX Jumpstart ay Naglilista ng Runecoin, Nagbibigay-daan sa BTC Staking Upang Makakuha ng RUNE Token
markets Ulat sa Balita Teknolohiya
Ang OKX Jumpstart ay Naglilista ng Runecoin, Nagbibigay-daan sa BTC Staking Upang Makakuha ng RUNE Token
Abril 29, 2024
Mga Nangungunang Deal ngayong Linggo, Mga Pangunahing Pamumuhunan sa AI, IT, Web3, at Crypto (22-26.04)
Digest Negosyo markets Teknolohiya
Mga Nangungunang Deal ngayong Linggo, Mga Pangunahing Pamumuhunan sa AI, IT, Web3, at Crypto (22-26.04)
Abril 26, 2024
Mga Komento ni Vitalik Buterin Tungkol sa Sentralisasyon Ng PoW, Mga Tala na Ito ay Pansamantalang Yugto Hanggang sa PoS
Ulat sa Balita Teknolohiya
Mga Komento ni Vitalik Buterin Tungkol sa Sentralisasyon Ng PoW, Mga Tala na Ito ay Pansamantalang Yugto Hanggang sa PoS
Abril 26, 2024
CRYPTOMERIA LABS PTE. LTD.