Ang Bagong AI Model ay Nag-synthesize ng Makatotohanang Pagsasalita Gamit ang YouTube at Mga Podcast
Sa madaling sabi
Ang mga mananaliksik mula sa Carnegie Mellon University ay lumikha ng isang bagong modelo ng artificial intelligence na nakakagawa ng makatotohanang pananalita sa pamamagitan ng pag-aaral mula sa mga video sa YouTube at podcast.
Natutunan ng modelo ang mga nuances ng natural na mga pattern ng pagsasalita sa pamamagitan ng pakikinig sa halos 900 oras ng nilalaman ng YouTube at podcast, na nagreresulta sa isang mas makatotohanan at parang buhay na sintetikong boses.
Mga mananaliksik mula sa Carnegie Mellon University sa USA ginawa isang bagong modelo ng artificial intelligence na nakakagawa ng makatotohanang pananalita sa pamamagitan ng pag-aaral mula sa mga video at podcast sa YouTube. Ang modelo ay may kakayahang gumawa ng pagsasalita sa iba't ibang boses at accent, na ginagawa itong potensyal na kapaki-pakinabang na tool para sa mga industriya tulad ng entertainment at advertising. Maaari rin itong magkaroon ng mga implikasyon para sa mga umaasa sa pantulong na teknolohiya upang makipag-usap.
Ito ay isang makabuluhang pag-unlad, dahil ang karamihan sa mga talumpati na nabuo ng AI ay napag-alamang walang emosyon at monotonous dahil sa katotohanang ito ay karaniwang sinanay sa mga dataset kung saan ang pagsasalita ng mga propesyonal na aktor ay naitala. Ang bagong teknolohiya ay maaaring gamitin upang mapabuti ang pagganap ng mga virtual na katulong at chatbot, na ginagawa silang mas nakakaengganyo at parang tao. Mayroon din itong mga potensyal na aplikasyon sa mga larangan tulad ng paglalaro, edukasyon, at libangan.
Magbasa nang higit pa: 15 Pinakamahusay na Crypto Podcast na Kailangan Mong Pakinggan sa 2023 |
Ang bagong modelo, gayunpaman, ay natutunan ang mga nuances ng natural na mga pattern ng pagsasalita, tulad ng mga pag-pause, interjections, at mga parasitiko na salita, sa pamamagitan ng pakikinig sa halos 900 oras ng nilalaman ng YouTube at podcast. Nagresulta ito sa isang mas makatotohanan at parang buhay na sintetikong boses, na na-rate na 3.89 sa limang-puntong sukat ng mga taong hinilingang suriin ito. Mas mataas ito kaysa sa average na marka na natanggap ng mga katulad na modelo ng AI (isang tunay na boses ng tao ay nakakuha ng 4.01).
Ang mga potensyal na aplikasyon ng teknolohiyang ito ay malawak at kasama ang pagtulong sa mga taong may kapansanan sa pagsasalita, pagpapabuti ng mga sistema ng nabigasyon, at paglikha ng mas natural na tunog na mga virtual assistant.
- PodcastAI ay ang unang podcast na ginawa ng AI, na nagtatampok ng spoof ni Joe Rogan na nag-interbyu kay Steve Jobs. Ang podcast na ito ay ganap na ginawa ng AI computer algorithm. Ang AI ay sinanay para sa Steve Jobs episode gamit ang kanyang talambuhay at anumang pag-record sa internet tungkol sa kanya na maaaring matuklasan. Pinahintulutan nito ang AI na matapat na muling likhain ang kanyang personalidad.
Magbasa nang higit pa mga nauugnay na artikulo:
Pagtanggi sa pananagutan
Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.
Tungkol sa Ang May-akda
Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet.
Mas marami pang artikuloSi Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet.