Uudiste reportaaž Tehnoloogia
Märtsil 15, 2023

Uus tehisintellekti mudel sünteesib YouTube'i ja taskuhäälingusaadete abil realistlikku kõnet

Põgusalt

Carnegie Melloni ülikooli teadlased on loonud uue tehisintellekti mudeli, mis suudab YouTube'i videotest ja videotest õppides luua realistlikku kõnet. podcastid.

Mudel suutis õppida loomulike kõnemustrite nüansse, kuulates peaaegu 900 tundi YouTube'i ja taskuhäälingusaadete sisu, mille tulemuseks oli realistlikum ja elutruu sünteetiline hääl.

USA Carnegie Melloni ülikooli teadlased on loonud uus tehisintellekti mudel, mis suudab YouTube'i videotest ja taskuhäälingusaadetest õppides luua realistlikku kõnet. Mudel on võimeline tootma kõnet mitmesuguste häälte ja aktsentidega, muutes selle potentsiaalselt kasulikuks tööriistaks sellistes tööstusharudes nagu meelelahutus ja reklaam. Sellel võib olla mõju ka neile, kes suhtlemisel kasutavad abitehnoloogiat.

Uus tehisintellekti mudel sünteesib YouTube'i ja taskuhäälingusaadete abil realistlikku kõnet
AI-mudel on võimeline suure täpsusega jäljendama inimese kõnemustreid ja intonatsioone.

See on märkimisväärne areng, kuna on leitud, et suurem osa AI-ga loodud kõnest on emotsioonitu ja monotoonne, kuna seda treenitakse tavaliselt andmekogumitel, kuhu salvestatakse professionaalsete näitlejate kõne. Uut tehnoloogiat saab kasutada virtuaalsete assistentide ja vestlusrobotite jõudluse parandamiseks, muutes need kaasahaaravamaks ja inimlikumaks. Sellel on ka potentsiaalseid rakendusi sellistes valdkondades nagu mängimine, haridus ja meelelahutus.

Loe rohkem: 15 parimat krüptopodcasti, mida peate 2023. aastal kuulama

Uus mudel aga suutis õppida loomulike kõnemustrite nüansse, nagu pausid, vahelehüüded ja parasiitsõnad, kuulates ligi 900 tundi YouTube'i ja taskuhäälingusaadete sisu. Selle tulemuseks oli realistlikum ja elutruu sünteetiline hääl, mida hindama palutud inimesed hindasid viie palli skaalal 3.89. See on kõrgem kui sarnaste AI mudelite keskmine tulemus (tõeline inimhääl sai hindeks 4.01).

Selle tehnoloogia potentsiaalsed rakendused on laialdased ja hõlmavad kõnepuudega inimeste abistamist, navigatsioonisüsteemide täiustamist ja loomulikuma kõlaga virtuaalsete assistentide loomist.

  • PodcastAI on esimene tehisintellekti tehtud taskuhääling, mis sisaldab Steve Jobsi intervjueerivat Joe Roganit. See taskuhäälingusaade on tehtud täielikult AI arvutialgoritmide abil. Tehisintellekti koolitati Steve Jobsi episoodi jaoks, kasutades nii tema elulugu kui ka tema Interneti-salvestisi, mis võiksid avastada. See võimaldas tehisintellektil tema isiksust ustavalt uuesti luua.

Loe rohkem seotud artikleid:

Kaebused

Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.

Umbes Autor

Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks. 

Veel artikleid
Damir Jalalov
Damir Jalalov

Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks. 

Hot Stories
Liituge meie uudiskirjaga.
Uudised

DOGE Frenzy: Dogecoini (DOGE) hiljutise väärtuse tõusu analüüsimine

Krüptorahatööstus laieneb kiiresti ja meemmündid valmistuvad oluliseks tõusuks. Dogecoin (DOGE), ...

Rohkem teada

AI-ga loodud sisu areng metaversumis

Generatiivse AI-sisu tekkimine on üks põnevamaid arenguid virtuaalkeskkonnas ...

Rohkem teada
Liituge meie uuendusliku tehnikakogukonnaga
Loe rohkem
Loe edasi
Scroll lõpetab Bernoulli Mainnet versiooniuuenduse, eeldab tehingukulude 10-kordset vähenemist
Uudiste reportaaž Tehnoloogia
Scroll lõpetab Bernoulli Mainnet versiooniuuenduse, eeldab tehingukulude 10-kordset vähenemist
Aprill 29, 2024
OKX Kiirstart loetleb Runecoini, võimaldab BTC panustamise RUNE žetoonide teenimiseks
turud Uudiste reportaaž Tehnoloogia
OKX Kiirstart loetleb Runecoini, võimaldab BTC panustamise RUNE žetoonide teenimiseks
Aprill 29, 2024
Selle nädala parimad pakkumised, suured investeeringud tehisintellekti, IT-sse, Web3ja krüpto (22-26.04)
Digest Äri turud Tehnoloogia
Selle nädala parimad pakkumised, suured investeeringud tehisintellekti, IT-sse, Web3ja krüpto (22-26.04)
Aprill 26, 2024
Vitalik Buterin kommenteerib PoW tsentraliseerimist, märgib, et see oli ajutine etapp kuni PoS-i
Uudiste reportaaž Tehnoloogia
Vitalik Buterin kommenteerib PoW tsentraliseerimist, märgib, et see oli ajutine etapp kuni PoS-i
Aprill 26, 2024
CRYPTOMERIA LABS PTE. LTD.