Novinky Technika
15. března 2023

Nový model umělé inteligence syntetizuje realistickou řeč pomocí YouTube a podcastů

Stručně

Výzkumníci z Carnegie Mellon University vytvořili nový model umělé inteligence, který je schopen generovat realistickou řeč učením se z videí na YouTube a podcasty.

Model se dokázal naučit nuance přirozených řečových vzorů poslechem téměř 900 hodin obsahu YouTube a podcastů, což vedlo k realističtějšímu a věrnějšímu syntetickému hlasu.

Vědci z Carnegie Mellon University v USA vytvořili nový model umělé inteligence, který je schopen generovat realistickou řeč učením se z videí a podcastů YouTube. Model je schopen produkovat řeč v různých hlasech a akcentech, což z něj činí potenciálně užitečný nástroj pro průmyslová odvětví, jako je zábava a reklama. Mohlo by to mít také důsledky pro ty, kteří při komunikaci spoléhají na pomocnou technologii.

Nový model umělé inteligence syntetizuje realistickou řeč pomocí YouTube a podcastů
Model AI je schopen s vysokou přesností napodobovat vzorce lidské řeči a intonaci.

Jde o významný pokrok, protože bylo zjištěno, že většina řeči generované umělou inteligencí je bez emocí a monotónní, protože je obvykle trénována na souborech dat, kde je zaznamenávána řeč profesionálních herců. Nová technologie může být použita ke zlepšení výkonu virtuálních asistentů a chatbotů, díky čemuž jsou poutavější a připomínají lidi. Má také potenciální uplatnění v oblastech, jako jsou hry, vzdělávání a zábava.

Čtěte více: 15 nejlepších krypto podcastů, které musíte poslouchat v roce 2023

Nový model se však dokázal naučit nuance přirozených řečových vzorů, jako jsou pauzy, citoslovce a parazitní slova, díky poslechu téměř 900 hodin obsahu na YouTube a podcastu. To vedlo k realističtějšímu a živějšímu syntetickému hlasu, který byl ohodnocen 3.89 na pětibodové škále lidmi, kteří byli požádáni o jeho hodnocení. To je vyšší než průměrné skóre získané podobnými modely AI (skutečný lidský hlas skóroval 4.01).

Potenciální aplikace této technologie jsou rozsáhlé a zahrnují pomoc lidem s poruchami řeči, zlepšování navigačních systémů a vytváření přirozeněji znějících virtuálních asistentů.

  • PodcastAI je vůbec první podcast vytvořený umělou inteligencí, který obsahuje spoof Joea Rogana, který dělá rozhovor se Stevem Jobsem. Tento podcast je vytvořen výhradně pomocí počítačových algoritmů AI. Umělá inteligence byla vycvičena pro epizodu Steva Jobse pomocí jeho biografie a jakékoli jeho internetové nahrávky, kterou bylo možné objevit. To umožnilo AI věrně obnovit jeho osobnost.

Přečtěte si další související články:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Další články
Damir Yalalov
Damir Yalalov

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Hot Stories
Připojte se k našemu zpravodaji.
Novinky

The DOGE Frenzy: Analýza nedávného nárůstu hodnoty dogecoinu (DOGE).

Odvětví kryptoměn se rychle rozrůstá a meme coiny se připravují na výrazný vzestup. Dogecoin (DOGE),...

Vědět více

Vývoj obsahu generovaného umělou inteligencí v Metaverse

Vznik generativního obsahu umělé inteligence je jedním z nejvíce fascinujících pokroků ve virtuálním prostředí...

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Nejlepší nabídky tohoto týdne, velké investice do AI, IT, Web3a kryptoměny (22-26.04)
Strávit Business Trhy Technika
Nejlepší nabídky tohoto týdne, velké investice do AI, IT, Web3a kryptoměny (22-26.04)
26. dubna 2024
Vitalik Buterin komentuje centralizaci PoW a poznamenává, že to byla dočasná fáze do PoS
Novinky Technika
Vitalik Buterin komentuje centralizaci PoW a poznamenává, že to byla dočasná fáze do PoS
26. dubna 2024
Offchain Labs odhaluje objev dvou kritických zranitelností v důkazech o podvodech OP Stack společnosti Optimism
Novinky Vývoj Technika
Offchain Labs odhaluje objev dvou kritických zranitelností v důkazech o podvodech OP Stack společnosti Optimism
26. dubna 2024
Otevřený trh společnosti Dymension pro překlenutí likvidity z RollApps eIBC se spouští v síti Mainnet
Novinky Technika
Otevřený trh společnosti Dymension pro překlenutí likvidity z RollApps eIBC se spouští v síti Mainnet 
26. dubna 2024
CRYPTOMERIA LABS PTE. LTD.