Novinová správa Technológia
March 15, 2023

Nový model AI syntetizuje realistickú reč pomocou YouTube a podcastov

Stručne

Výskumníci z Carnegie Mellon University vytvorili nový model umelej inteligencie, ktorý je schopný generovať realistickú reč učením sa z videí YouTube a podcasty.

Model bol schopný naučiť sa nuansy prirodzených rečových vzorov počúvaním takmer 900 hodín obsahu YouTube a podcastov, čo viedlo k realistickejšiemu a realistickejšiemu syntetickému hlasu.

Vedci z Carnegie Mellon University v USA vytvorili nový model umelej inteligencie, ktorý je schopný generovať realistickú reč učením sa z videí a podcastov YouTube. Model je schopný produkovať reč v rôznych hlasoch a prízvukoch, čo z neho robí potenciálne užitočný nástroj pre odvetvia, ako je zábava a reklama. Mohlo by to mať dôsledky aj pre tých, ktorí sa pri komunikácii spoliehajú na pomocnú technológiu.

Nový model AI syntetizuje realistickú reč pomocou YouTube a podcastov
Model AI je schopný s vysokou presnosťou napodobňovať vzorce ľudskej reči a intonácie.

Ide o významný pokrok, pretože sa zistilo, že väčšina reči generovanej AI je bez emócií a monotónna, pretože sa zvyčajne trénuje na súboroch údajov, v ktorých sa zaznamenáva reč profesionálnych hercov. Novú technológiu možno použiť na zlepšenie výkonu virtuálnych asistentov a chatbotov, vďaka čomu budú pútavejší a viac sa podobajú na človeka. Má tiež potenciálne aplikácie v oblastiach, ako sú hry, vzdelávanie a zábava.

Prečítajte si viac: 15 najlepších krypto podcastov, ktoré musíte počúvať v roku 2023

Nový model sa však dokázal naučiť nuansy prirodzených rečových vzorov, ako sú pauzy, citoslovcia a parazitné slová, počúvaním takmer 900 hodín obsahu YouTube a podcastov. Výsledkom bol realistickejší a realistickejší syntetický hlas, ktorý ľudia, ktorí boli požiadaní, aby ho ohodnotili, ohodnotili 3.89 na päťbodovej škále. To je vyššie ako priemerné skóre získané podobnými modelmi AI (skutočný ľudský hlas skóroval 4.01).

Potenciálne aplikácie tejto technológie sú rozsiahle a zahŕňajú pomoc ľuďom s poruchami reči, zlepšovanie navigačných systémov a vytváranie prirodzenejšie znejúcich virtuálnych asistentov.

  • PodcastAI je vôbec prvý podcast vyrobený AI, ktorý obsahuje spoof Joea Rogana, ktorý vedie rozhovor so Stevom Jobsom. Tento podcast je tvorený výlučne počítačovými algoritmami AI. Umelá inteligencia bola vyškolená pre epizódu Steva Jobsa pomocou jeho životopisu a akejkoľvek jeho internetovej nahrávky, ktorú bolo možné objaviť. To umožnilo AI verne obnoviť jeho osobnosť.

Prečítajte si ďalšie súvisiace články:

Vylúčenie zodpovednosti

V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.

O autorovi

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Ďalšie články
Damir Yalalov
Damir Yalalov

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Hot Stories
Pridajte sa k nášmu newsletteru.
Novinky

DOGE Frenzy: Analýza nedávneho nárastu hodnoty dogecoinu (DOGE).

Odvetvie kryptomien sa rýchlo rozširuje a meme coiny sa pripravujú na výrazný vzostup. Dogecoin (DOGE),...

vedieť viac

Vývoj obsahu generovaného AI v Metaverse

Vznik generatívneho obsahu AI je jedným z najfascinujúcejších objavov vo virtuálnom prostredí...

vedieť viac
Pripojte sa k našej komunite inovatívnych technológií
Čítaj viac
Čítaj viac
Scroll dokončuje upgrade siete Bernoulli Mainnet, očakáva 10-násobné zníženie transakčných nákladov
Novinová správa Technológia
Scroll dokončuje upgrade siete Bernoulli Mainnet, očakáva 10-násobné zníženie transakčných nákladov
Apríla 29, 2024
OKX Jumpstart uvádza Runecoiny, umožňuje stávkovanie BTC na získanie žetónov RUNE
trhy Novinová správa Technológia
OKX Jumpstart uvádza Runecoiny, umožňuje stávkovanie BTC na získanie žetónov RUNE
Apríla 29, 2024
Najlepšie ponuky tohto týždňa, hlavné investície do AI, IT, Web3a kryptomeny (22-26.04)
výťah firmy trhy Technológia
Najlepšie ponuky tohto týždňa, hlavné investície do AI, IT, Web3a kryptomeny (22-26.04)
Apríla 26, 2024
Vitalik Buterin komentuje centralizáciu PoW a poznamenáva, že to bolo dočasné štádium až do PoS
Novinová správa Technológia
Vitalik Buterin komentuje centralizáciu PoW a poznamenáva, že to bolo dočasné štádium až do PoS
Apríla 26, 2024
CRYPTOMERIA LABS PTE. LTD.