Nový model AI syntetizuje realistickú reč pomocou YouTube a podcastov
Stručne
Výskumníci z Carnegie Mellon University vytvorili nový model umelej inteligencie, ktorý je schopný generovať realistickú reč učením sa z videí YouTube a podcasty.
Model bol schopný naučiť sa nuansy prirodzených rečových vzorov počúvaním takmer 900 hodín obsahu YouTube a podcastov, čo viedlo k realistickejšiemu a realistickejšiemu syntetickému hlasu.
Vedci z Carnegie Mellon University v USA vytvorili nový model umelej inteligencie, ktorý je schopný generovať realistickú reč učením sa z videí a podcastov YouTube. Model je schopný produkovať reč v rôznych hlasoch a prízvukoch, čo z neho robí potenciálne užitočný nástroj pre odvetvia, ako je zábava a reklama. Mohlo by to mať dôsledky aj pre tých, ktorí sa pri komunikácii spoliehajú na pomocnú technológiu.
Ide o významný pokrok, pretože sa zistilo, že väčšina reči generovanej AI je bez emócií a monotónna, pretože sa zvyčajne trénuje na súboroch údajov, v ktorých sa zaznamenáva reč profesionálnych hercov. Novú technológiu možno použiť na zlepšenie výkonu virtuálnych asistentov a chatbotov, vďaka čomu budú pútavejší a viac sa podobajú na človeka. Má tiež potenciálne aplikácie v oblastiach, ako sú hry, vzdelávanie a zábava.
Prečítajte si viac: 15 najlepších krypto podcastov, ktoré musíte počúvať v roku 2023 |
Nový model sa však dokázal naučiť nuansy prirodzených rečových vzorov, ako sú pauzy, citoslovcia a parazitné slová, počúvaním takmer 900 hodín obsahu YouTube a podcastov. Výsledkom bol realistickejší a realistickejší syntetický hlas, ktorý ľudia, ktorí boli požiadaní, aby ho ohodnotili, ohodnotili 3.89 na päťbodovej škále. To je vyššie ako priemerné skóre získané podobnými modelmi AI (skutočný ľudský hlas skóroval 4.01).
Potenciálne aplikácie tejto technológie sú rozsiahle a zahŕňajú pomoc ľuďom s poruchami reči, zlepšovanie navigačných systémov a vytváranie prirodzenejšie znejúcich virtuálnych asistentov.
- PodcastAI je vôbec prvý podcast vyrobený AI, ktorý obsahuje spoof Joea Rogana, ktorý vedie rozhovor so Stevom Jobsom. Tento podcast je tvorený výlučne počítačovými algoritmami AI. Umelá inteligencia bola vyškolená pre epizódu Steva Jobsa pomocou jeho životopisu a akejkoľvek jeho internetovej nahrávky, ktorú bolo možné objaviť. To umožnilo AI verne obnoviť jeho osobnosť.
Prečítajte si ďalšie súvisiace články:
Vylúčenie zodpovednosti
V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.
O autorovi
Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu.
Ďalšie článkyDamir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu.