Nyheds rapport Teknologier
Marts 15, 2023

Ny AI-model syntetiserer realistisk tale ved hjælp af YouTube og podcasts

Kort sagt

Forskere fra Carnegie Mellon University har skabt en ny kunstig intelligensmodel, der er i stand til at generere realistisk tale ved at lære fra YouTube-videoer og podcasts.

Modellen var i stand til at lære nuancerne af naturlige talemønstre ved at lytte til næsten 900 timers YouTube- og podcast-indhold, hvilket resulterede i en mere realistisk og naturtro syntetisk stemme.

Forskere fra Carnegie Mellon University i USA har oprettet en ny kunstig intelligens-model, der er i stand til at generere realistisk tale ved at lære af YouTube-videoer og podcasts. Modellen er i stand til at producere tale i en række forskellige stemmer og accenter, hvilket gør den til et potentielt nyttigt værktøj til industrier som underholdning og reklame. Det kan også have konsekvenser for dem, der er afhængige af hjælpeteknologi til at kommunikere.

En ny AI-model syntetiserer realistisk tale ved hjælp af YouTube og podcasts
AI-modellen er i stand til at efterligne menneskelige talemønstre og intonationer med høj nøjagtighed.

Dette er en væsentlig udvikling, da størstedelen af ​​AI-genereret tale har vist sig at være følelsesløs og monoton på grund af det faktum, at den normalt trænes på datasæt, hvor professionelle skuespilleres tale optages. Den nye teknologi kan bruges til at forbedre ydeevnen af ​​virtuelle assistenter og chatbots, hvilket gør dem mere engagerende og menneskelignende. Det har også potentielle anvendelser inden for områder som spil, uddannelse og underholdning.

Læs mere: 15 bedste kryptopodcasts, du skal lytte til i 2023

Den nye model var dog i stand til at lære nuancerne af naturlige talemønstre, såsom pauser, interjektioner og parasitære ord, ved at lytte til næsten 900 timers YouTube- og podcast-indhold. Dette resulterede i en mere realistisk og naturtro syntetisk stemme, som blev vurderet til 3.89 på en fem-punkts skala af folk, der blev bedt om at evaluere den. Dette er højere end den gennemsnitlige score modtaget af lignende AI-modeller (en ægte menneskelig stemme scorede 4.01).

De potentielle anvendelser af denne teknologi er enorme og omfatter at hjælpe mennesker med talehandicap, forbedre navigationssystemer og skabe mere naturligt klingende virtuelle assistenter.

  • PodcastAI er den første podcast nogensinde produceret af AI, og byder på en spoof af Joe Rogan, der interviewer Steve Jobs. Denne podcast er udelukkende lavet af AI-computeralgoritmer. AI'en blev trænet til Steve Jobs-episoden ved at bruge både hans biografi og enhver internetoptagelse af ham, der kunne opdage. Dette gjorde det muligt for AI trofast at genskabe sin personlighed.

Læs flere relaterede artikler:

Ansvarsfraskrivelse

I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.

Om forfatteren

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Flere artikler
Damir Yalalov
Damir Yalalov

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Hot Stories
Tilmeld dig vores nyhedsbrev.
Seneste Nyheder

DOGE Frenzy: Analyser Dogecoins (DOGE) seneste stigning i værdi

Kryptovalutaindustrien ekspanderer hurtigt, og meme-mønter forbereder sig på et markant opsving. Dogecoin (DOGE), ...

Vide mere

Udviklingen af ​​AI-genereret indhold i metaverset

Fremkomsten af ​​generativt AI-indhold er en af ​​de mest fascinerende udviklinger i det virtuelle miljø ...

Vide mere
Tilmeld dig vores innovative teknologifællesskab
Læs mere
Læs mere
Scroll fuldfører Bernoulli Mainnet-opgradering, forventer 10x fald i transaktionsomkostninger
Nyheds rapport Teknologier
Scroll fuldfører Bernoulli Mainnet-opgradering, forventer 10x fald i transaktionsomkostninger
April 29, 2024
OKX Jumpstart viser Runecoin, gør det muligt for BTC-indsats at tjene RUNE-poletter
Markeder Nyheds rapport Teknologier
OKX Jumpstart viser Runecoin, gør det muligt for BTC-indsats at tjene RUNE-poletter
April 29, 2024
Ugens bedste tilbud, store investeringer i AI, IT, Web3, og Crypto (22-26.04)
Fordøje Forretning Markeder Teknologier
Ugens bedste tilbud, store investeringer i AI, IT, Web3, og Crypto (22-26.04)
April 26, 2024
Vitalik Buterin kommenterer centralisering af PoW, bemærker, at det var midlertidigt indtil PoS
Nyheds rapport Teknologier
Vitalik Buterin kommenterer centralisering af PoW, bemærker, at det var midlertidigt indtil PoS
April 26, 2024