Ny AI-model syntetiserer realistisk tale ved hjælp af YouTube og podcasts
Kort sagt
Forskere fra Carnegie Mellon University har skabt en ny kunstig intelligensmodel, der er i stand til at generere realistisk tale ved at lære fra YouTube-videoer og podcasts.
Modellen var i stand til at lære nuancerne af naturlige talemønstre ved at lytte til næsten 900 timers YouTube- og podcast-indhold, hvilket resulterede i en mere realistisk og naturtro syntetisk stemme.
Forskere fra Carnegie Mellon University i USA har oprettet en ny kunstig intelligens-model, der er i stand til at generere realistisk tale ved at lære af YouTube-videoer og podcasts. Modellen er i stand til at producere tale i en række forskellige stemmer og accenter, hvilket gør den til et potentielt nyttigt værktøj til industrier som underholdning og reklame. Det kan også have konsekvenser for dem, der er afhængige af hjælpeteknologi til at kommunikere.
Dette er en væsentlig udvikling, da størstedelen af AI-genereret tale har vist sig at være følelsesløs og monoton på grund af det faktum, at den normalt trænes på datasæt, hvor professionelle skuespilleres tale optages. Den nye teknologi kan bruges til at forbedre ydeevnen af virtuelle assistenter og chatbots, hvilket gør dem mere engagerende og menneskelignende. Det har også potentielle anvendelser inden for områder som spil, uddannelse og underholdning.
Den nye model var dog i stand til at lære nuancerne af naturlige talemønstre, såsom pauser, interjektioner og parasitære ord, ved at lytte til næsten 900 timers YouTube- og podcast-indhold. Dette resulterede i en mere realistisk og naturtro syntetisk stemme, som blev vurderet til 3.89 på en fem-punkts skala af folk, der blev bedt om at evaluere den. Dette er højere end den gennemsnitlige score modtaget af lignende AI-modeller (en ægte menneskelig stemme scorede 4.01).
De potentielle anvendelser af denne teknologi er enorme og omfatter at hjælpe mennesker med talehandicap, forbedre navigationssystemer og skabe mere naturligt klingende virtuelle assistenter.
- PodcastAI er den første podcast nogensinde produceret af AI, og byder på en spoof af Joe Rogan, der interviewer Steve Jobs. Denne podcast er udelukkende lavet af AI-computeralgoritmer. AI'en blev trænet til Steve Jobs-episoden ved at bruge både hans biografi og enhver internetoptagelse af ham, der kunne opdage. Dette gjorde det muligt for AI trofast at genskabe sin personlighed.
Læs flere relaterede artikler:
Ansvarsfraskrivelse
I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.
Om forfatteren
Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab.
Flere artiklerDamir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab.