Nieuwsverslag Technologie
15 maart 2023

Nieuw AI-model synthetiseert realistische spraak met behulp van YouTube en podcasts

In het kort

Onderzoekers van de Carnegie Mellon Universiteit hebben een nieuw kunstmatige-intelligentiemodel ontwikkeld dat realistische spraak kan genereren door te leren van YouTube-video’s en podcasts.

Het model kon de nuances van natuurlijke spraakpatronen leren door bijna 900 uur aan YouTube- en podcast-inhoud te luisteren, wat resulteerde in een meer realistische en levensechte synthetische stem.

Onderzoekers van Carnegie Mellon University in de VS hebben gecreëerd een nieuw kunstmatige-intelligentiemodel dat realistische spraak kan genereren door te leren van YouTube-video's en podcasts. Het model is in staat spraak te produceren in verschillende stemmen en accenten, waardoor het een potentieel nuttig hulpmiddel is voor industrieën zoals entertainment en reclame. Het kan ook gevolgen hebben voor degenen die afhankelijk zijn van ondersteunende technologie om te communiceren.

Een nieuw AI-model synthetiseert realistische spraak met behulp van YouTube en podcasts
Het AI-model is in staat om menselijke spraakpatronen en intonaties met hoge nauwkeurigheid na te bootsen.

Dit is een belangrijke ontwikkeling, aangezien is gebleken dat het merendeel van de door AI gegenereerde spraak emotieloos en eentonig is vanwege het feit dat het meestal wordt getraind op datasets waarin de spraak van professionele acteurs wordt opgenomen. De nieuwe technologie kan worden gebruikt om de prestaties van virtuele assistenten en chatbots te verbeteren, waardoor ze aantrekkelijker en menselijker worden. Het heeft ook potentiële toepassingen op gebieden zoals gaming, onderwijs en entertainment.

Lees verder: 15 beste crypto-podcasts waarnaar u moet luisteren in 2023

Het nieuwe model was echter in staat om de nuances van natuurlijke spraakpatronen, zoals pauzes, tussenwerpsels en parasitaire woorden, te leren door naar bijna 900 uur aan YouTube- en podcast-inhoud te luisteren. Dit resulteerde in een meer realistische en levensechte synthetische stem, die werd beoordeeld met 3.89 op een vijfpuntsschaal door mensen die werden gevraagd om het te beoordelen. Dit is hoger dan de gemiddelde score van vergelijkbare AI-modellen (een echte menselijke stem scoorde 4.01).

De potentiële toepassingen van deze technologie zijn enorm en omvatten het helpen van mensen met spraakstoornissen, het verbeteren van navigatiesystemen en het creëren van natuurlijker klinkende virtuele assistenten.

  • PodcastAI is de eerste podcast ooit geproduceerd door AI, met een parodie van Joe Rogan die Steve Jobs interviewt. Deze podcast is volledig gemaakt door AI-computeralgoritmen. De AI was getraind voor de Steve Jobs-aflevering met behulp van zowel zijn biografie als elke internetopname van hem die kon worden ontdekt. Hierdoor kon de AI zijn persoonlijkheid getrouw herscheppen.

Lees meer gerelateerde artikelen:

Disclaimer

In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.

Over de auteur

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

Meer artikelen
Damir Jalalov
Damir Jalalov

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

De DOGE Frenzy: analyse van de recente waardestijging van Dogecoin (DOGE).

De cryptocurrency-industrie breidt zich snel uit en meme-munten bereiden zich voor op een aanzienlijke opleving. Dogecoin (DOGE), ...

Meer weten

De evolutie van door AI gegenereerde inhoud in de Metaverse

De opkomst van generatieve AI-inhoud is een van de meest fascinerende ontwikkelingen binnen de virtuele omgeving...

Meer weten
Sluit u aan bij onze innovatieve technologiegemeenschap
Lees meer
Lees meer
Modulaire blockchain Sophon kondigt knooppuntverkoop aan en wijst 20% SOPH-tokenlevering toe aan knooppuntoperatoren
Business Nieuwsverslag Technologie
Modulaire blockchain Sophon kondigt knooppuntverkoop aan en wijst 20% SOPH-tokenlevering toe aan knooppuntoperatoren
19 april 2024
Wat is de toekomst voor Aleph Zero? Antoni Zolciak deelt Mainnet-updates, plannen en belangrijke partnerschappen op TOKEN2049
Interview Software Technologie
Wat is de toekomst voor Aleph Zero? Antoni Zolciak deelt Mainnet-updates, plannen en belangrijke partnerschappen op TOKEN2049
19 april 2024
MyShell lanceert AI Consumer Layer 2-netwerk met AltLayer, mogelijk gemaakt door EigenDA en optimisme
Business Technologie
MyShell lanceert AI Consumer Layer 2-netwerk met AltLayer, mogelijk gemaakt door EigenDA en optimisme
19 april 2024
New DeFi Kansen met Nimbora: compatibiliteit met Argent X- en Braavos-portefeuilles vereenvoudigt de toegang tot rendementsstrategieën in alle ketens
Interview Software Technologie
New DeFi Kansen met Nimbora: compatibiliteit met Argent X- en Braavos-portefeuilles vereenvoudigt de toegang tot rendementsstrategieën in alle ketens
19 april 2024