Nieuwsverslag Technologie
08 januari 2023

VALL-E: het nieuwe zero-shot tekst-naar-spraakmodel van Microsoft kan de stem van iedereen in drie seconden dupliceren

In het kort

Met slechts een sample van drie seconden van elke stem, het op transformatoren gebaseerde TTS-model VAL-E kan met elke stem spraak produceren.

Dit is een belangrijke vooruitgang in de richting van natuurlijker klinkende TTS-systemen.

Microsoft heeft echter enkele voorbeelden gegeven van het gebruikte model en het is duidelijk dat dit een belangrijke ontwikkeling in de TTS-technologie vertegenwoordigt.

Sinds de release van het eerste tekst-naar-spraak (TTS)-model hebben onderzoekers gezocht naar manieren om de manier waarop deze systemen spraak genereren te verbeteren. Het nieuwste model van Microsoft, VAL-E, is in dit opzicht een belangrijke stap voorwaarts.

VALL-E is een op een transformator gebaseerd TTS-model dat spraak in elke stem kan genereren na slechts drie seconden van die stem te hebben gehoord. Dit is een aanzienlijke verbetering ten opzichte van eerdere modellen, die een veel langere trainingsperiode vereisten om een ​​nieuwe stem te genereren.

VALL-E is een verbazingwekkende technologische prestatie die de potentie heeft om de manier waarop we omgaan met digitale media te veranderen.
Gerelateerd artikel: Microsoft heeft een diffusiemodel uitgebracht dat een 3D-avatar kan bouwen op basis van een enkele foto van een persoon

Bovendien worden de intonatie, het charisma en de stijl van de stem allemaal intact gehouden in de gegenereerde spraak. Dit is een belangrijke stap voorwaarts om TTS-systemen natuurlijker te laten klinken.

Dit model is gebaseerd op een transformator en heeft een Dale-1-uiterlijk. Niet te verwarren met de op diffusie gebaseerde Dalle-2. De code ontbreekt nog. En gebruikers hebben enige scepsis dat ze het zullen plaatsen.

Gerelateerd artikel: VALL-E van Microsoft lijkt de gevaarlijkste zwendelsoftware ooit te zijn

Microsoft heeft echter een paar voorbeelden vrijgegeven van het model in actie, en het is duidelijk dat dit een grote vooruitgang is in de TTS-technologie.

Voorbeeld #1:

Voorbeeld #2:

Voorbeeld #3:

Lees meer over AI:

Disclaimer

In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.

Over de auteur

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

Meer artikelen
Damir Jalalov
Damir Jalalov

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

De dag van de veroordeling breekt aan: het lot van CZ hangt in evenwicht terwijl de Amerikaanse rechtbank het pleidooi van DOJ in overweging neemt

Changpeng Zhao staat vandaag op het punt te worden veroordeeld door een Amerikaanse rechtbank in Seattle.

Meer weten

Oprichters van Samourai Wallet beschuldigd van het faciliteren van $2 miljard aan Darknet-deals

De arrestatie van de oprichters van Samourai Wallet betekent een opmerkelijke tegenslag voor de sector en onderstreept de aanhoudende ...

Meer weten
Sluit u aan bij onze innovatieve technologiegemeenschap
Lees meer
Lees meer
Google's Med-Gemini klaar om een ​​voorsprong te geven GPT-4 Met zijn superieure prestaties in de gezondheidszorg
AI Wiki Nieuws Software Technologie
Google's Med-Gemini klaar om een ​​voorsprong te geven GPT-4 Met zijn superieure prestaties in de gezondheidszorg
2 mei 2024
Wu Jiezhuang, lid van de Wetgevende Raad van Hong Kong, dient een civiele procedure in tegen JPEX Crypto Exchange
Business Nieuwsverslag Technologie
Wu Jiezhuang, lid van de Wetgevende Raad van Hong Kong, dient een civiele procedure in tegen JPEX Crypto Exchange
2 mei 2024
AltLayer gaat de tweede fase van zijn stakingsinitiatief in en introduceert reALT-token
Markten Nieuwsverslag Technologie
AltLayer gaat de tweede fase van zijn stakingsinitiatief in en introduceert reALT-token
2 mei 2024
BNB Chain publiceert rapport over eerste kwartaal 1, waarin waardeverlies met 2024% wordt benadrukt, terwijl BSC TVL met 55.8% stijgt
Markten Nieuwsverslag Technologie
BNB Chain publiceert rapport over eerste kwartaal 1, waarin waardeverlies met 2024% wordt benadrukt, terwijl BSC TVL met 55.8% stijgt
2 mei 2024