Nachrichtenbericht Technologie
08. Januar 2023

VALL-E: Das neue Zero-Shot Text-to-Speech-Modell von Microsoft kann die Stimme aller in drei Sekunden duplizieren

In Kürze

Mit nur drei Sekunden Sample einer beliebigen Stimme, dem transformatorbasierten TTS-Modell VALL-E kann Sprache mit jeder Stimme erzeugen.

Dies ist ein deutlicher Fortschritt in Richtung natürlich klingender TTS-Systeme.

Microsoft hat jedoch einige Beispiele des verwendeten Modells bereitgestellt, und es ist offensichtlich, dass dies eine bedeutende Entwicklung in der TTS-Technologie darstellt.

Seit der Veröffentlichung des ersten Text-to-Speech (TTS)-Modells haben Forscher nach Möglichkeiten gesucht, die Art und Weise zu verbessern, wie diese Systeme Sprache erzeugen. Das neueste Modell von Microsoft, SENKE, ist in dieser Hinsicht ein bedeutender Schritt nach vorn.

VALL-E ist ein transformatorbasiertes TTS-Modell, das Sprache in jeder Stimme erzeugen kann, nachdem nur ein drei Sekunden langes Sample dieser Stimme gehört wurde. Dies ist eine deutliche Verbesserung gegenüber früheren Modellen, die eine viel längere Einarbeitungszeit erforderten, um eine neue Stimme zu erzeugen.

VALL-E ist eine erstaunliche technologische Leistung, die das Potenzial hat, die Art und Weise zu verändern, wie wir mit digitalen Medien interagieren.
In Verbindung stehender Artikel: Microsoft hat ein Verbreitungsmodell veröffentlicht, das einen 3D-Avatar aus einem einzelnen Foto einer Person erstellen kann

Darüber hinaus bleiben Intonation, Charisma und Stil der Stimme in der erzeugten Sprache intakt. Dies ist ein wichtiger Schritt vorwärts, um TTS-Systeme natürlicher klingen zu lassen.

Dieses Modell basiert auf einem Transformator und hat ein Dale-1-Aussehen. Nicht zu verwechseln mit dem diffusionsbasierten Dalle-2. Der Code fehlt noch. Und die Benutzer haben eine gewisse Skepsis, dass sie es veröffentlichen werden.

In Verbindung stehender Artikel: VALL-E von Microsoft scheint die gefährlichste Betrugssoftware aller Zeiten zu sein

Microsoft hat jedoch einige Beispiele des Modells in Aktion veröffentlicht, und es ist klar, dass dies ein großer Fortschritt in der TTS-Technologie ist.

Beispiel # 1:

Beispiel #2:

Beispiel # 3:

Lesen Sie mehr über KI:

Haftungsausschluss

Im Einklang mit der Richtlinien des Trust-ProjektsBitte beachten Sie, dass die auf dieser Seite bereitgestellten Informationen nicht als Rechts-, Steuer-, Anlage-, Finanz- oder sonstige Beratung gedacht sind und nicht als solche interpretiert werden sollten. Es ist wichtig, nur so viel zu investieren, wie Sie sich leisten können, zu verlieren, und im Zweifelsfall eine unabhängige Finanzberatung einzuholen. Für weitere Informationen empfehlen wir einen Blick auf die Allgemeinen Geschäftsbedingungen sowie die Hilfe- und Supportseiten des Herausgebers oder Werbetreibenden. MetaversePost ist einer genauen, unvoreingenommenen Berichterstattung verpflichtet, die Marktbedingungen können sich jedoch ohne Vorankündigung ändern.

Über den Autor

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Weitere Artikel
Damir Jalalow
Damir Jalalow

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Der Tag der Verurteilung steht vor der Tür: Das Schicksal von CZ bleibt ungewiss, während das US-Gericht den Plädoyer des DOJ prüft

Changpeng Zhao steht heute vor einer Verurteilung vor einem US-Gericht in Seattle.

Weitere Informationen

Den Gründern von Samourai Wallet wird vorgeworfen, Darknet-Deals im Wert von 2 Milliarden US-Dollar ermöglicht zu haben

Die Besorgnis der Samourai Wallet-Gründer stellt einen bemerkenswerten Rückschlag für die Branche dar und unterstreicht die anhaltende ...

Weitere Informationen
Treten Sie unserer innovativen Tech-Community bei
Weiterlesen
Lesen Sie weiter
Googles Med-Gemini ist bereit, einen Vorsprung zu verschaffen GPT-4 Mit seiner überlegenen Leistung im Gesundheitswesen
AI Wiki Aktuelles Software Technologie
Googles Med-Gemini ist bereit, einen Vorsprung zu verschaffen GPT-4 Mit seiner überlegenen Leistung im Gesundheitswesen
2. Mai 2024
Wu Jiezhuang, Mitglied des Hongkonger Legislativrats, kündigt Zivilklage gegen die Kryptowährungsbörse JPEX an
Geschäft Nachrichtenbericht Technologie
Wu Jiezhuang, Mitglied des Hongkonger Legislativrats, kündigt Zivilklage gegen die Kryptowährungsbörse JPEX an
2. Mai 2024
AltLayer tritt in die zweite Phase seiner Staking-Initiative ein und führt reALT-Token ein
Märkte Nachrichtenbericht Technologie
AltLayer tritt in die zweite Phase seiner Staking-Initiative ein und führt reALT-Token ein
2. Mai 2024
Die BNB-Kette veröffentlicht den Bericht für das erste Quartal 1 und hebt die Reduzierung ihres Wertverlusts um 2024 % hervor, während BSC TVL um 55.8 % ansteigt
Märkte Nachrichtenbericht Technologie
Die BNB-Kette veröffentlicht den Bericht für das erste Quartal 1 und hebt die Reduzierung ihres Wertverlusts um 2024 % hervor, während BSC TVL um 55.8 % ansteigt
2. Mai 2024