Nachrichtenbericht Technologie
15. März 2023

Neues KI-Modell synthetisiert realistische Sprache mithilfe von YouTube und Podcasts

In Kürze

Forscher der Carnegie Mellon University haben ein neues Modell der künstlichen Intelligenz entwickelt, das in der Lage ist, realistische Sprache zu erzeugen, indem es aus YouTube-Videos lernt Podcasts.

Das Modell konnte die Nuancen natürlicher Sprachmuster lernen, indem es sich fast 900 Stunden YouTube- und Podcast-Inhalte anhörte, was zu einer realistischeren und lebensechteren synthetischen Stimme führte.

Forscher der Carnegie Mellon University in den USA geschaffen haben ein neues künstliches Intelligenzmodell, das in der Lage ist, realistische Sprache zu erzeugen, indem es aus YouTube-Videos und Podcasts lernt. Das Modell ist in der Lage, Sprache in einer Vielzahl von Stimmen und Akzenten zu erzeugen, was es zu einem potenziell nützlichen Werkzeug für Branchen wie Unterhaltung und Werbung macht. Es könnte auch Auswirkungen auf diejenigen haben, die zur Kommunikation auf unterstützende Technologien angewiesen sind.

Ein neues KI-Modell synthetisiert mithilfe von YouTube und Podcasts realistische Sprache
Das KI-Modell ist in der Lage, menschliche Sprachmuster und Intonationen mit hoher Genauigkeit nachzuahmen.

Dies ist eine bedeutende Entwicklung, da festgestellt wurde, dass die Mehrheit der von KI generierten Sprache emotionslos und monoton ist, da sie normalerweise mit Datensätzen trainiert wird, in denen die Sprache professioneller Schauspieler aufgezeichnet wird. Die neue Technologie kann verwendet werden, um die Leistung von virtuellen Assistenten und Chatbots zu verbessern und sie ansprechender und menschenähnlicher zu machen. Es hat auch potenzielle Anwendungen in Bereichen wie Spielen, Bildung und Unterhaltung.

Mehr lesen: Die 15 besten Krypto-Podcasts, die Sie 2023 hören müssen

Das neue Modell konnte jedoch die Nuancen natürlicher Sprachmuster wie Pausen, Interjektionen und parasitäre Wörter lernen, indem es fast 900 Stunden YouTube- und Podcast-Inhalte anhörte. Dies führte zu einer realistischeren und lebensechteren synthetischen Stimme, die auf einer Fünf-Punkte-Skala von Personen, die sie bewerten sollten, mit 3.89 bewertet wurde. Dies ist höher als die durchschnittliche Punktzahl ähnlicher KI-Modelle (eine echte menschliche Stimme erzielte 4.01).

Die potenziellen Anwendungen dieser Technologie sind enorm und umfassen die Unterstützung von Menschen mit Sprachbehinderungen, die Verbesserung von Navigationssystemen und die Entwicklung natürlicher klingender virtueller Assistenten.

  • PodcastAI ist der erste jemals von AI produzierte Podcast mit einer Parodie von Joe Rogan, der Steve Jobs interviewt. Dieser Podcast wird vollständig von KI-Computeralgorithmen erstellt. Die KI wurde für die Steve-Jobs-Episode trainiert, indem sie sowohl seine Biographie als auch jede Internetaufzeichnung von ihm verwendete, die entdeckt werden konnte. Dies ermöglichte es der KI, seine Persönlichkeit originalgetreu nachzubilden.

Lesen Sie weitere verwandte Artikel:

Haftungsausschluss

Im Einklang mit der Richtlinien des Trust-ProjektsBitte beachten Sie, dass die auf dieser Seite bereitgestellten Informationen nicht als Rechts-, Steuer-, Anlage-, Finanz- oder sonstige Beratung gedacht sind und nicht als solche interpretiert werden sollten. Es ist wichtig, nur so viel zu investieren, wie Sie sich leisten können, zu verlieren, und im Zweifelsfall eine unabhängige Finanzberatung einzuholen. Für weitere Informationen empfehlen wir einen Blick auf die Allgemeinen Geschäftsbedingungen sowie die Hilfe- und Supportseiten des Herausgebers oder Werbetreibenden. MetaversePost ist einer genauen, unvoreingenommenen Berichterstattung verpflichtet, die Marktbedingungen können sich jedoch ohne Vorankündigung ändern.

Über den Autor

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Weitere Artikel
Damir Jalalow
Damir Jalalow

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Der DOGE-Raserei: Analyse des jüngsten Wertanstiegs von Dogecoin (DOGE).

Die Kryptowährungsbranche wächst rasant und Meme-Coins bereiten sich auf einen deutlichen Aufschwung vor. Dogecoin (DOGE), ...

Weitere Informationen

Die Entwicklung KI-generierter Inhalte im Metaversum

Das Aufkommen generativer KI-Inhalte ist eine der faszinierendsten Entwicklungen in der virtuellen Umgebung ...

Weitere Informationen
Treten Sie unserer innovativen Tech-Community bei
Weiterlesen
Lesen Sie weiter
Scroll schließt Bernoulli-Mainnet-Upgrade ab und rechnet mit einer 10-fachen Senkung der Transaktionskosten
Nachrichtenbericht Technologie
Scroll schließt Bernoulli-Mainnet-Upgrade ab und rechnet mit einer 10-fachen Senkung der Transaktionskosten
29. April 2024
OKX Jumpstart listet Runecoin auf und ermöglicht BTC-Einsätze, um RUNE-Tokens zu verdienen
Märkte Nachrichtenbericht Technologie
OKX Jumpstart listet Runecoin auf und ermöglicht BTC-Einsätze, um RUNE-Tokens zu verdienen
29. April 2024
Die Top-Angebote dieser Woche, große Investitionen in KI, IT, Web3, und Krypto (22-26.04)
Digest Geschäft Märkte Technologie
Die Top-Angebote dieser Woche, große Investitionen in KI, IT, Web3, und Krypto (22-26.04)
26. April 2024
Vitalik Buterin kommentiert die Zentralisierung von PoW und stellt fest, dass es sich bis zum PoS um eine vorübergehende Phase handelte
Nachrichtenbericht Technologie
Vitalik Buterin kommentiert die Zentralisierung von PoW und stellt fest, dass es sich bis zum PoS um eine vorübergehende Phase handelte
26. April 2024