Nachrichtenbericht Technologie
26. Juni 2023

Google stellt AudioPaLM vor, ein leistungsstarkes KI-Sprachmodell für die Sprachgenerierung

In Kürze

AudioPaLM ist ein leistungsstarkes Sprachmodell, das von entwickelt wurde Google das textbasierte und sprachbasierte Modelle für eine nahtlose Sprach- und Textverarbeitung kombiniert.

Es bewahrt paralinguistische Informationen und übertrifft bestehende Systeme bei Sprachübersetzungsaufgaben.

AudioPaLM kann akzentuierte Sprachen übersetzen und Sprachübertragungen für die Sprache-zu-Sprache-Übersetzung durchführen.

Google hat ein Sprachmodell namens vorgestellt AudioPaLM, das textbasierte und sprachbasierte Sprachmodelle kombiniert, um Sprache und Text nahtlos zu verarbeiten und zu generieren. Durch die Zusammenführung der Fähigkeiten von PaLM-2 und AudioLMAudioPaLM bietet eine einheitliche multimodale Architektur, die ein breites Anwendungsspektrum eröffnet, einschließlich Spracherkennung und Sprache-zu-Sprache-Übersetzung.

Google stellt AudioPaLM vor, ein leistungsstarkes Sprachmodell zur Sprachgenerierung
Kredit: Metaverse Post (mpost.io)

Ein bemerkenswertes Merkmal von AudioPaLM ist seine Fähigkeit, dank des Einflusses von AudioLM paralinguistische Informationen wie Sprecheridentität und Intonation zu bewahren. Gleichzeitig nutzt es das sprachliche Wissen, das in textbasierten Sprachmodellen wie PaLM-2 enthalten ist. Durch die Initialisierung von AudioPaLM mit den Gewichten eines großen Nur-Text-Sprachmodells zeichnet sich das Modell durch eine hervorragende Sprachverarbeitung aus und nutzt die umfangreichen Texttrainingsdaten, die im Vortraining verwendet werden.

Die bemerkenswerten Fähigkeiten von AudioPaLM wurden durch verschiedene Experimente demonstriert. Es hat bestehende Systeme bei Sprachübersetzungsaufgaben übertroffen und demonstriert die Fähigkeit, Zero-Shot durchzuführen Sprache-zu-Text-Übersetzung für Sprachen, die während des Trainings nicht vorkommen.

Darüber hinaus weist AudioPaLM Funktionen von auf Audio-Sprachmodelle durch die Übertragung von Stimmen zwischen Sprachen basierend auf kurzen gesprochenen Eingabeaufforderungen.

Google hat gemacht Beispiele für die Fähigkeiten von AudioPaLM zur Erkundung verfügbar. Die Fähigkeit des Modells, Sprachen mit unterschiedlichen Akzenten wie Italienisch und Deutsch zu übersetzen, hat Forscher und Benutzer gleichermaßen fasziniert. Darüber hinaus hebt es sich durch seine Kompetenz bei der Durchführung von Sprachübertragungen für die Sprach-zu-Sprache-Übersetzung von bestehenden Basislinien ab, was sowohl durch automatische Metriken als auch durch menschliche Bewerter bestätigt wird.

Das Modell ist sehr gut darin, eine Sprache von Audio zu Audio in einer anderen Sprache zu übersetzen und dabei die Stimme und Emotionen einer Person zu bewahren. Interessanterweise hat das Modell beim Übersetzen einiger Sprachen wie Italienisch und Deutsch einen auffälligen Akzent, während es beim Übersetzen anderer Sprachen, beispielsweise Französisch, mit einem perfekten amerikanischen Akzent spricht.

Das AudioPaLM-Modell mit Beispielen für Sprache-zu-Sprache-Übersetzung und automatische Spracherkennung.

Lesen Sie mehr über KI:

Haftungsausschluss

Im Einklang mit der Richtlinien des Trust-ProjektsBitte beachten Sie, dass die auf dieser Seite bereitgestellten Informationen nicht als Rechts-, Steuer-, Anlage-, Finanz- oder sonstige Beratung gedacht sind und nicht als solche interpretiert werden sollten. Es ist wichtig, nur so viel zu investieren, wie Sie sich leisten können, zu verlieren, und im Zweifelsfall eine unabhängige Finanzberatung einzuholen. Für weitere Informationen empfehlen wir einen Blick auf die Allgemeinen Geschäftsbedingungen sowie die Hilfe- und Supportseiten des Herausgebers oder Werbetreibenden. MetaversePost ist einer genauen, unvoreingenommenen Berichterstattung verpflichtet, die Marktbedingungen können sich jedoch ohne Vorankündigung ändern.

Über den Autor

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Weitere Artikel
Damir Jalalow
Damir Jalalow

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Hot Stories
Abonnieren Sie unseren Newsletter.
Aktuelles

Angesichts der Volatilität wächst der institutionelle Appetit auf Bitcoin-ETFs

Offenlegungen in 13F-Anmeldungen zeigen, dass namhafte institutionelle Anleger sich mit Bitcoin-ETFs beschäftigen, was die wachsende Akzeptanz von ... unterstreicht.

Weitere Informationen

Der Tag der Verurteilung steht vor der Tür: Das Schicksal von CZ bleibt ungewiss, während das US-Gericht den Plädoyer des DOJ prüft

Changpeng Zhao steht heute vor einer Verurteilung vor einem US-Gericht in Seattle.

Weitere Informationen
Treten Sie unserer innovativen Tech-Community bei
Weiterlesen
Lesen Sie weiter
MPost Schließt sich Branchenführern in der Kampagne „Bitcoin verdient ein Emoji“ an und unterstützt die Symbolintegration von Bitcoin auf jeder virtuellen Tastatur
Lifestyle Nachrichtenbericht Technologie
MPost Schließt sich Branchenführern in der Kampagne „Bitcoin verdient ein Emoji“ an und unterstützt die Symbolintegration von Bitcoin auf jeder virtuellen Tastatur
10. Mai 2024
Die Kryptobörse OKX listet Notcoin auf und wird am 16. Mai den Spothandel mit dem NOT-USDT-Paar einführen
Märkte Nachrichtenbericht Technologie
Die Kryptobörse OKX listet Notcoin auf und wird am 16. Mai den Spothandel mit dem NOT-USDT-Paar einführen  
10. Mai 2024
Blast startet drittes Blast-Gold-Verteilungsevent und vergibt 15 Millionen Punkte an DApps
Märkte Nachrichtenbericht Technologie
Blast startet drittes Blast-Gold-Verteilungsevent und vergibt 15 Millionen Punkte an DApps
10. Mai 2024
Espresso Systems arbeitet mit Polygon Labs zusammen, um AggLayer zur Verbesserung der Rollup-Interoperabilität zu entwickeln
Geschäft Nachrichtenbericht Technologie
Espresso Systems arbeitet mit Polygon Labs zusammen, um AggLayer zur Verbesserung der Rollup-Interoperabilität zu entwickeln
9. Mai 2024