Nachrichtenbericht Technologie
25. September 2023

OpenAI ChatGPT Stellt ein großes Upgrade vor und fügt Sprachkonversation und Bild-Chat hinzu

In Kürze

OpenAI wird neue Sprach- und Bildfunktionen einführen ChatGPT in den nächsten zwei wochen.

Diese Funktionen stehen nur Plus- und Enterprise-Benutzern zur Verfügung.

OpenAI gab heute die Einführung neuer Sprach- und Bildfunktionen bekannt ChatGPT. Die neuen Funktionen ermöglichen Benutzern eine Sprachkonversation mit ChatGPT oder chatten Sie mit dem Chatbot über Bilder.

Die Ankündigung folgt den Behauptungen von Reddit-Benutzern, die behaupteten, sie hätten sich Zugriff verschafft OpenAI's Modelle und teilte diese Informationen anschließend auf der Plattform. Redditor FeltSteam beschrieb ein KI-Modell mit dem Arbeitsnamen Arrakis, das es Benutzern angeblich ermöglicht, „jede Kombination aus Text, Audio und Video einzugeben“.

„Die neue Sprachfunktion basiert auf einem neuen Text-to-Speech-Modell, das in der Lage ist, menschenähnliche Audiodaten nur aus Text und einigen Sekunden Beispielsprache zu erzeugen“, schrieb Open AI in einem Blog-Post. „Wir haben mit professionellen Synchronsprechern zusammengearbeitet, um jede einzelne Stimme zu erstellen. Wir nutzen außerdem Whisper, unser Open-Source-Spracherkennungssystem, um Ihre gesprochenen Worte in Text umzuwandeln.“

Mit den neuen Funktionen können Benutzer ein Hin- und Her-Gespräch führen ChatGPT ihre Stimmen nutzen. Sie können auch mit dem Chatbot über Bilder diskutieren. Die Funktionen werden in den nächsten zwei Wochen für Plus- und Enterprise-Benutzer bereitgestellt.

Die Sprachfunktion wird optional für iOS und Android verfügbar sein, während die Bildfunktion auf allen Plattformen verfügbar sein wird.

Um die Sprachfunktion zu nutzen, können Benutzer in der mobilen App zu Einstellungen → Neue Funktionen gehen und „Sprachgespräche“ auswählen. Als nächstes sollte der Benutzer auf die Kopfhörertaste in der oberen rechten Ecke des Startbildschirms tippen und aus fünf verschiedenen Stimmen seine bevorzugte Stimme auswählen.

Zum Gespräch ChatGPT Beim Durchsuchen von Bildern kann der Benutzer auf die Fotoschaltfläche tippen, um entweder ein Bild aufzunehmen oder eines auszuwählen. Wenn Sie iOS oder Android verwenden, tippen Sie auf die Plus-Schaltfläche, bevor Sie fortfahren. Darüber hinaus können sie mit mehreren Bildern an Diskussionen teilnehmen oder diese als Anleitung für den Chatbot verwenden.

OpenAI sagt, dass das Bildverständnis durch Multimodalität unterstützt wird GPT-3.5 und GPT-4. Diese Modelle nutzen die Fähigkeiten des sprachlichen Denkens, um eine Vielzahl visueller Inhalte zu analysieren, darunter Fotos, Screenshots und Dokumente, die eine Kombination aus Text und Bildern enthalten.

OpenAI's Partnerschaft mit Spotify

Spotify auch gab heute bekannt, seine KI-gestützte Sprachübersetzungsfunktion. Mit der neuen Funktion können Podcasts unter Verwendung der Originalstimme des Podcasters in verschiedene Sprachen übersetzt werden.

Laut The Verge, auf der diese Übersetzungsfunktion basiert OpenAIWhisper, das Sprachtranskriptionstool von , das in der Lage ist, englische Sprache zu transkribieren und verschiedene Sprachen ins Englische zu übersetzen.

Im Rahmen des Pilotprojekts hat sich das Unternehmen mit den Podcastern Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons und Steven Bartlett zusammengetan, um KI-gesteuerte Sprachübersetzungen in Sprachen wie Spanisch, Französisch und Deutsch für bestimmte und kommende Katalogepisoden zu erstellen Veröffentlichungen.

„Wir glauben, dass ein durchdachter Ansatz für KI dazu beitragen kann, tiefere Verbindungen zwischen Hörern und Schöpfern aufzubauen, eine Schlüsselkomponente der Mission von Spotify, das Potenzial menschlicher Kreativität zu erschließen“, sagte Ziad Sultan, Vizepräsident für Personalisierung bei Spotify, in einer Erklärung.

Sprachübersetzte Episoden von Pilot-Erstellern werden weltweit für Premium- und Free-Benutzer verfügbar sein.

Haftungsausschluss

Im Einklang mit der Richtlinien des Trust-ProjektsBitte beachten Sie, dass die auf dieser Seite bereitgestellten Informationen nicht als Rechts-, Steuer-, Anlage-, Finanz- oder sonstige Beratung gedacht sind und nicht als solche interpretiert werden sollten. Es ist wichtig, nur so viel zu investieren, wie Sie sich leisten können, zu verlieren, und im Zweifelsfall eine unabhängige Finanzberatung einzuholen. Für weitere Informationen empfehlen wir einen Blick auf die Allgemeinen Geschäftsbedingungen sowie die Hilfe- und Supportseiten des Herausgebers oder Werbetreibenden. MetaversePost ist einer genauen, unvoreingenommenen Berichterstattung verpflichtet, die Marktbedingungen können sich jedoch ohne Vorankündigung ändern.

Über den Autor

Cindy ist Journalistin bei Metaverse Post, behandelt Themen im Zusammenhang mit web3, NFT, Metaverse und KI, mit Schwerpunkt auf Interviews mit Web3 Akteure der Branche. Sie hat mit über 30 C-Level-Führungskräften gesprochen, Tendenz steigend, und ihre wertvollen Erkenntnisse an die Leser weitergegeben. Cindy stammt ursprünglich aus Singapur und lebt heute in Tiflis, Georgien. Sie hat einen Bachelor-Abschluss in Kommunikations- und Medienwissenschaften von der University of South Australia und verfügt über ein Jahrzehnt Erfahrung im Journalismus und Schreiben. Kontaktieren Sie sie über [E-Mail geschützt] mit Pressegesprächen, Ankündigungen und Interviewmöglichkeiten.

Weitere Artikel
Cindy Tan
Cindy Tan

Cindy ist Journalistin bei Metaverse Post, behandelt Themen im Zusammenhang mit web3, NFT, Metaverse und KI, mit Schwerpunkt auf Interviews mit Web3 Akteure der Branche. Sie hat mit über 30 C-Level-Führungskräften gesprochen, Tendenz steigend, und ihre wertvollen Erkenntnisse an die Leser weitergegeben. Cindy stammt ursprünglich aus Singapur und lebt heute in Tiflis, Georgien. Sie hat einen Bachelor-Abschluss in Kommunikations- und Medienwissenschaften von der University of South Australia und verfügt über ein Jahrzehnt Erfahrung im Journalismus und Schreiben. Kontaktieren Sie sie über [E-Mail geschützt] mit Pressegesprächen, Ankündigungen und Interviewmöglichkeiten.

Hot Stories
Abonnieren Sie unseren Newsletter.
Aktuelles

Von Ripple zum Big Green DAO: Wie Kryptowährungsprojekte zur Wohltätigkeit beitragen

Lassen Sie uns Initiativen erkunden, die das Potenzial digitaler Währungen für wohltätige Zwecke nutzen.

Weitere Informationen

AlphaFold 3, Med-Gemini und andere: Die Art und Weise, wie KI das Gesundheitswesen im Jahr 2024 verändert

KI manifestiert sich im Gesundheitswesen auf verschiedene Weise, von der Aufdeckung neuer genetischer Zusammenhänge bis hin zur Stärkung robotergestützter chirurgischer Systeme ...

Weitere Informationen
Treten Sie unserer innovativen Tech-Community bei
Weiterlesen
Lesen Sie weiter
Die 10 besten kostenlosen KI-Tools für die Erstellung von Inhalten, Videobearbeitung und mehr
AI Wiki Digest Bildungswesen Lifestyle Software Technologie
Die 10 besten kostenlosen KI-Tools für die Erstellung von Inhalten, Videobearbeitung und mehr
14. Mai 2024
Hong Kong Securities Commission warnt vor Deepfake-Betrügereien, die auf die Kryptoindustrie abzielen: Auswirkungen auf die Anlegersicherheit
Lifestyle Sicherheit Wiki Software Geschichten und Rezensionen Technologie
Hong Kong Securities Commission warnt vor Deepfake-Betrügereien, die auf die Kryptoindustrie abzielen: Auswirkungen auf die Anlegersicherheit
14. Mai 2024
Ripple und Evmos arbeiten bei der Entwicklung der EVM-Sidechain für XRP Ledger mit EvmOS-Technologie zusammen
Geschäft Nachrichtenbericht Technologie
Ripple und Evmos arbeiten bei der Entwicklung der EVM-Sidechain für XRP Ledger mit EvmOS-Technologie zusammen
14. Mai 2024
5ireChain initiiert „Testnet Thunder: GA“ mit Anreizen für Netzwerk-Stresstests und lädt Benutzer zur Teilnahme ein Airdrop Belohnung
Nachrichtenbericht Technologie
5ireChain initiiert „Testnet Thunder: GA“ mit Anreizen für Netzwerk-Stresstests und lädt Benutzer zur Teilnahme ein Airdrop Belohnung
14. Mai 2024