Nieuwsverslag Technologie
25 september 2023

OpenAI's ChatGPT Onthult belangrijke upgrade, voegt spraakgesprekken en beeldchat toe

In het kort

OpenAI zal nieuwe spraak- en beeldmogelijkheden uitrollen ChatGPT gedurende de komende twee weken.

Deze functies zijn alleen beschikbaar voor Plus- en Enterprise-gebruikers.

OpenAI heeft vandaag aangekondigd dat het nieuwe spraak- en beeldmogelijkheden gaat uitrollen in ChatGPT. Met de nieuwe functies kunnen gebruikers een spraakgesprek voeren ChatGPT of chat met de chatbot via afbeeldingen.

De aankondiging volgt op beweringen van Reddit-gebruikers die beweerden toegang te hebben gekregen OpenAI's modellen en deelde deze informatie vervolgens op het platform. Redditor FeltSteam beschreef een AI-model met de werknaam Arrakis, waarmee gebruikers naar verluidt “elke combinatie van tekst, audio en video kunnen invoeren.”

“De nieuwe stemmogelijkheid wordt mogelijk gemaakt door een nieuw tekst-naar-spraakmodel, dat in staat is om mensachtige audio te genereren uit alleen tekst en een paar seconden voorbeeldspraak”, schreef Open AI in een blogpost. “We hebben samengewerkt met professionele stemacteurs om elk van de stemmen te creëren. We gebruiken ook Whisper, ons open-source spraakherkenningssysteem, om uw gesproken woorden in tekst om te zetten.”

Met de nieuwe functies kunnen gebruikers een heen-en-weer-gesprek voeren ChatGPT met behulp van hun stemmen. Ook kunnen ze met de chatbot over afbeeldingen discussiëren. De functies worden de komende twee weken uitgerold naar Plus- en Enterprise-gebruikers.

De spraakfunctie komt als opt-in naar iOS en Android, terwijl de beeldfunctie op alle platforms beschikbaar zal zijn.

Om de spraakfunctie te gaan gebruiken, kunnen gebruikers naar Instellingen → Nieuwe functies op de mobiele app gaan en 'spraakgesprekken' kiezen. Vervolgens moet de gebruiker op de koptelefoonknop in de rechterbovenhoek van het startscherm tikken en de stem van zijn voorkeur selecteren uit een selectie van vijf verschillende stemmen.

Om mee te praten ChatGPT via afbeeldingen kan de gebruiker op de fotoknop tikken om een ​​afbeelding vast te leggen of er een te selecteren. Als u iOS of Android gebruikt, tikt u op de plusknop voordat u doorgaat. Bovendien kunnen ze discussies aangaan met meerdere afbeeldingen of deze gebruiken om de chatbot te begeleiden.

OpenAI zegt dat beeldbegrip wordt aangedreven door multimodaal GPT-3.5 En GPT-4. Deze modellen maken gebruik van taalredeneringsvermogen om een ​​breed scala aan visuele inhoud te analyseren, waaronder foto's, schermafbeeldingen en documenten die een combinatie van tekst en afbeeldingen bevatten.

OpenAIsamenwerking met Spotify

Spotify ook Kondigde vandaag aan de AI-aangedreven stemvertalingsfunctie. De nieuwe functie kan podcasts in verschillende talen vertalen, waarbij gebruik wordt gemaakt van de originele stem van de podcaster.

Think The Verge, deze vertaalfunctie is afhankelijk van OpenAI's stemtranscriptietool, Whisper, die Engelse spraak kan transcriberen en verschillende talen naar het Engels kan vertalen.

Als onderdeel van de pilot heeft het bedrijf samengewerkt met podcasters Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons en Steven Bartlett om AI-gestuurde stemvertalingen te creëren in talen als Spaans, Frans en Duits voor specifieke catalogusafleveringen en komende afleveringen. releases.

“Wij geloven dat een doordachte benadering van AI kan bijdragen aan het opbouwen van diepere verbindingen tussen luisteraars en makers, een belangrijk onderdeel van Spotify’s missie om het potentieel van menselijke creativiteit te ontsluiten”, zegt Ziad Sultan, VP Personalisatie bij Spotify, in een verklaring.

Spraakvertaalde afleveringen van pilot-makers zullen wereldwijd beschikbaar zijn voor Premium- en Gratis-gebruikers.

Disclaimer

In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.

Over de auteur

Cindy is journaliste bij Metaverse Post, over onderwerpen die verband houden met web3, NFT, metaverse en AI, met een focus op interviews met Web3 spelers uit de industrie. Ze heeft met meer dan dertig leidinggevenden op C-niveau gesproken en er komen er steeds meer bij, en bracht hun waardevolle inzichten naar de lezers. Cindy komt oorspronkelijk uit Singapore en is nu gevestigd in Tbilisi, Georgië. Ze heeft een bachelordiploma in communicatie- en mediastudies van de Universiteit van Zuid-Australië en heeft tien jaar ervaring in journalistiek en schrijven. Neem contact met haar op via [e-mail beveiligd] met perspitches, aankondigingen en interviewmogelijkheden.

Meer artikelen
Cindy Tan
Cindy Tan

Cindy is journaliste bij Metaverse Post, over onderwerpen die verband houden met web3, NFT, metaverse en AI, met een focus op interviews met Web3 spelers uit de industrie. Ze heeft met meer dan dertig leidinggevenden op C-niveau gesproken en er komen er steeds meer bij, en bracht hun waardevolle inzichten naar de lezers. Cindy komt oorspronkelijk uit Singapore en is nu gevestigd in Tbilisi, Georgië. Ze heeft een bachelordiploma in communicatie- en mediastudies van de Universiteit van Zuid-Australië en heeft tien jaar ervaring in journalistiek en schrijven. Neem contact met haar op via [e-mail beveiligd] met perspitches, aankondigingen en interviewmogelijkheden.

Hot Stories
Schrijf je in op onze nieuwsbrief.
Laatste Nieuws

Van Ripple tot The Big Green DAO: hoe cryptocurrency-projecten bijdragen aan liefdadigheid

Laten we initiatieven onderzoeken die het potentieel van digitale valuta voor goede doelen benutten.

Meer weten

AlphaFold 3, Med-Gemini en anderen: de manier waarop AI de gezondheidszorg transformeert in 2024

AI manifesteert zich op verschillende manieren in de gezondheidszorg, van het blootleggen van nieuwe genetische correlaties tot het versterken van robotchirurgische systemen...

Meer weten
Sluit u aan bij onze innovatieve technologiegemeenschap
Lees meer
Lees meer
Alchemy Pay werkt samen met BounceBit om het Bitcoin Restaking-ecosysteem te ondersteunen
Business Nieuwsverslag Technologie
Alchemy Pay werkt samen met BounceBit om het Bitcoin Restaking-ecosysteem te ondersteunen
17 mei 2024
Top 5 Liquid Restaking-protocollen gebouwd bovenop EigenLayer
Verteren Markten Software Technologie
Top 5 Liquid Restaking-protocollen gebouwd bovenop EigenLayer
17 mei 2024
Magic Square onthult IDO-platform Magic Launchpad om retailtoegang te democratiseren Web3 Investeerders
Business Markten Nieuwsverslag
Magic Square onthult IDO-platform Magic Launchpad om retailtoegang te democratiseren Web3 Investeerders
17 mei 2024
Binance werkt samen met Taiwanese autoriteiten om het witwassen van cryptogeld ter waarde van $6 miljoen aan het licht te brengen
Advies Business Markten Software Technologie
Binance werkt samen met Taiwanese autoriteiten om het witwassen van cryptogeld ter waarde van $6 miljoen aan het licht te brengen
17 mei 2024