Informe de notícies Tecnologia
Setembre 25, 2023

OpenAI'S ChatGPT Presenta una actualització important, afegeix converses de veu i xat d'imatges

En breu

OpenAI llançarà noves capacitats de veu i imatge ChatGPT durant les properes dues setmanes.

Aquestes funcions només estaran disponibles per als usuaris Plus i Enterprise.

OpenAI avui ha anunciat que llançarà noves capacitats de veu i imatge ChatGPT. Les noves funcions permetran als usuaris tenir una conversa de veu amb ChatGPT o xatejar amb el chatbot a través d'imatges.

L'anunci segueix les afirmacions dels usuaris de Reddit que van afirmar que havien tingut accés OpenAI's models i posteriorment va compartir aquesta informació a la plataforma. Redditor FeltSteam va descriure un model d'IA amb el nom de funcionament d'Arrakis, que, segons es diu, permet als usuaris "introduir qualsevol combinació de text, àudio i vídeo".

"La nova capacitat de veu està impulsada per un nou model de text a veu, capaç de generar àudio semblant a un humà a partir de només text i uns quants segons de veu de mostra", va escriure Open AI en un entrada de bloc. “Vam col·laborar amb actors de veu professionals per crear cadascuna de les veus. També fem servir Whisper, el nostre sistema de reconeixement de veu de codi obert, per transcriure les teves paraules parlades a text".

Amb les noves funcions, els usuaris poden participar en una conversa d'anada i tornada amb ChatGPT utilitzant les seves veus. També poden discutir sobre imatges amb el chatbot. Les funcions es desplegaran durant les properes dues setmanes als usuaris Plus i Enterprise.

La funció de veu arribarà a iOS i Android com a activació, mentre que la funció d'imatge estarà disponible a totes les plataformes.

Per començar a utilitzar la funció de veu, els usuaris poden dirigir-se a Configuració → Noves funcions a l'aplicació mòbil i optar per "converses de veu". A continuació, l'usuari ha de tocar el botó dels auriculars que es troba a l'extrem superior dret de la pantalla d'inici i seleccionar la seva veu preferida entre una selecció de cinc veus diferents.

Per conversar amb ChatGPT mitjançant imatges, l'usuari pot tocar el botó de la foto per capturar una imatge o seleccionar-ne una. Si utilitzeu iOS o Android, toqueu el botó més abans de continuar. A més, poden participar en discussions amb diverses imatges o utilitzar-les per guiar el chatbot.

OpenAI diu que la comprensió d'imatges es basa en el multimodal GPT-3.5 i GPT-4. Aquests models aprofiten les habilitats de raonament lingüístic per analitzar una varietat diversa de contingut visual, que inclou fotografies, captures de pantalla i documents que contenen una combinació de text i imatges.

OpenAIassociació amb Spotify

Spotify també anunciat avui la seva funció de traducció de veu impulsada per IA. La nova funció pot traduir podcasts a diferents idiomes, utilitzant la veu original del podcaster.

D'acord amb The Verge, en què es basa aquesta funció de traducció OpenAIL'eina de transcripció de veu de Whisper, que és capaç de transcriure la parla en anglès i traduir diversos idiomes a l'anglès.

Com a part del pilot, la companyia s'ha associat amb els podcasters Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons i Steven Bartlett per crear traduccions de veu basades en IA en idiomes com l'espanyol, el francès i l'alemany per a episodis de catàleg específics i propers. llançaments.

"Creiem que un enfocament reflexiu de la IA pot ajudar a construir connexions més profundes entre els oients i els creadors, un component clau de la missió de Spotify per desbloquejar el potencial de la creativitat humana", va dir Ziad Sultan, vicepresident de personalització de Spotify, en un comunicat.

Els episodis traduïts per veu dels creadors pilot estaran disponibles a tot el món per als usuaris Premium i Free.

renúncia

En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.

About The Autor

Cindy és periodista a Metaverse Post, tractant temes relacionats amb web3, NFT, metavers i IA, amb un focus en les entrevistes amb Web3 actors del sector. Ha parlat amb més de 30 executius de nivell C i comptant, aportant els seus valuosos coneixements als lectors. Cindy, originària de Singapur, ara té la seu a Tbilisi, Geòrgia. Té una llicenciatura en Comunicació i Estudis de Mitjans de Comunicació per la Universitat d'Austràlia Meridional i té una dècada d'experiència en periodisme i escriptura. Posa't en contacte amb ella via [protegit per correu electrònic] amb presentacions de premsa, anuncis i oportunitats d'entrevistes.

més articles
Cindy Tan
Cindy Tan

Cindy és periodista a Metaverse Post, tractant temes relacionats amb web3, NFT, metavers i IA, amb un focus en les entrevistes amb Web3 actors del sector. Ha parlat amb més de 30 executius de nivell C i comptant, aportant els seus valuosos coneixements als lectors. Cindy, originària de Singapur, ara té la seu a Tbilisi, Geòrgia. Té una llicenciatura en Comunicació i Estudis de Mitjans de Comunicació per la Universitat d'Austràlia Meridional i té una dècada d'experiència en periodisme i escriptura. Posa't en contacte amb ella via [protegit per correu electrònic] amb presentacions de premsa, anuncis i oportunitats d'entrevistes.

Hot Stories
Uneix-te al nostre butlletí.
Últimes notícies

De Ripple a The Big Green DAO: com els projectes de criptomoneda contribueixen a la caritat

Explorem iniciatives que aprofitin el potencial de les monedes digitals per a causes benèfiques.

saber Més

AlphaFold 3, Med-Gemini i altres: la manera com la IA transforma l'assistència sanitària el 2024

La IA es manifesta de diverses maneres en l'assistència sanitària, des de descobrir noves correlacions genètiques fins a potenciar els sistemes quirúrgics robòtics...

saber Més
Uneix-te a la nostra comunitat tecnològica innovadora
Més...
Llegeix més
De Ripple a The Big Green DAO: com els projectes de criptomoneda contribueixen a la caritat
Anàlisi Cripto Wiki Negocis Educació Estil de vida mercats Software Tecnologia
De Ripple a The Big Green DAO: com els projectes de criptomoneda contribueixen a la caritat
Pot 13, 2024
AlphaFold 3, Med-Gemini i altres: la manera com la IA transforma l'assistència sanitària el 2024
AI Wiki Anàlisi Resum Opinió Negocis mercats Informe de notícies Software Històries i ressenyes Tecnologia
AlphaFold 3, Med-Gemini i altres: la manera com la IA transforma l'assistència sanitària el 2024
Pot 13, 2024
La xarxa Nim llançarà el marc de tokenització de la propietat de l'IA i duu a terme una venda de rendiment amb una data d'instantània programada per al maig
mercats Informe de notícies Tecnologia
La xarxa Nim llançarà el marc de tokenització de la propietat de l'IA i duu a terme una venda de rendiment amb una data d'instantània programada per al maig
Pot 13, 2024
Binance s'associa amb l'Argentina per combatre el cibercrim
Opinió Negocis mercats Informe de notícies Software Tecnologia
Binance s'associa amb l'Argentina per combatre el cibercrim
Pot 13, 2024
CRYPTOMERIA LABS PTE. LTD.