Notizie Tecnologia
25 settembre 2023

OpenAI'S ChatGPT Presenta un importante aggiornamento, aggiunge la conversazione vocale e la chat di immagini

In Breve

OpenAI lancerà nuove funzionalità vocali e di immagini in ChatGPT nelle prossime due settimane.

Queste funzionalità saranno disponibili solo per gli utenti Plus ed Enterprise.

OpenAI ha annunciato oggi che lancerà nuove funzionalità vocali e di immagini in ChatGPT. Le nuove funzionalità consentiranno agli utenti di avere una conversazione vocale ChatGPT oppure chatta con il chatbot attraverso le immagini.

L'annuncio fa seguito alle affermazioni degli utenti Reddit che hanno affermato di aver ottenuto l'accesso OpenAIe successivamente hanno condiviso queste informazioni sulla piattaforma. L'utente Reddit FeltSteam ha descritto un modello di intelligenza artificiale con il nome provvisorio di Arrakis, che secondo quanto riferito consente agli utenti di "inserire qualsiasi combinazione di testo, audio e video".

"La nuova funzionalità vocale è alimentata da un nuovo modello di sintesi vocale, in grado di generare audio simile a quello umano solo da testo e pochi secondi di discorso campione", ha scritto Open AI in un post sul blog. “Abbiamo collaborato con doppiatori professionisti per creare ciascuna voce. Utilizziamo anche Whisper, il nostro sistema di riconoscimento vocale open source, per trascrivere le parole pronunciate in testo."

Con le nuove funzionalità, gli utenti possono impegnarsi in una conversazione avanti e indietro con ChatGPT usando le loro voci. Possono anche discutere delle immagini con il chatbot. Le funzionalità verranno implementate nelle prossime due settimane per gli utenti Plus ed Enterprise.

La funzionalità vocale arriverà su iOS e Android come opzione, mentre la funzionalità immagine sarà disponibile su tutte le piattaforme.

Per iniziare a utilizzare la funzione vocale, gli utenti possono andare su Impostazioni → Nuove funzionalità sull'app mobile e selezionare "conversazioni vocali". Successivamente, l'utente deve toccare il pulsante delle cuffie che si trova nell'angolo in alto a destra della schermata principale e selezionare la voce preferita da una selezione di cinque voci diverse.

Con cui conversare ChatGPT attraverso le immagini, l'utente può toccare il pulsante foto per catturare un'immagine o selezionarne una. Se utilizzi iOS o Android, tocca il pulsante più prima di procedere. Inoltre, possono partecipare a discussioni con più immagini o usarle per guidare il chatbot.

OpenAI afferma che la comprensione delle immagini è alimentata dalla multimodalità GPT-3.5 E GPT-4. Questi modelli sfruttano le capacità di ragionamento linguistico per analizzare una vasta gamma di contenuti visivi, che comprendono fotografie, schermate e documenti contenenti una combinazione di testo e immagini.

OpenAIla partnership con Spotify

Anche Spotify ha annunciato oggi la sua funzione di traduzione vocale basata sull'intelligenza artificiale. La nuova funzionalità può tradurre i podcast in diverse lingue, utilizzando la voce originale del podcaster.

Secondo La Verge, su cui si basa questa funzionalità di traduzione OpenAIlo strumento di trascrizione vocale di, Whisper, che è in grado di trascrivere il parlato inglese e tradurre varie lingue in inglese.

Nell'ambito del progetto pilota, l'azienda ha collaborato con i podcaster Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons e Steven Bartlett per creare traduzioni vocali basate sull'intelligenza artificiale in lingue come spagnolo, francese e tedesco per episodi specifici del catalogo e imminenti. rilascia.

"Crediamo che un approccio ponderato all'intelligenza artificiale possa aiutare a costruire connessioni più profonde tra ascoltatori e creatori, una componente chiave della missione di Spotify di sbloccare il potenziale della creatività umana", ha affermato in una nota Ziad Sultan, vicepresidente della personalizzazione di Spotify.

Gli episodi tradotti a voce dai creatori del progetto pilota saranno disponibili in tutto il mondo per gli utenti Premium e gratuiti.

Negazione di responsabilità

In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.

Circa l'autore

Cindy è una giornalista di Metaverse Post, che copre argomenti relativi a web3, NFT, metaverso e intelligenza artificiale, con particolare attenzione alle interviste con Web3 attori del settore. Ha parlato con oltre 30 dirigenti di livello C e oltre, portando ai lettori le loro preziose intuizioni. Originaria di Singapore, Cindy ora vive a Tbilisi, in Georgia. Ha conseguito una laurea in comunicazioni e studi sui media presso l'Università dell'Australia Meridionale e ha dieci anni di esperienza nel giornalismo e nella scrittura. Mettiti in contatto con lei tramite [email protected] con presentazioni per la stampa, annunci e opportunità di interviste.

Altri articoli
Cindy Tan
Cindy Tan

Cindy è una giornalista di Metaverse Post, che copre argomenti relativi a web3, NFT, metaverso e intelligenza artificiale, con particolare attenzione alle interviste con Web3 attori del settore. Ha parlato con oltre 30 dirigenti di livello C e oltre, portando ai lettori le loro preziose intuizioni. Originaria di Singapore, Cindy ora vive a Tbilisi, in Georgia. Ha conseguito una laurea in comunicazioni e studi sui media presso l'Università dell'Australia Meridionale e ha dieci anni di esperienza nel giornalismo e nella scrittura. Mettiti in contatto con lei tramite [email protected] con presentazioni per la stampa, annunci e opportunità di interviste.

Hot Stories
Iscriviti alla nostra newsletter.
Notizie

Da Ripple a The Big Green DAO: come i progetti di criptovaluta contribuiscono alla beneficenza

Esploriamo le iniziative che sfruttano il potenziale delle valute digitali per cause di beneficenza.

Per saperne di più

AlphaFold 3, Med-Gemini e altri: il modo in cui l'intelligenza artificiale trasforma l'assistenza sanitaria nel 2024

L'intelligenza artificiale si manifesta in vari modi nel settore sanitario, dalla scoperta di nuove correlazioni genetiche al potenziamento dei sistemi chirurgici robotici...

Per saperne di più
Unisciti alla nostra comunità tecnologica innovativa
Scopri di più
Per saperne di più
Da Ripple a The Big Green DAO: come i progetti di criptovaluta contribuiscono alla beneficenza
Analisi Crypto Wiki Affari Istruzione Stile di vita Mercati Software Tecnologia
Da Ripple a The Big Green DAO: come i progetti di criptovaluta contribuiscono alla beneficenza
13 Maggio 2024
AlphaFold 3, Med-Gemini e altri: il modo in cui l'intelligenza artificiale trasforma l'assistenza sanitaria nel 2024
AI Wiki Analisi digerire Opinione Affari Mercati Notizie Software Storie e recensioni Tecnologia
AlphaFold 3, Med-Gemini e altri: il modo in cui l'intelligenza artificiale trasforma l'assistenza sanitaria nel 2024
13 Maggio 2024
Nim Network implementerà il framework di tokenizzazione della proprietà dell'intelligenza artificiale e condurrà la vendita del rendimento con la data dello snapshot prevista per maggio
Mercati Notizie Tecnologia
Nim Network implementerà il framework di tokenizzazione della proprietà dell'intelligenza artificiale e condurrà la vendita del rendimento con la data dello snapshot prevista per maggio
13 Maggio 2024
Binance collabora con l'Argentina per combattere il crimine informatico
Opinione Affari Mercati Notizie Software Tecnologia
Binance collabora con l'Argentina per combattere il crimine informatico
13 Maggio 2024
LABORATORI DI CRITTOMERIA PTE. srl.