Buletin de stiri Tehnologia
25 Septembrie, 2023

OpenAI'S ChatGPT Dezvăluie o actualizare majoră, adaugă conversație vocală și chat imagine

Pe scurt

OpenAI va lansa noi capabilități de voce și imagine în ChatGPT în următoarele două săptămâni.

Aceste funcții vor fi disponibile numai pentru utilizatorii Plus și Enterprise.

OpenAI a anunțat astăzi că va lansa noi capabilități de voce și imagine în ChatGPT. Noile funcții vor permite utilizatorilor să aibă o conversație vocală cu ChatGPT sau discutați cu chatbot-ul prin imagini.

Anunțul vine după afirmațiile utilizatorilor Reddit care au susținut că au obținut acces la OpenAImodelele lui și ulterior a distribuit aceste informații pe platformă. Redditor FeltSteam a descris un model AI cu numele de funcționare Arrakis, care permite utilizatorilor să „introduce orice combinație de text, audio și video”.

„Noua capacitate de voce este alimentată de un nou model text-to-speech, capabil să genereze sunet asemănător unui om din doar text și câteva secunde de exemplu de vorbire”, a scris Open AI într-un blog. „Am colaborat cu actori vocali profesioniști pentru a crea fiecare dintre voci. De asemenea, folosim Whisper, sistemul nostru open-source de recunoaștere a vorbirii, pentru a transcrie cuvintele tale rostite în text.”

Cu noile funcții, utilizatorii se pot angaja într-o conversație dus-întors cu ChatGPT folosind vocile lor. De asemenea, ei pot discuta despre imagini cu chatbot-ul. Funcțiile vor fi lansate în următoarele două săptămâni pentru utilizatorii Plus și Enterprise.

Capacitatea de voce va veni pe iOS și Android ca opt-in, în timp ce funcția de imagine va fi disponibilă pe toate platformele.

Pentru a începe să folosească funcția vocală, utilizatorii pot merge la Setări → Funcții noi din aplicația mobilă și pot opta „conversații vocale”. Apoi, utilizatorul trebuie să atingă butonul căștilor aflat în colțul din dreapta sus al ecranului de start și să selecteze vocea preferată dintr-o selecție de cinci voci diferite.

Pentru a conversa cu ChatGPT prin intermediul imaginilor, utilizatorul poate atinge butonul fotografie pentru a captura o imagine sau pentru a selecta una. Dacă utilizați iOS sau Android, atingeți butonul plus înainte de a continua. În plus, se pot angaja în discuții cu mai multe imagini sau le pot folosi pentru a ghida chatbot-ul.

OpenAI spune că înțelegerea imaginii este alimentată de multimodal GPT-3.5 Și GPT-4. Aceste modele valorifică abilitățile de raționament lingvistic pentru a analiza o gamă variată de conținut vizual, cuprinzând fotografii, capturi de ecran și documente care conțin o combinație de text și imagini.

OpenAIparteneriatul lui cu Spotify

De asemenea, Spotify a anunțat astăzi funcția sa de traducere vocală alimentată de AI. Noua caracteristică poate traduce podcasturi în diferite limbi, utilizând vocea originală a podcasterului.

În conformitate cu Acostament, pe care se bazează această funcție de traducere OpenAIInstrumentul de transcriere vocală al lui, Whisper, care poate transcrie vorbirea în engleză și traduce diferite limbi în engleză.

Ca parte a pilotului, compania a făcut echipă cu podcasterii Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons și Steven Bartlett pentru a crea traduceri vocale bazate pe inteligență artificială în limbi precum spaniolă, franceză și germană pentru anumite episoade de catalog și viitoare. eliberează.

„Credem că o abordare atentă a inteligenței artificiale poate ajuta la construirea de conexiuni mai profunde între ascultători și creatori, o componentă cheie a misiunii Spotify de a debloca potențialul creativității umane”, a declarat Ziad Sultan, VP Personalizare la Spotify, într-un comunicat.

Episoadele traduse vocal de la creatorii pilot vor fi disponibile la nivel mondial pentru utilizatorii Premium și Free.

Declinare a responsabilităţii

În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.

Despre autor

Cindy este jurnalist la Metaverse Post, acoperind subiecte legate de web3, NFT, metavers și AI, cu accent pe interviuri cu Web3 jucători din industrie. Ea a vorbit cu peste 30 de directori de nivel C și nu mai mult, aducând cunoștințele lor valoroase cititorilor. Originară din Singapore, Cindy are acum sediul în Tbilisi, Georgia. Ea deține o diplomă de licență în Comunicații și Studii Media de la Universitatea din Australia de Sud și are un deceniu de experiență în jurnalism și scris. Luați legătura cu ea prin intermediul [e-mail protejat] cu prezentari de presă, anunțuri și oportunități de interviuri.

Mai multe articole
Cindy Tan
Cindy Tan

Cindy este jurnalist la Metaverse Post, acoperind subiecte legate de web3, NFT, metavers și AI, cu accent pe interviuri cu Web3 jucători din industrie. Ea a vorbit cu peste 30 de directori de nivel C și nu mai mult, aducând cunoștințele lor valoroase cititorilor. Originară din Singapore, Cindy are acum sediul în Tbilisi, Georgia. Ea deține o diplomă de licență în Comunicații și Studii Media de la Universitatea din Australia de Sud și are un deceniu de experiență în jurnalism și scris. Luați legătura cu ea prin intermediul [e-mail protejat] cu prezentari de presă, anunțuri și oportunități de interviuri.

De la Ripple la Big Green DAO: Cum contribuie proiectele de criptomonede la caritate

Să explorăm inițiativele care valorifică potențialul monedelor digitale pentru cauze caritabile.

Aflați mai multe

AlphaFold 3, Med-Gemini și alții: modul în care AI transformă asistența medicală în 2024

Inteligența artificială se manifestă în diferite moduri în asistența medicală, de la descoperirea de noi corelații genetice până la abilitarea sistemelor chirurgicale robotizate...

Aflați mai multe
Alăturați-vă comunității noastre tehnologice inovatoare
Citeste mai mult
Află mai multe
Sophon lansează Liquidity Farming, alocând 10% din totalul ofertei de jetoane SOPH pentru a recompensa participanții
pieţe Buletin de stiri Tehnologia
Sophon lansează Liquidity Farming, alocând 10% din totalul ofertei de jetoane SOPH pentru a recompensa participanții
18 Iunie, 2024
API3 introduce Oracle Stack On Bitlayer pentru o experiență îmbunătățită a dezvoltatorilor
Buletin de stiri Tehnologia
API3 introduce Oracle Stack On Bitlayer pentru o experiență îmbunătățită a dezvoltatorilor
18 Iunie, 2024
Atenuarea poluării? Cum urmăresc foștii porci energetici ai Bitcoin să oprească criza de carbon a AI
Opinie Afaceri pieţe Software Tehnologia
Atenuarea poluării? Cum urmăresc foștii porci energetici ai Bitcoin să oprească criza de carbon a AI
18 Iunie, 2024
dForce introduce Stablecoin descentralizat sUSX pentru a câștiga randament, oferind utilizatorilor lichiditate sporită
Buletin de stiri Tehnologia
dForce introduce Stablecoin descentralizat sUSX pentru a câștiga randament, oferind utilizatorilor lichiditate sporită
18 Iunie, 2024
CRYPTOMERIA LABS PTE. LTD.