Buletin de stiri Tehnologia
25 Septembrie, 2023

OpenAI'S ChatGPT Dezvăluie o actualizare majoră, adaugă conversație vocală și chat imagine

Pe scurt

OpenAI va lansa noi capabilități de voce și imagine în ChatGPT în următoarele două săptămâni.

Aceste funcții vor fi disponibile numai pentru utilizatorii Plus și Enterprise.

OpenAI a anunțat astăzi că va lansa noi capabilități de voce și imagine în ChatGPT. Noile funcții vor permite utilizatorilor să aibă o conversație vocală cu ChatGPT sau discutați cu chatbot-ul prin imagini.

Anunțul vine după afirmațiile utilizatorilor Reddit care au susținut că au obținut acces la OpenAImodelele lui și ulterior a distribuit aceste informații pe platformă. Redditor FeltSteam a descris un model AI cu numele de funcționare Arrakis, care permite utilizatorilor să „introduce orice combinație de text, audio și video”.

„Noua capacitate de voce este alimentată de un nou model text-to-speech, capabil să genereze sunet asemănător unui om din doar text și câteva secunde de exemplu de vorbire”, a scris Open AI într-un blog. „Am colaborat cu actori vocali profesioniști pentru a crea fiecare dintre voci. De asemenea, folosim Whisper, sistemul nostru open-source de recunoaștere a vorbirii, pentru a transcrie cuvintele tale rostite în text.”

Cu noile funcții, utilizatorii se pot angaja într-o conversație dus-întors cu ChatGPT folosind vocile lor. De asemenea, ei pot discuta despre imagini cu chatbot-ul. Funcțiile vor fi lansate în următoarele două săptămâni pentru utilizatorii Plus și Enterprise.

Capacitatea de voce va veni pe iOS și Android ca opt-in, în timp ce funcția de imagine va fi disponibilă pe toate platformele.

Pentru a începe să folosească funcția vocală, utilizatorii pot merge la Setări → Funcții noi din aplicația mobilă și pot opta „conversații vocale”. Apoi, utilizatorul trebuie să atingă butonul căștilor aflat în colțul din dreapta sus al ecranului de start și să selecteze vocea preferată dintr-o selecție de cinci voci diferite.

Pentru a conversa cu ChatGPT prin intermediul imaginilor, utilizatorul poate atinge butonul fotografie pentru a captura o imagine sau pentru a selecta una. Dacă utilizați iOS sau Android, atingeți butonul plus înainte de a continua. În plus, se pot angaja în discuții cu mai multe imagini sau le pot folosi pentru a ghida chatbot-ul.

OpenAI spune că înțelegerea imaginii este alimentată de multimodal GPT-3.5 Și GPT-4. Aceste modele valorifică abilitățile de raționament lingvistic pentru a analiza o gamă variată de conținut vizual, cuprinzând fotografii, capturi de ecran și documente care conțin o combinație de text și imagini.

OpenAIparteneriatul lui cu Spotify

De asemenea, Spotify a anunțat astăzi funcția sa de traducere vocală alimentată de AI. Noua caracteristică poate traduce podcasturi în diferite limbi, utilizând vocea originală a podcasterului.

În conformitate cu Acostament, pe care se bazează această funcție de traducere OpenAIInstrumentul de transcriere vocală al lui, Whisper, care poate transcrie vorbirea în engleză și traduce diferite limbi în engleză.

Ca parte a pilotului, compania a făcut echipă cu podcasterii Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons și Steven Bartlett pentru a crea traduceri vocale bazate pe inteligență artificială în limbi precum spaniolă, franceză și germană pentru anumite episoade de catalog și viitoare. eliberează.

„Credem că o abordare atentă a inteligenței artificiale poate ajuta la construirea de conexiuni mai profunde între ascultători și creatori, o componentă cheie a misiunii Spotify de a debloca potențialul creativității umane”, a declarat Ziad Sultan, VP Personalizare la Spotify, într-un comunicat.

Episoadele traduse vocal de la creatorii pilot vor fi disponibile la nivel mondial pentru utilizatorii Premium și Free.

Declinare a responsabilităţii

În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.

Despre autor

Cindy este jurnalist la Metaverse Post, acoperind subiecte legate de web3, NFT, metavers și AI, cu accent pe interviuri cu Web3 jucători din industrie. Ea a vorbit cu peste 30 de directori de nivel C și nu mai mult, aducând cunoștințele lor valoroase cititorilor. Originară din Singapore, Cindy are acum sediul în Tbilisi, Georgia. Ea deține o diplomă de licență în Comunicații și Studii Media de la Universitatea din Australia de Sud și are un deceniu de experiență în jurnalism și scris. Luați legătura cu ea prin intermediul [e-mail protejat] cu prezentari de presă, anunțuri și oportunități de interviuri.

Mai multe articole
Cindy Tan
Cindy Tan

Cindy este jurnalist la Metaverse Post, acoperind subiecte legate de web3, NFT, metavers și AI, cu accent pe interviuri cu Web3 jucători din industrie. Ea a vorbit cu peste 30 de directori de nivel C și nu mai mult, aducând cunoștințele lor valoroase cititorilor. Originară din Singapore, Cindy are acum sediul în Tbilisi, Georgia. Ea deține o diplomă de licență în Comunicații și Studii Media de la Universitatea din Australia de Sud și are un deceniu de experiență în jurnalism și scris. Luați legătura cu ea prin intermediul [e-mail protejat] cu prezentari de presă, anunțuri și oportunități de interviuri.

Apetitul instituțional crește față de ETF-urile Bitcoin pe fondul volatilității

Dezvăluirile prin dosarele 13F dezvăluie investitori instituționali de seamă care se amestecă în ETF-uri Bitcoin, subliniind o acceptare tot mai mare a...

Aflați mai multe

Sosește ziua sentinței: soarta lui CZ este în echilibru, în timp ce tribunalul american ia în considerare pledoaria DOJ

Changpeng Zhao este pe cale de a fi condamnat astăzi într-un tribunal american din Seattle.

Aflați mai multe
Alăturați-vă comunității noastre tehnologice inovatoare
Citeste mai mult
Află mai multe
Trecerea lui Donald Trump la criptomonede: de la oponent la avocat și ce înseamnă aceasta pentru piața criptomonedelor din SUA
Afaceri pieţe Povești și recenzii Tehnologia
Trecerea lui Donald Trump la criptomonede: de la oponent la avocat și ce înseamnă aceasta pentru piața criptomonedelor din SUA
10 Mai, 2024
Layer3 va lansa tokenul L3 vara aceasta, alocand 51% din totalul aprovizionării comunității
pieţe Buletin de stiri Tehnologia
Layer3 va lansa tokenul L3 vara aceasta, alocand 51% din totalul aprovizionării comunității
10 Mai, 2024
Avertismentul final al lui Edward Snowden pentru dezvoltatorii Bitcoin: „Faceți din confidențialitate o prioritate la nivel de protocol sau riscați să o pierdeți
pieţe Securitate Wiki Software Povești și recenzii Tehnologia
Avertismentul final al lui Edward Snowden pentru dezvoltatorii Bitcoin: „Faceți din confidențialitate o prioritate la nivel de protocol sau riscați să o pierdeți
10 Mai, 2024
Ethereum Layer 2 Network Mint, alimentat de optimism, își va lansa rețeaua principală pe 15 mai
Buletin de stiri Tehnologia
Ethereum Layer 2 Network Mint, alimentat de optimism, își va lansa rețeaua principală pe 15 mai
10 Mai, 2024
CRYPTOMERIA LABS PTE. LTD.