OpenAI'S ChatGPT Dezvăluie o actualizare majoră, adaugă conversație vocală și chat imagine
Pe scurt
OpenAI va lansa noi capabilități de voce și imagine în ChatGPT în următoarele două săptămâni.
Aceste funcții vor fi disponibile numai pentru utilizatorii Plus și Enterprise.
OpenAI a anunțat astăzi că va lansa noi capabilități de voce și imagine în ChatGPT. Noile funcții vor permite utilizatorilor să aibă o conversație vocală cu ChatGPT sau discutați cu chatbot-ul prin imagini.
Anunțul vine după afirmațiile utilizatorilor Reddit care au susținut că au obținut acces la OpenAImodelele lui și ulterior a distribuit aceste informații pe platformă. Redditor FeltSteam a descris un model AI cu numele de funcționare Arrakis, care permite utilizatorilor să „introduce orice combinație de text, audio și video”.
„Noua capacitate de voce este alimentată de un nou model text-to-speech, capabil să genereze sunet asemănător unui om din doar text și câteva secunde de exemplu de vorbire”, a scris Open AI într-un blog. „Am colaborat cu actori vocali profesioniști pentru a crea fiecare dintre voci. De asemenea, folosim Whisper, sistemul nostru open-source de recunoaștere a vorbirii, pentru a transcrie cuvintele tale rostite în text.”
Am găsit câteva speculații ciudate neconfirmate despre modele interne puternice pe Reddit.
— Yam Peleg (@Yampeleg) 25 Septembrie, 2023
– Vă rog să luați totul cu un grăunte de sare. –
Aparent,
Doi utilizatori diferiți susțin că au acces la OpenAImodelele interne ale lui și împărtășesc informații pe reddit.
FeltSteam... pic.twitter.com/JRJH4xADZX
Cu noile funcții, utilizatorii se pot angaja într-o conversație dus-întors cu ChatGPT folosind vocile lor. De asemenea, ei pot discuta despre imagini cu chatbot-ul. Funcțiile vor fi lansate în următoarele două săptămâni pentru utilizatorii Plus și Enterprise.
Capacitatea de voce va veni pe iOS și Android ca opt-in, în timp ce funcția de imagine va fi disponibilă pe toate platformele.
Pentru a începe să folosească funcția vocală, utilizatorii pot merge la Setări → Funcții noi din aplicația mobilă și pot opta „conversații vocale”. Apoi, utilizatorul trebuie să atingă butonul căștilor aflat în colțul din dreapta sus al ecranului de start și să selecteze vocea preferată dintr-o selecție de cinci voci diferite.
Pentru a conversa cu ChatGPT prin intermediul imaginilor, utilizatorul poate atinge butonul fotografie pentru a captura o imagine sau pentru a selecta una. Dacă utilizați iOS sau Android, atingeți butonul plus înainte de a continua. În plus, se pot angaja în discuții cu mai multe imagini sau le pot folosi pentru a ghida chatbot-ul.
OpenAI spune că înțelegerea imaginii este alimentată de multimodal GPT-3.5 Și GPT-4. Aceste modele valorifică abilitățile de raționament lingvistic pentru a analiza o gamă variată de conținut vizual, cuprinzând fotografii, capturi de ecran și documente care conțin o combinație de text și imagini.
OpenAIparteneriatul lui cu Spotify
De asemenea, Spotify a anunțat astăzi funcția sa de traducere vocală alimentată de AI. Noua caracteristică poate traduce podcasturi în diferite limbi, utilizând vocea originală a podcasterului.
În conformitate cu Acostament, pe care se bazează această funcție de traducere OpenAIInstrumentul de transcriere vocală al lui, Whisper, care poate transcrie vorbirea în engleză și traduce diferite limbi în engleză.
Ca parte a pilotului, compania a făcut echipă cu podcasterii Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons și Steven Bartlett pentru a crea traduceri vocale bazate pe inteligență artificială în limbi precum spaniolă, franceză și germană pentru anumite episoade de catalog și viitoare. eliberează.
„Credem că o abordare atentă a inteligenței artificiale poate ajuta la construirea de conexiuni mai profunde între ascultători și creatori, o componentă cheie a misiunii Spotify de a debloca potențialul creativității umane”, a declarat Ziad Sultan, VP Personalizare la Spotify, într-un comunicat.
Episoadele traduse vocal de la creatorii pilot vor fi disponibile la nivel mondial pentru utilizatorii Premium și Free.
Declinare a responsabilităţii
În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.
Despre autor
Cindy este jurnalist la Metaverse Post, acoperind subiecte legate de web3, NFT, metavers și AI, cu accent pe interviuri cu Web3 jucători din industrie. Ea a vorbit cu peste 30 de directori de nivel C și nu mai mult, aducând cunoștințele lor valoroase cititorilor. Originară din Singapore, Cindy are acum sediul în Tbilisi, Georgia. Ea deține o diplomă de licență în Comunicații și Studii Media de la Universitatea din Australia de Sud și are un deceniu de experiență în jurnalism și scris. Luați legătura cu ea prin intermediul [e-mail protejat] cu prezentari de presă, anunțuri și oportunități de interviuri.
Mai multe articoleCindy este jurnalist la Metaverse Post, acoperind subiecte legate de web3, NFT, metavers și AI, cu accent pe interviuri cu Web3 jucători din industrie. Ea a vorbit cu peste 30 de directori de nivel C și nu mai mult, aducând cunoștințele lor valoroase cititorilor. Originară din Singapore, Cindy are acum sediul în Tbilisi, Georgia. Ea deține o diplomă de licență în Comunicații și Studii Media de la Universitatea din Australia de Sud și are un deceniu de experiență în jurnalism și scris. Luați legătura cu ea prin intermediul [e-mail protejat] cu prezentari de presă, anunțuri și oportunități de interviuri.