Vijesti Tehnologija
Rujna 25, 2023

OpenAI'S ChatGPT Otkriva veliku nadogradnju, dodaje glasovni razgovor i slikovni chat

Ukratko

OpenAI će uvesti nove glasovne i slikovne mogućnosti ChatGPT tijekom sljedeća dva tjedna.

Ove značajke bit će dostupne samo korisnicima Plus i Enterprise.

OpenAI danas je objavio da će uvesti nove glasovne i slikovne mogućnosti ChatGPT. Nove značajke omogućit će korisnicima glasovni razgovor sa ChatGPT ili razgovarajte s chatbotom putem slika.

Ova objava uslijedila je nakon tvrdnji korisnika Reddita koji su tvrdili da su dobili pristup OpenAImodeli i kasnije podijelio ove informacije na platformi. Redditor FeltSteam opisao je AI model s radnim imenom Arrakis, koji navodno omogućuje korisnicima "unos bilo koje kombinacije teksta, zvuka i videa".

"Nova glasovna mogućnost pokreće novi model pretvaranja teksta u govor, sposoban generirati zvuk poput ljudskog iz samo teksta i nekoliko sekundi uzorka govora", napisao je Open AI u blog post. “Surađivali smo s profesionalnim glasovnim glumcima kako bismo stvorili svaki od glasova. Također koristimo Whisper, naš sustav za prepoznavanje govora otvorenog koda, za transkripciju vaših izgovorenih riječi u tekst.”

S novim značajkama korisnici mogu sudjelovati u razgovoru naprijed-natrag s ChatGPT koristeći svoje glasove. Također mogu razgovarati o slikama s chatbotom. Značajke će biti uvedene tijekom sljedeća dva tjedna korisnicima Plus i Enterprise.

Glasovne mogućnosti bit će dostupne za iOS i Android kao opt-in, dok će značajka slike biti dostupna na svim platformama.

Kako bi počeli koristiti glasovnu funkciju, korisnici mogu otići u Postavke → Nove značajke na mobilnoj aplikaciji i odabrati "glasovne razgovore". Zatim bi korisnik trebao dodirnuti gumb za slušalice koji se nalazi u gornjem desnom kutu početnog zaslona i odabrati željeni glas iz izbora od pet različitih glasova.

Razgovarati s ChatGPT kroz slike, korisnik može dodirnuti gumb fotografije kako bi snimio sliku ili je odabrao. Ako koristite iOS ili Android, dodirnite gumb plus prije nastavka. Osim toga, mogu sudjelovati u raspravama s više slika ili ih koristiti za vođenje chatbota.

OpenAI kaže da se razumijevanje slike pokreće multimodalnim GPT-3.5 I GPT-4. Ovi modeli iskorištavaju sposobnosti jezičnog razmišljanja za analizu raznolikog niza vizualnih sadržaja, uključujući fotografije, snimke zaslona i dokumente koji sadrže kombinaciju teksta i slika.

OpenAIpartnerstvo sa Spotifyjem

Spotify također objavljeno je danas njegovu značajku glasovnog prevođenja pokretanu umjetnom inteligencijom. Nova značajka može prevoditi podcaste na različite jezike, koristeći izvorni glas podcastera.

Prema Rubu, oslanja se ova značajka prijevoda OpenAIalat za transkripciju glasa, Whisper, koji može transkribirati engleski govor i prevoditi različite jezike na engleski.

Kao dio pilota, tvrtka se udružila s podcasterima Daxom Shepardom, Monicom Padman, Lexom Fridmanom, Billom Simmonsom i Stevenom Bartlettom kako bi stvorili glasovne prijevode vođene umjetnom inteligencijom na jezike kao što su španjolski, francuski i njemački za određene epizode iz kataloga i nadolazeće oslobađanja.

“Vjerujemo da promišljen pristup umjetnoj inteligenciji može pomoći u izgradnji dubljih veza između slušatelja i kreatora, što je ključna komponenta Spotifyjeve misije da otključa potencijal ljudske kreativnosti,” Ziad Sultan, potpredsjednik personalizacije u Spotifyju, rekao je u izjavi.

Glasovno prevedene epizode pilot kreatora bit će dostupne diljem svijeta korisnicima Premiuma i besplatnih.

Izjava o odricanju od odgovornosti

U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.

O autoru

Cindy je novinarka u Metaverse Post, pokrivajući teme povezane s web3, NFT, metaverse i AI, s fokusom na intervjue s Web3 igrači u industriji. Razgovarala je s više od 30 rukovoditelja na razini C i sve više, donoseći njihove dragocjene uvide čitateljima. Porijeklom iz Singapura, Cindy sada živi u Tbilisiju u Gruziji. Diplomirala je komunikacije i medijske studije na Sveučilištu Južne Australije i ima desetljeće iskustva u novinarstvu i pisanju. Stupite u kontakt s njom putem [e-pošta zaštićena] s predstavljanjima za novinare, najavama i prilikama za intervjue.

Više članaka
Cindy Tan
Cindy Tan

Cindy je novinarka u Metaverse Post, pokrivajući teme povezane s web3, NFT, metaverse i AI, s fokusom na intervjue s Web3 igrači u industriji. Razgovarala je s više od 30 rukovoditelja na razini C i sve više, donoseći njihove dragocjene uvide čitateljima. Porijeklom iz Singapura, Cindy sada živi u Tbilisiju u Gruziji. Diplomirala je komunikacije i medijske studije na Sveučilištu Južne Australije i ima desetljeće iskustva u novinarstvu i pisanju. Stupite u kontakt s njom putem [e-pošta zaštićena] s predstavljanjima za novinare, najavama i prilikama za intervjue.

Od Ripplea do Big Green DAO-a: Kako projekti kriptovaluta pridonose dobrotvornim aktivnostima

Istražimo inicijative koje iskorištavaju potencijal digitalnih valuta u dobrotvorne svrhe.

Znati više

AlphaFold 3, Med-Gemini i drugi: način na koji umjetna inteligencija transformira zdravstvo 2024.

AI se manifestira na različite načine u zdravstvu, od otkrivanja novih genetskih korelacija do osnaživanja robotskih kirurških sustava...

Znati više
Pridružite se našoj zajednici inovativnih tehnologija
opširnije
Čitaj više
Od Ripplea do Big Green DAO-a: Kako projekti kriptovaluta pridonose dobrotvornim aktivnostima
Analiza Kriptovalute Wiki posao Obrazovanje Lifestyle tržišta softver Tehnologija
Od Ripplea do Big Green DAO-a: Kako projekti kriptovaluta pridonose dobrotvornim aktivnostima
Neka 13, 2024
AlphaFold 3, Med-Gemini i drugi: način na koji umjetna inteligencija transformira zdravstvo 2024.
AI Wiki Analiza probaviti Mišljenje posao tržišta Vijesti softver Priče i recenzije Tehnologija
AlphaFold 3, Med-Gemini i drugi: način na koji umjetna inteligencija transformira zdravstvo 2024.
Neka 13, 2024
Mreža Nim za uvođenje okvira za tokenizaciju vlasništva AI i provođenje prodaje prinosa s datumom snimke zakazanim za svibanj
tržišta Vijesti Tehnologija
Mreža Nim za uvođenje okvira za tokenizaciju vlasništva AI i provođenje prodaje prinosa s datumom snimke zakazanim za svibanj
Neka 13, 2024
Binance je partner s Argentinom u borbi protiv kibernetičkog kriminala
Mišljenje posao tržišta Vijesti softver Tehnologija
Binance je partner s Argentinom u borbi protiv kibernetičkog kriminala
Neka 13, 2024
CRYPTOMERIA LABS PTE. LTD.