Naujienų ataskaita Technologija
Rugsėjis 25, 2023

OpenAIS ChatGPT Pristato pagrindinį atnaujinimą, prideda balso pokalbių ir vaizdo pokalbių

Trumpai

OpenAI bus įdiegtos naujos balso ir vaizdo galimybės ChatGPT per ateinančias dvi savaites.

Šios funkcijos bus prieinamos tik „Plus“ ir „Enterprise“ naudotojams.

OpenAI šiandien paskelbė, kad įdiegs naujas balso ir vaizdo galimybes ChatGPT. Naujos funkcijos leis vartotojams bendrauti balsu ChatGPT arba kalbėkite su pokalbių robotu naudodami vaizdus.

Skelbimas buvo paskelbtas po „Reddit“ vartotojų teiginių, kurie teigė, kad jie gavo prieigą OpenAImodelius ir vėliau pasidalino šia informacija platformoje. Redditor FeltSteam aprašė AI modelį darbiniu pavadinimu Arrakis, kuris, kaip pranešama, leidžia vartotojams „įvesti bet kokį teksto, garso ir vaizdo derinį“.

„Naujoji balso galimybė sukurta naudojant naują teksto į kalbą modelį, galintį generuoti žmogaus panašų garsą tik iš teksto ir kelių sekundžių pavyzdinės kalbos“, – rašė Open AI. dienoraštyje. „Kurdami kiekvieną balsą bendradarbiavome su profesionaliais balso aktoriais. Taip pat naudojame Whisper – mūsų atvirojo kodo kalbos atpažinimo sistemą, kad perrašytume jūsų ištartus žodžius į tekstą.

Naudodamiesi naujomis funkcijomis, vartotojai gali užmegzti pokalbį pirmyn ir atgal ChatGPT naudojant savo balsus. Jie taip pat gali diskutuoti apie vaizdus su pokalbių robotu. Funkcijos bus pristatytos „Plus“ ir „Enterprise“ vartotojams per ateinančias dvi savaites.

Balso funkcija bus prieinama „iOS“ ir „Android“ kaip pasirenkama, o vaizdo funkcija bus pasiekiama visose platformose.

Norėdami pradėti naudotis balso funkcija, mobiliojoje programoje vartotojai gali eiti į Nustatymai → Naujos funkcijos ir pasirinkti „balso pokalbius“. Tada vartotojas turėtų bakstelėti ausinių mygtuką, esantį viršutiniame dešiniajame pagrindinio ekrano kampe, ir pasirinkti pageidaujamą balsą iš penkių skirtingų balsų.

Norėdami pasikalbėti su ChatGPT per vaizdus, ​​vartotojas gali bakstelėti nuotraukos mygtuką, kad užfiksuotų vaizdą arba pasirinktų vieną. Jei naudojate iOS arba Android, prieš tęsdami bakstelėkite pliuso mygtuką. Be to, jie gali dalyvauti diskusijose naudodami kelis vaizdus arba naudoti juos pokalbių robotui vadovauti.

OpenAI sako, kad vaizdo supratimą skatina daugiarūšis GPT-3.5 Ir GPT-4. Šie modeliai išnaudoja kalbos samprotavimo gebėjimus analizuoti įvairų vaizdinio turinio masyvą, apimantį nuotraukas, ekrano kopijas ir dokumentus, kuriuose yra teksto ir vaizdų derinys.

OpenAIpartnerystė su „Spotify“.

Spotify taip pat Paskelbė šiandien jo AI varoma balso vertimo funkcija. Naujoji funkcija gali išversti podcast'us į skirtingas kalbas, naudojant originalų podcasterio balsą.

Pagal Bordiūrų, ši vertimo funkcija remiasi OpenAIbalso transkripcijos įrankis Whisper, kuris gali perrašyti anglišką kalbą ir išversti įvairias kalbas į anglų kalbą.

Vykdydama bandomąjį projektą, bendrovė bendradarbiauja su podcasteriais Daxu Shepardu, Monica Padmanu, Lexu Fridmanu, Billu Simmonsu ir Stevenu Bartlettu, kad sukurtų dirbtinio intelekto pagrįstus balso vertimus į tokias kalbas kaip ispanų, prancūzų ir vokiečių, skirtus tam tikriems katalogo epizodams ir būsimiems naujiems. išleidžia.

„Manome, kad apgalvotas požiūris į AI gali padėti užmegzti gilesnius ryšius tarp klausytojų ir kūrėjų, o tai yra pagrindinė „Spotify“ misijos, kuria siekiama atskleisti žmogaus kūrybiškumo potencialą, sudedamoji dalis“, – pranešime teigė Ziadas Sultanas, „Spotify“ personalizavimo viceprezidentas.

Balsu išverstos bandomųjų kūrėjų serijos bus pasiekiamos visame pasaulyje Premium ir Free vartotojams.

Atsakomybės neigimas

Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.

Apie autorių

Cindy yra žurnalistė Metaverse Post, apimantis temas, susijusias su web3, NFT, metaverse ir AI, daugiausia dėmesio skiriant interviu su Web3 pramonės žaidėjų. Ji kalbėjosi su daugiau nei 30 C lygio vadovų ir skaičiuoja, pateikdama jų vertingas įžvalgas skaitytojams. Iš Singapūro kilusi Cindy dabar įsikūrusi Tbilisyje, Gruzijoje. Ji Pietų Australijos universitete yra įgijusi komunikacijos ir žiniasklaidos studijų bakalauro laipsnį ir turi dešimtmetį žurnalistikos ir rašymo patirties. Susisiekite su ja per [apsaugotas el. paštu] su pranešimais spaudai, pranešimais ir interviu galimybėmis.

Daugiau straipsnių
Cindy Tan
Cindy Tan

Cindy yra žurnalistė Metaverse Post, apimantis temas, susijusias su web3, NFT, metaverse ir AI, daugiausia dėmesio skiriant interviu su Web3 pramonės žaidėjų. Ji kalbėjosi su daugiau nei 30 C lygio vadovų ir skaičiuoja, pateikdama jų vertingas įžvalgas skaitytojams. Iš Singapūro kilusi Cindy dabar įsikūrusi Tbilisyje, Gruzijoje. Ji Pietų Australijos universitete yra įgijusi komunikacijos ir žiniasklaidos studijų bakalauro laipsnį ir turi dešimtmetį žurnalistikos ir rašymo patirties. Susisiekite su ja per [apsaugotas el. paštu] su pranešimais spaudai, pranešimais ir interviu galimybėmis.

Hot Stories
Prisijunkite prie mūsų naujienlaiškio.
Paskutinės naujienos

Nuo Ripple iki Big Green DAO: kaip kriptovaliutų projektai prisideda prie labdaros

Išnagrinėkime iniciatyvas, kurios panaudoja skaitmeninių valiutų potencialą labdaros tikslais.

Žinoti daugiau

„AlphaFold 3“, „Med-Gemini“ ir kiti: „The Way AI Transforms Healthcare 2024“

DI pasireiškia įvairiais būdais sveikatos priežiūros srityje: nuo naujų genetinių koreliacijų atskleidimo iki robotų chirurginių sistemų įgalinimo...

Žinoti daugiau
Prisijunkite prie mūsų naujoviškų technologijų bendruomenės
Skaityti daugiau
Skaityti daugiau
10 geriausių nemokamų AI įrankių, skirtų turinio kūrimui, vaizdo įrašų redagavimui ir kt
AI Wiki Virškinimas Išsilavinimas Gyvenimo būdas programinė įranga Technologija
10 geriausių nemokamų AI įrankių, skirtų turinio kūrimui, vaizdo įrašų redagavimui ir kt
Gali 14, 2024
Honkongo vertybinių popierių komisija perspėja apie netikrus sukčiavimus, nukreiptus į kriptovaliutų pramonę: pasekmės investuotojų saugumui
Gyvenimo būdas saugumas Wiki programinė įranga Istorijos ir apžvalgos Technologija
Honkongo vertybinių popierių komisija perspėja apie netikrus sukčiavimus, nukreiptus į kriptovaliutų pramonę: pasekmės investuotojų saugumui
Gali 14, 2024
Ripple ir Evmos bendradarbiauja kurdami XRP Ledger EVM šoninę grandinę su EvmOS technologija
Atsakingas verslas Naujienų ataskaita Technologija
Ripple ir Evmos bendradarbiauja kurdami XRP Ledger EVM šoninę grandinę su EvmOS technologija
Gali 14, 2024
„5ireChain“ inicijuoja skatinamą „Testnet Thunder: GA“ tinklo nepalankiausio poveikio testavimui, kviečia vartotojus dalyvauti Airdrop Apdovanojimai
Naujienų ataskaita Technologija
„5ireChain“ inicijuoja skatinamą „Testnet Thunder: GA“ tinklo nepalankiausio poveikio testavimui, kviečia vartotojus dalyvauti Airdrop Apdovanojimai
Gali 14, 2024
CRYPTOMERIA LABS PTE. LTD.