OpenAIS ChatGPT Pristato pagrindinį atnaujinimą, prideda balso pokalbių ir vaizdo pokalbių
Trumpai
OpenAI bus įdiegtos naujos balso ir vaizdo galimybės ChatGPT per ateinančias dvi savaites.
Šios funkcijos bus prieinamos tik „Plus“ ir „Enterprise“ naudotojams.
OpenAI šiandien paskelbė, kad įdiegs naujas balso ir vaizdo galimybes ChatGPT. Naujos funkcijos leis vartotojams bendrauti balsu ChatGPT arba kalbėkite su pokalbių robotu naudodami vaizdus.
Skelbimas buvo paskelbtas po „Reddit“ vartotojų teiginių, kurie teigė, kad jie gavo prieigą OpenAImodelius ir vėliau pasidalino šia informacija platformoje. Redditor FeltSteam aprašė AI modelį darbiniu pavadinimu Arrakis, kuris, kaip pranešama, leidžia vartotojams „įvesti bet kokį teksto, garso ir vaizdo derinį“.
„Naujoji balso galimybė sukurta naudojant naują teksto į kalbą modelį, galintį generuoti žmogaus panašų garsą tik iš teksto ir kelių sekundžių pavyzdinės kalbos“, – rašė Open AI. dienoraštyje. „Kurdami kiekvieną balsą bendradarbiavome su profesionaliais balso aktoriais. Taip pat naudojame Whisper – mūsų atvirojo kodo kalbos atpažinimo sistemą, kad perrašytume jūsų ištartus žodžius į tekstą.
Radau keletą keistų nepatvirtintų spėlionių apie galingus vidinius modelius „Reddit“.
- Yam Peleg (@Yampeleg) Rugsėjis 25, 2023
– Paimkite viską su druska. –
Matyt,
Du skirtingi vartotojai teigia, kad gavo prieigą OpenAIvidinius modelius ir dalijasi informacija apie reddit.
FeltSteam… pic.twitter.com/JRJH4xADZX
Naudodamiesi naujomis funkcijomis, vartotojai gali užmegzti pokalbį pirmyn ir atgal ChatGPT naudojant savo balsus. Jie taip pat gali diskutuoti apie vaizdus su pokalbių robotu. Funkcijos bus pristatytos „Plus“ ir „Enterprise“ vartotojams per ateinančias dvi savaites.
Balso funkcija bus prieinama „iOS“ ir „Android“ kaip pasirenkama, o vaizdo funkcija bus pasiekiama visose platformose.
Norėdami pradėti naudotis balso funkcija, mobiliojoje programoje vartotojai gali eiti į Nustatymai → Naujos funkcijos ir pasirinkti „balso pokalbius“. Tada vartotojas turėtų bakstelėti ausinių mygtuką, esantį viršutiniame dešiniajame pagrindinio ekrano kampe, ir pasirinkti pageidaujamą balsą iš penkių skirtingų balsų.
Norėdami pasikalbėti su ChatGPT per vaizdus, vartotojas gali bakstelėti nuotraukos mygtuką, kad užfiksuotų vaizdą arba pasirinktų vieną. Jei naudojate iOS arba Android, prieš tęsdami bakstelėkite pliuso mygtuką. Be to, jie gali dalyvauti diskusijose naudodami kelis vaizdus arba naudoti juos pokalbių robotui vadovauti.
OpenAI sako, kad vaizdo supratimą skatina daugiarūšis GPT-3.5 Ir GPT-4. Šie modeliai išnaudoja kalbos samprotavimo gebėjimus analizuoti įvairų vaizdinio turinio masyvą, apimantį nuotraukas, ekrano kopijas ir dokumentus, kuriuose yra teksto ir vaizdų derinys.
OpenAIpartnerystė su „Spotify“.
Spotify taip pat Paskelbė šiandien jo AI varoma balso vertimo funkcija. Naujoji funkcija gali išversti podcast'us į skirtingas kalbas, naudojant originalų podcasterio balsą.
Pagal Bordiūrų, ši vertimo funkcija remiasi OpenAIbalso transkripcijos įrankis Whisper, kuris gali perrašyti anglišką kalbą ir išversti įvairias kalbas į anglų kalbą.
Vykdydama bandomąjį projektą, bendrovė bendradarbiauja su podcasteriais Daxu Shepardu, Monica Padmanu, Lexu Fridmanu, Billu Simmonsu ir Stevenu Bartlettu, kad sukurtų dirbtinio intelekto pagrįstus balso vertimus į tokias kalbas kaip ispanų, prancūzų ir vokiečių, skirtus tam tikriems katalogo epizodams ir būsimiems naujiems. išleidžia.
„Manome, kad apgalvotas požiūris į AI gali padėti užmegzti gilesnius ryšius tarp klausytojų ir kūrėjų, o tai yra pagrindinė „Spotify“ misijos, kuria siekiama atskleisti žmogaus kūrybiškumo potencialą, sudedamoji dalis“, – pranešime teigė Ziadas Sultanas, „Spotify“ personalizavimo viceprezidentas.
Balsu išverstos bandomųjų kūrėjų serijos bus pasiekiamos visame pasaulyje Premium ir Free vartotojams.
Atsakomybės neigimas
Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.
Apie autorių
Cindy yra žurnalistė Metaverse Post, apimantis temas, susijusias su web3, NFT, metaverse ir AI, daugiausia dėmesio skiriant interviu su Web3 pramonės žaidėjų. Ji kalbėjosi su daugiau nei 30 C lygio vadovų ir skaičiuoja, pateikdama jų vertingas įžvalgas skaitytojams. Iš Singapūro kilusi Cindy dabar įsikūrusi Tbilisyje, Gruzijoje. Ji Pietų Australijos universitete yra įgijusi komunikacijos ir žiniasklaidos studijų bakalauro laipsnį ir turi dešimtmetį žurnalistikos ir rašymo patirties. Susisiekite su ja per [apsaugotas el. paštu] su pranešimais spaudai, pranešimais ir interviu galimybėmis.
Daugiau straipsniųCindy yra žurnalistė Metaverse Post, apimantis temas, susijusias su web3, NFT, metaverse ir AI, daugiausia dėmesio skiriant interviu su Web3 pramonės žaidėjų. Ji kalbėjosi su daugiau nei 30 C lygio vadovų ir skaičiuoja, pateikdama jų vertingas įžvalgas skaitytojams. Iš Singapūro kilusi Cindy dabar įsikūrusi Tbilisyje, Gruzijoje. Ji Pietų Australijos universitete yra įgijusi komunikacijos ir žiniasklaidos studijų bakalauro laipsnį ir turi dešimtmetį žurnalistikos ir rašymo patirties. Susisiekite su ja per [apsaugotas el. paštu] su pranešimais spaudai, pranešimais ir interviu galimybėmis.