Tudósítást Technológia
25. szeptember 2023.

OpenAI'S ChatGPT Jelentős frissítést mutat be, hangbeszélgetést és képcsevegést ad hozzá

Röviden

OpenAI új hang- és képképességeket vezet be ChatGPT a következő két hétben.

Ezek a funkciók csak a Plus és Enterprise felhasználók számára lesznek elérhetők.

OpenAI ma bejelentette, hogy új hang- és képképességeket vezet be ChatGPT. Az új funkciók lehetővé teszik a felhasználók számára, hogy hangbeszélgetést folytathassanak ChatGPT vagy csevegjen a chatbottal képeken keresztül.

A bejelentés a Reddit-felhasználók állításait követi, akik azt állították, hogy hozzáférést nyertek OpenAImodelljeit, és ezt követően megosztotta ezt az információt a platformon. A Redditor FeltSteam egy AI-modellt írt le Arrakis munkanévvel, amely állítólag lehetővé teszi a felhasználók számára, hogy „szöveg, hang és videó bármilyen kombinációját vigyék be”.

"Az új beszédképességet egy új szöveg-beszédmodell hajtja, amely képes emberszerű hangot generálni csupán szövegből és néhány másodperces beszédmintából" - írta az Open AI egy közleményében. blogbejegyzés. „Együttműködtünk professzionális szinkronszínészekkel az egyes hangok létrehozásában. A Whispert, a nyílt forráskódú beszédfelismerő rendszerünket is használjuk a kimondott szavak szöveggé történő átírására.”

Az új funkciókkal a felhasználók oda-vissza beszélgethetnek vele ChatGPT a hangjukat használva. A chatbottal is megbeszélhetik a képeket. A funkciók a következő két hétben kerülnek bevezetésre a Plus és az Enterprise felhasználók számára.

A hangszolgáltatás iOS-re és Androidra opcionálisan érkezik, míg a képfunkció minden platformon elérhető lesz.

A hangfunkció használatának megkezdéséhez a felhasználók a mobilalkalmazás Beállítások → Új funkciók menüpontját választva választhatják a „hangbeszélgetéseket”. Ezután a felhasználónak meg kell érintenie a kezdőképernyő jobb felső sarkában található fejhallgató gombot, és ki kell választania a kívánt hangot az öt különböző hang közül.

Beszélgetni vele ChatGPT a képeken keresztül a felhasználó a fénykép gomb megérintésével rögzíthet képet, vagy kiválaszthat egyet. Ha iOS vagy Android rendszert használ, érintse meg a plusz gombot a folytatás előtt. Ezenkívül több képpel is megbeszéléseket folytathatnak, vagy használhatják őket a chatbot irányítására.

OpenAI azt mondja, hogy a képmegértést a multimodális erő hajtja GPT-3.5 És GPT-4. Ezek a modellek a nyelvi érvelési képességeket hasznosítják a vizuális tartalom különféle skálájának elemzéséhez, beleértve a fényképeket, képernyőképeket és a szöveg és kép kombinációját tartalmazó dokumentumokat.

OpenAIegyüttműködése a Spotify-val

Spotify is ma bejelentette AI-alapú hangfordító funkciója. Az új funkció a podcastokat különböző nyelvekre tudja lefordítani, felhasználva a podcaster eredeti hangját.

Szerint The Verge, ez a fordítási funkció támaszkodik OpenAIhangátíró eszköze, a Whisper, amely képes angol beszédet átírni és különféle nyelveket angolra fordítani.

A pilot részeként a vállalat Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons és Steven Bartlett podcasterekkel együttműködve mesterséges intelligenciával vezérelt hangfordításokat hoz létre olyan nyelveken, mint a spanyol, a francia és a német bizonyos katalógusepizódokhoz és a közelgő epizódokhoz. kiadja.

„Úgy gondoljuk, hogy a mesterséges intelligencia átgondolt megközelítése segíthet mélyebb kapcsolatok kiépítésében a hallgatók és az alkotók között, ami kulcsfontosságú eleme a Spotify küldetésének, hogy feltárja az emberi kreativitásban rejlő lehetőségeket” – mondta Ziad Sultan, a Spotify személyre szabásáért felelős alelnöke.

A kísérleti alkotók hangra fordított epizódjai világszerte elérhetőek lesznek a prémium és ingyenes felhasználók számára.

A felelősség megtagadása

Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.

A szerzőről

Cindy újságíró a cégnél Metaverse Post, amelyhez kapcsolódó témákat fed fel web3, NFT, metaverzum és mesterséges intelligencia, különös tekintettel a vele készült interjúkra Web3 iparági szereplők. Több mint 30 C-szintű vezetővel beszélt, akik értékes ismereteiket juttatták el az olvasókhoz. Az eredetileg Szingapúrból származó Cindy jelenleg Tbilisziben, Grúziában él. Kommunikáció és médiatudomány szakon szerzett alapdiplomát a Dél-ausztrál Egyetemen, és több évtizedes tapasztalattal rendelkezik az újságírás és az írás terén. Vedd fel vele a kapcsolatot ezen keresztül [e-mail védett] sajtóbemutatókkal, közleményekkel és interjúlehetőségekkel.

További cikkek
Cindy Tan
Cindy Tan

Cindy újságíró a cégnél Metaverse Post, amelyhez kapcsolódó témákat fed fel web3, NFT, metaverzum és mesterséges intelligencia, különös tekintettel a vele készült interjúkra Web3 iparági szereplők. Több mint 30 C-szintű vezetővel beszélt, akik értékes ismereteiket juttatták el az olvasókhoz. Az eredetileg Szingapúrból származó Cindy jelenleg Tbilisziben, Grúziában él. Kommunikáció és médiatudomány szakon szerzett alapdiplomát a Dél-ausztrál Egyetemen, és több évtizedes tapasztalattal rendelkezik az újságírás és az írás terén. Vedd fel vele a kapcsolatot ezen keresztül [e-mail védett] sajtóbemutatókkal, közleményekkel és interjúlehetőségekkel.

A volatilitás közepette nő az intézményi étvágy a Bitcoin ETF-ek felé

A 13F bejelentéseken keresztül közzétett információk jelentős intézményi befektetőket tárnak fel a Bitcoin ETF-ek iránt, ami alátámasztja a ...

Tudjon meg többet

Elérkezett az ítélethirdetés napja: CZ sorsa egyensúlyban van, mivel az Egyesült Államok bírósága mérlegeli a DOJ kérelmét

Changpeng Zhao ítéletet vár ma egy seattle-i amerikai bíróságon.

Tudjon meg többet
Csatlakozzon innovatív technológiai közösségünkhöz
KATT ide
Tovább
Donald Trump átállása a kriptográfia felé: az ellenfélből a szószólóvá, és mit jelent ez az amerikai kriptovaluta piac számára
üzleti piacok Történetek és vélemények Technológia
Donald Trump átállása a kriptográfia felé: az ellenfélből a szószólóvá, és mit jelent ez az amerikai kriptovaluta piac számára
May 10, 2024
3. réteg az L3 Token bevezetésére ezen a nyáron, amely a teljes kínálat 51%-át a közösségnek osztja
piacok Tudósítást Technológia
3. réteg az L3 Token bevezetésére ezen a nyáron, amely a teljes kínálat 51%-át a közösségnek osztja
May 10, 2024
Edward Snowden utolsó figyelmeztetése a Bitcoin fejlesztői számára: „Tegye az adatvédelmet protokollszintű prioritássá, vagy kockáztassa az elvesztését
piacok Biztonság Wiki szoftver Történetek és vélemények Technológia
Edward Snowden utolsó figyelmeztetése a Bitcoin fejlesztői számára: „Tegye az adatvédelmet protokollszintű prioritássá, vagy kockáztassa az elvesztését
May 10, 2024
Az Optimism-alapú Ethereum Layer 2 Network Mint május 15-én elindítja a hálózatát
Tudósítást Technológia
Az Optimism-alapú Ethereum Layer 2 Network Mint május 15-én elindítja a hálózatát
May 10, 2024
CRYPTOMERIA LABS PTE. KFT.