Novinová správa Technológia
September 25, 2023

OpenAI'S ChatGPT Odhaľuje veľkú inováciu, pridáva hlasovú konverzáciu a obrázkový chat

Stručne

OpenAI predstaví nové funkcie hlasu a obrazu ChatGPT počas nasledujúcich dvoch týždňov.

Tieto funkcie budú dostupné iba používateľom Plus a Enterprise.

OpenAI dnes oznámila, že uvedie na trh nové hlasové a obrazové funkcie ChatGPT. Nové funkcie umožnia používateľom viesť hlasovú konverzáciu ChatGPT alebo chatujte s chatbotom prostredníctvom obrázkov.

Oznámenie nasleduje po tvrdeniach používateľov Redditu, ktorí tvrdili, že získali prístup OpenAIa následne zdieľali tieto informácie na platforme. Redditor FeltSteam opísal model AI s pracovným názvom Arrakis, ktorý údajne umožňuje používateľom „vkladať akúkoľvek kombináciu textu, zvuku a videa“.

„Nová schopnosť hlasu je poháňaná novým modelom prevodu textu na reč, ktorý je schopný generovať zvuk podobný človeku len z textu a niekoľkých sekúnd ukážkovej reči,“ napísal Open AI. blog post. „Na vytvorení každého z hlasov sme spolupracovali s profesionálnymi hlasovými hercami. Na prepis vašich hovorených slov do textu používame aj Whisper, náš otvorený systém na rozpoznávanie reči.“

S novými funkciami sa používatelia môžu zapojiť do konverzácie tam a späť ChatGPT pomocou ich hlasov. Môžu tiež diskutovať o obrázkoch s chatbotom. Funkcie budú spustené v priebehu nasledujúcich dvoch týždňov pre používateľov Plus a Enterprise.

Hlasová funkcia bude k dispozícii pre iOS a Android ako voliteľná funkcia, zatiaľ čo funkcia obrazu bude dostupná na všetkých platformách.

Ak chcete začať používať hlasovú funkciu, používatelia môžu prejsť na Nastavenia → Nové funkcie v mobilnej aplikácii a zvoliť si „hlasové konverzácie“. Ďalej by mal používateľ klepnúť na tlačidlo slúchadiel v pravom hornom rohu domovskej obrazovky a vybrať si preferovaný hlas z výberu piatich rôznych hlasov.

Konverzovať s ChatGPT prostredníctvom obrázkov môže používateľ ťuknutím na tlačidlo fotografie buď zachytiť obrázok, alebo ho vybrať. Ak používate iOS alebo Android, pred pokračovaním klepnite na tlačidlo plus. Okrem toho sa môžu zapojiť do diskusií s viacerými obrázkami alebo ich použiť na vedenie chatbota.

OpenAI hovorí, že chápanie obrazu je poháňané multimodálom GPT-3.5 a GPT-4. Tieto modely využívajú schopnosti jazykového uvažovania na analýzu rozmanitého radu vizuálneho obsahu, ktorý zahŕňa fotografie, snímky obrazovky a dokumenty obsahujúce kombináciu textu a obrázkov.

OpenAIpartnerstvo so Spotify

Spotify tiež dnes oznámila jeho funkcia hlasového prekladu poháňaná AI. Nová funkcia dokáže prekladať podcasty do rôznych jazykov s využitím pôvodného hlasu podcastera.

Podľa Vergata, na ktorej sa táto funkcia prekladu spolieha OpenAInástroj na prepis hlasu Whisper, ktorý dokáže prepísať anglickú reč a preložiť rôzne jazyky do angličtiny.

V rámci pilotného projektu sa spoločnosť spojila s podaktormi Daxom Shepardom, Monikou Padmanovou, Lexom Fridmanom, Billom Simmonsom a Stevenom Bartlettom, aby vytvorili hlasové preklady riadené AI v jazykoch ako španielčina, francúzština a nemčina pre konkrétne epizódy katalógu a nadchádzajúce vydania.

„Veríme, že premyslený prístup k AI môže pomôcť vybudovať hlbšie spojenia medzi poslucháčmi a tvorcami, čo je kľúčová súčasť misie Spotify uvoľniť potenciál ľudskej kreativity,“ uviedol vo vyhlásení Ziad Sultan, viceprezident pre personalizáciu v Spotify.

Hlasovo preložené epizódy od tvorcov pilotných dielov budú celosvetovo dostupné pre používateľov Premium a Free.

Vylúčenie zodpovednosti

V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.

O autorovi

Cindy je novinárka v Metaverse Post, pokrývajúce témy súvisiace s web3, NFT, metaverse a AI, so zameraním na rozhovory s Web3 hráčov v odvetví. Hovorila s viac ako 30 riaditeľmi na úrovni C a počítajúc, čím čitateľom priniesla ich cenné poznatky. Cindy je pôvodom zo Singapuru a teraz sídli v Tbilisi v Gruzínsku. Je držiteľkou bakalárskeho titulu z komunikačných a mediálnych štúdií na University of South Australia a má desaťročné skúsenosti v žurnalistike a písaní. Spojte sa s ňou cez [chránené e-mailom] s tlačovými ponukami, oznámeniami a príležitosťami na rozhovory.

Ďalšie články
Cindy Tan
Cindy Tan

Cindy je novinárka v Metaverse Post, pokrývajúce témy súvisiace s web3, NFT, metaverse a AI, so zameraním na rozhovory s Web3 hráčov v odvetví. Hovorila s viac ako 30 riaditeľmi na úrovni C a počítajúc, čím čitateľom priniesla ich cenné poznatky. Cindy je pôvodom zo Singapuru a teraz sídli v Tbilisi v Gruzínsku. Je držiteľkou bakalárskeho titulu z komunikačných a mediálnych štúdií na University of South Australia a má desaťročné skúsenosti v žurnalistike a písaní. Spojte sa s ňou cez [chránené e-mailom] s tlačovými ponukami, oznámeniami a príležitosťami na rozhovory.

Hot Stories
Pridajte sa k nášmu newsletteru.
Novinky

Od zvlnenia k veľkému zelenému DAO: Ako kryptomenové projekty prispievajú k charite

Poďme preskúmať iniciatívy, ktoré využívajú potenciál digitálnych mien na charitatívne účely.

vedieť viac

AlphaFold 3, Med-Gemini a ďalší: Spôsob, akým AI transformuje zdravotnú starostlivosť v roku 2024

Umelá inteligencia sa v zdravotníctve prejavuje rôznymi spôsobmi, od odhaľovania nových genetických korelácií až po posilnenie robotických chirurgických systémov...

vedieť viac
Pripojte sa k našej komunite inovatívnych technológií
Čítaj viac
Čítaj viac
10 najlepších bezplatných nástrojov AI na vytváranie obsahu, úpravu videa a ďalšie
AI Wiki výťah vzdelanie Životný štýl Softvér Technológia
10 najlepších bezplatných nástrojov AI na vytváranie obsahu, úpravu videa a ďalšie
Môže 14, 2024
Hongkonská komisia pre cenné papiere varuje pred falošnými podvodmi zameranými na krypto priemysel: dôsledky pre bezpečnosť investorov
Životný štýl zabezpečenia Wiki Softvér Príbehy a recenzie Technológia
Hongkonská komisia pre cenné papiere varuje pred falošnými podvodmi zameranými na krypto priemysel: dôsledky pre bezpečnosť investorov
Môže 14, 2024
Ripple a Evmos spolupracujú na vývoji XRP Ledger EVM sidechain s technológiou EvmOS
firmy Novinová správa Technológia
Ripple a Evmos spolupracujú na vývoji XRP Ledger EVM sidechain s technológiou EvmOS
Môže 14, 2024
5ireChain iniciuje stimulovaný 'Testnet Thunder: GA' na záťažové testovanie siete, vyzýva používateľov, aby sa zúčastnili Airdrop Odmeny
Novinová správa Technológia
5ireChain iniciuje stimulovaný 'Testnet Thunder: GA' na záťažové testovanie siete, vyzýva používateľov, aby sa zúčastnili Airdrop Odmeny
Môže 14, 2024
CRYPTOMERIA LABS PTE. LTD.