Novinky Technika
Září 25, 2023

OpenAIJe ChatGPT Odhaluje hlavní upgrade, přidává hlasovou konverzaci a obrázkový chat

Stručně

OpenAI zavede nové hlasové a obrazové funkce ChatGPT během následujících dvou týdnů.

Tyto funkce budou dostupné pouze uživatelům Plus a Enterprise.

OpenAI dnes oznámila, že zavede nové hlasové a obrazové funkce ChatGPT. Nové funkce umožní uživatelům hlasovou konverzaci ChatGPT nebo chatujte s chatbotem prostřednictvím obrázků.

Oznámení následuje po tvrzeních uživatelů Redditu, kteří tvrdili, že k nim získali přístup OpenAI's modely a následně tyto informace sdíleli na platformě. Redditor FeltSteam popsal model umělé inteligence s pracovním názvem Arrakis, který údajně umožňuje uživatelům „vkládat jakoukoli kombinaci textu, zvuku a videa“.

„Nová hlasová schopnost je poháněna novým modelem převodu textu na řeč, který je schopen generovat zvuk podobný lidskému zvuku pouze z textu a několika sekund ukázkové řeči,“ napsal Open AI v dokumentu. blogu. „Na vytvoření každého z hlasů jsme spolupracovali s profesionálními hlasovými herci. K přepisu vašich mluvených slov do textu také používáme Whisper, náš otevřený systém pro rozpoznávání řeči.“

Díky novým funkcím se uživatelé mohou zapojit do konverzace tam a zpět ChatGPT pomocí jejich hlasů. Mohou také diskutovat o obrázcích s chatbotem. Funkce budou zavedeny během příštích dvou týdnů pro uživatele Plus a Enterprise.

Hlasová funkce bude k dispozici pro iOS a Android jako opt-in, zatímco funkce obrazu bude dostupná na všech platformách.

Chcete-li začít používat hlasovou funkci, mohou uživatelé přejít do Nastavení → Nové funkce v mobilní aplikaci a zvolit „hlasové konverzace“. Dále by měl uživatel klepnout na tlačítko sluchátek v pravém horním rohu domovské obrazovky a vybrat si preferovaný hlas z nabídky pěti různých hlasů.

Konverzovat s ChatGPT prostřednictvím obrázků může uživatel klepnout na tlačítko fotografie a buď pořídit obrázek, nebo jej vybrat. Pokud používáte iOS nebo Android, než budete pokračovat, klepněte na tlačítko plus. Navíc se mohou zapojit do diskuzí s více obrázky nebo je použít k vedení chatbota.

OpenAI říká, že porozumění obrazu je poháněno multimodálním GPT-3.5 A GPT-4. Tyto modely využívají schopnosti jazykového uvažování k analýze rozmanité řady vizuálního obsahu, včetně fotografií, snímků obrazovky a dokumentů obsahujících kombinaci textu a obrázků.

OpenAIpartnerství se Spotify

Spotify také dnes oznámila funkce hlasového překladu s umělou inteligencí. Nová funkce dokáže překládat podcasty do různých jazyků s využitím původního hlasu podcastera.

Podle Verge, na které se tato funkce překladu spoléhá OpenAInástroj pro přepis hlasu Whisper, který je schopen přepisovat anglickou řeč a překládat různé jazyky do angličtiny.

V rámci pilotního projektu se společnost spojila s podcastery Daxem Shepardem, Monikou Padmanovou, Lexem Fridmanem, Billem Simmonsem a Stevenem Bartlettem, aby vytvořili hlasové překlady řízené umělou inteligencí v jazycích, jako je španělština, francouzština a němčina pro konkrétní epizody katalogu a nadcházející vydání.

„Věříme, že promyšlený přístup k umělé inteligenci může pomoci vybudovat hlubší propojení mezi posluchači a tvůrci, což je klíčová součást mise Spotify odemknout potenciál lidské kreativity,“ uvedl v prohlášení Ziad Sultan, viceprezident pro personalizaci ve Spotify.

Hlasově přeložené epizody od tvůrců pilotních projektů budou celosvětově dostupné uživatelům Premium a Free.

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Cindy je novinářka v Metaverse Post, pokrývající témata související s web3, NFT, metaverse a AI, se zaměřením na rozhovory s Web3 hráči v oboru. Mluvila s více než 30 manažery na úrovni C a počítání a přinesla jejich cenné poznatky čtenářům. Cindy pochází ze Singapuru a nyní sídlí v Tbilisi v Gruzii. Je držitelkou bakalářského titulu v oboru komunikačních a mediálních studií na University of South Australia a má desetileté zkušenosti v žurnalistice a psaní. Spojte se s ní přes [chráněno e-mailem] s tiskovými nabídkami, oznámeními a příležitostmi k rozhovorům.

Další články
Cindy Tan
Cindy Tan

Cindy je novinářka v Metaverse Post, pokrývající témata související s web3, NFT, metaverse a AI, se zaměřením na rozhovory s Web3 hráči v oboru. Mluvila s více než 30 manažery na úrovni C a počítání a přinesla jejich cenné poznatky čtenářům. Cindy pochází ze Singapuru a nyní sídlí v Tbilisi v Gruzii. Je držitelkou bakalářského titulu v oboru komunikačních a mediálních studií na University of South Australia a má desetileté zkušenosti v žurnalistice a psaní. Spojte se s ní přes [chráněno e-mailem] s tiskovými nabídkami, oznámeními a příležitostmi k rozhovorům.

Institucionální apetit roste směrem k bitcoinovým ETF uprostřed volatility

Zveřejnění prostřednictvím podání 13F odhaluje, že pozoruhodní institucionální investoři fušují do bitcoinových ETF, což podtrhuje rostoucí akceptaci...

Vědět více

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Injective spojuje síly s AltLayer, aby přineslo zabezpečení při opětovném skládání do inEVM
Business Novinky Technika
Injective spojuje síly s AltLayer, aby přineslo zabezpečení při opětovném skládání do inEVM
3
Masa se spojila s Tellerem, aby zavedla MASA Půjčovací fond, umožní USDC půjčování na základně
Trhy Novinky Technika
Masa se spojila s Tellerem, aby zavedla MASA Půjčovací fond, umožní USDC půjčování na základně
3
Velodrome spouští v nadcházejících týdnech beta verzi Superchain a rozšiřuje se o blockchainy OP Stack Layer 2
Trhy Novinky Technika
Velodrome spouští v nadcházejících týdnech beta verzi Superchain a rozšiřuje se o blockchainy OP Stack Layer 2
3
CARV oznamuje partnerství se společností Aethir za účelem decentralizace její datové vrstvy a distribuce odměn
Business Novinky Technika
CARV oznamuje partnerství se společností Aethir za účelem decentralizace její datové vrstvy a distribuce odměn
3
CRYPTOMERIA LABS PTE. LTD.