OpenAIJe ChatGPT Odhaluje hlavní upgrade, přidává hlasovou konverzaci a obrázkový chat
Stručně
OpenAI zavede nové hlasové a obrazové funkce ChatGPT během následujících dvou týdnů.
Tyto funkce budou dostupné pouze uživatelům Plus a Enterprise.
OpenAI dnes oznámila, že zavede nové hlasové a obrazové funkce ChatGPT. Nové funkce umožní uživatelům hlasovou konverzaci ChatGPT nebo chatujte s chatbotem prostřednictvím obrázků.
Oznámení následuje po tvrzeních uživatelů Redditu, kteří tvrdili, že k nim získali přístup OpenAI's modely a následně tyto informace sdíleli na platformě. Redditor FeltSteam popsal model umělé inteligence s pracovním názvem Arrakis, který údajně umožňuje uživatelům „vkládat jakoukoli kombinaci textu, zvuku a videa“.
„Nová hlasová schopnost je poháněna novým modelem převodu textu na řeč, který je schopen generovat zvuk podobný lidskému zvuku pouze z textu a několika sekund ukázkové řeči,“ napsal Open AI v dokumentu. blogu. „Na vytvoření každého z hlasů jsme spolupracovali s profesionálními hlasovými herci. K přepisu vašich mluvených slov do textu také používáme Whisper, náš otevřený systém pro rozpoznávání řeči.“
Na Redditu jsem našel nějaké podivné nepotvrzené spekulace o výkonných interních modelech.
— Yam Peleg (@Yampeleg) Září 25, 2023
– Berte prosím vše s rezervou. –
Zdá se,
Dva různí uživatelé tvrdí, že mají přístup OpenAI's interní modely a sdílejí informace na redditu.
FeltSteam… pic.twitter.com/JRJH4xADZX
Díky novým funkcím se uživatelé mohou zapojit do konverzace tam a zpět ChatGPT pomocí jejich hlasů. Mohou také diskutovat o obrázcích s chatbotem. Funkce budou zavedeny během příštích dvou týdnů pro uživatele Plus a Enterprise.
Hlasová funkce bude k dispozici pro iOS a Android jako opt-in, zatímco funkce obrazu bude dostupná na všech platformách.
Chcete-li začít používat hlasovou funkci, mohou uživatelé přejít do Nastavení → Nové funkce v mobilní aplikaci a zvolit „hlasové konverzace“. Dále by měl uživatel klepnout na tlačítko sluchátek v pravém horním rohu domovské obrazovky a vybrat si preferovaný hlas z nabídky pěti různých hlasů.
Konverzovat s ChatGPT prostřednictvím obrázků může uživatel klepnout na tlačítko fotografie a buď pořídit obrázek, nebo jej vybrat. Pokud používáte iOS nebo Android, než budete pokračovat, klepněte na tlačítko plus. Navíc se mohou zapojit do diskuzí s více obrázky nebo je použít k vedení chatbota.
OpenAI říká, že porozumění obrazu je poháněno multimodálním GPT-3.5 A GPT-4. Tyto modely využívají schopnosti jazykového uvažování k analýze rozmanité řady vizuálního obsahu, včetně fotografií, snímků obrazovky a dokumentů obsahujících kombinaci textu a obrázků.
OpenAIpartnerství se Spotify
Spotify také dnes oznámila funkce hlasového překladu s umělou inteligencí. Nová funkce dokáže překládat podcasty do různých jazyků s využitím původního hlasu podcastera.
Podle Verge, na které se tato funkce překladu spoléhá OpenAInástroj pro přepis hlasu Whisper, který je schopen přepisovat anglickou řeč a překládat různé jazyky do angličtiny.
V rámci pilotního projektu se společnost spojila s podcastery Daxem Shepardem, Monikou Padmanovou, Lexem Fridmanem, Billem Simmonsem a Stevenem Bartlettem, aby vytvořili hlasové překlady řízené umělou inteligencí v jazycích, jako je španělština, francouzština a němčina pro konkrétní epizody katalogu a nadcházející vydání.
„Věříme, že promyšlený přístup k umělé inteligenci může pomoci vybudovat hlubší propojení mezi posluchači a tvůrci, což je klíčová součást mise Spotify odemknout potenciál lidské kreativity,“ uvedl v prohlášení Ziad Sultan, viceprezident pro personalizaci ve Spotify.
Hlasově přeložené epizody od tvůrců pilotních projektů budou celosvětově dostupné uživatelům Premium a Free.
Odmítnutí odpovědnosti
V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.
O autorovi
Cindy je novinářka v Metaverse Post, pokrývající témata související s web3, NFT, metaverse a AI, se zaměřením na rozhovory s Web3 hráči v oboru. Mluvila s více než 30 manažery na úrovni C a počítání a přinesla jejich cenné poznatky čtenářům. Cindy pochází ze Singapuru a nyní sídlí v Tbilisi v Gruzii. Je držitelkou bakalářského titulu v oboru komunikačních a mediálních studií na University of South Australia a má desetileté zkušenosti v žurnalistice a psaní. Spojte se s ní přes [chráněno e-mailem] s tiskovými nabídkami, oznámeními a příležitostmi k rozhovorům.
Další článkyCindy je novinářka v Metaverse Post, pokrývající témata související s web3, NFT, metaverse a AI, se zaměřením na rozhovory s Web3 hráči v oboru. Mluvila s více než 30 manažery na úrovni C a počítání a přinesla jejich cenné poznatky čtenářům. Cindy pochází ze Singapuru a nyní sídlí v Tbilisi v Gruzii. Je držitelkou bakalářského titulu v oboru komunikačních a mediálních studií na University of South Australia a má desetileté zkušenosti v žurnalistice a psaní. Spojte se s ní přes [chráněno e-mailem] s tiskovými nabídkami, oznámeními a příležitostmi k rozhovorům.