OpenAIЕ ChatGPT Разкрива основна надстройка, добавя гласов разговор и чат с изображения
Накратко
OpenAI ще въведе нови възможности за глас и изображение ChatGPT през следващите две седмици.
Тези функции ще бъдат достъпни само за потребители на Plus и Enterprise.
OpenAI днес обяви, че ще пусне нови възможности за глас и изображения ChatGPT. Новите функции ще позволят на потребителите да водят гласов разговор с ChatGPT или разговаряйте с чатбота чрез изображения.
Съобщението следва твърдения на потребители на Reddit, които твърдят, че са получили достъп до OpenAIмоделите на и впоследствие сподели тази информация в платформата. Redditor FeltSteam описа AI модел с работното име Arrakis, който според съобщенията позволява на потребителите да „въвеждат произволна комбинация от текст, аудио и видео“.
„Новата гласова възможност се захранва от нов модел за преобразуване на текст в говор, способен да генерира звук, подобен на човешки, само от текст и няколко секунди примерна реч“, пише Open AI в блог пост. „Сътрудничихме си с професионални гласови актьори, за да създадем всеки от гласовете. Ние също използваме Whisper, нашата система за разпознаване на реч с отворен код, за да транскрибираме изговорените ви думи в текст.“
Открих някои странни непотвърдени спекулации за мощни вътрешни модели в Reddit.
— Ям Пелег (@Yampeleg) Септември 25, 2023
– Моля, приемайте всичко със зърно сол. –
Очевидно,
Двама различни потребители твърдят, че са получили достъп до OpenAIвътрешните модели на и споделят информация в reddit.
FeltSteam… pic.twitter.com/JRJH4xADZX
С новите функции потребителите могат да участват в разговор напред-назад с ChatGPT използвайки гласовете си. Те могат също да обсъждат изображения с чатбота. Функциите ще бъдат въведени през следващите две седмици за потребителите на Plus и Enterprise.
Гласовата възможност ще бъде достъпна за iOS и Android като опция, докато функцията за изображения ще бъде налична на всички платформи.
За да започнат да използват гласовата функция, потребителите могат да отидат в Настройки → Нови функции на мобилното приложение и да изберат „гласови разговори“. След това потребителят трябва да докосне бутона за слушалки в горния десен ъгъл на началния екран и да избере предпочитания от тях глас от пет различни гласа.
Да разговарям с ChatGPT чрез изображения, потребителят може да докосне бутона за снимка, за да заснеме изображение или да избере такова. Ако използвате iOS или Android, докоснете бутона плюс, преди да продължите. Освен това те могат да участват в дискусии с множество изображения или да ги използват, за да насочват чатбота.
OpenAI казва, че разбирането на изображението се захранва от мултимодалност GPT-3.5 и GPT-4. Тези модели използват способностите за езиково мислене, за да анализират разнообразен набор от визуално съдържание, включващо снимки, екранни снимки и документи, съдържащи комбинация от текст и изображения.
OpenAIпартньорството на Spotify
Spotify също обяви днес неговата задвижвана от AI функция за гласов превод. Новата функция може да превежда подкасти на различни езици, като използва оригиналния глас на подкаст.
Според Ръба, тази функция за превод разчита на OpenAIИнструментът за гласова транскрипция на Whisper, който може да транскрибира английска реч и да превежда различни езици на английски.
Като част от пилотния проект компанията се обедини с подкастъри Дакс Шепард, Моника Падман, Лекс Фридман, Бил Симънс и Стивън Бартлет, за да създаде управлявани от изкуствен интелект гласови преводи на езици като испански, френски и немски за конкретни епизоди от каталога и предстоящи издания.
„Ние вярваме, че обмисленият подход към AI може да помогне за изграждането на по-дълбоки връзки между слушатели и създатели, ключов компонент от мисията на Spotify да отключи потенциала на човешката креативност“, каза в изявление Зиад Султан, вицепрезидент на персонализацията в Spotify.
Гласово преведените епизоди от пилотни създатели ще бъдат достъпни по целия свят за Premium и Free потребители.
Отказ от отговорност
В съответствие с Доверете се насоките на проекта, моля, имайте предвид, че предоставената на тази страница информация не е предназначена да бъде и не трябва да се тълкува като правен, данъчен, инвестиционен, финансов или каквато и да е друга форма на съвет. Важно е да инвестирате само това, което можете да си позволите да загубите, и да потърсите независим финансов съвет, ако имате някакви съмнения. За допълнителна информация предлагаме да се обърнете към правилата и условията, както и към страниците за помощ и поддръжка, предоставени от издателя или рекламодателя. MetaversePost се ангажира с точно, безпристрастно отчитане, но пазарните условия подлежат на промяна без предизвестие.
За автора
Синди е журналист в Metaverse Post, обхващащи теми, свързани с web3, NFT, metaverse и AI, с акцент върху интервюта с Web3 играчи в индустрията. Тя е разговаряла с над 30 ръководители на ниво С и нараства, като е разказала ценните им прозрения на читателите. Първоначално от Сингапур, Синди сега е базирана в Тбилиси, Грузия. Тя има бакалавърска степен по комуникации и медийни изследвания от Университета на Южна Австралия и има десетилетие опит в журналистиката и писането. Свържете се с нея чрез [имейл защитен] с представяния за пресата, съобщения и възможности за интервю.
Още статииСинди е журналист в Metaverse Post, обхващащи теми, свързани с web3, NFT, metaverse и AI, с акцент върху интервюта с Web3 играчи в индустрията. Тя е разговаряла с над 30 ръководители на ниво С и нараства, като е разказала ценните им прозрения на читателите. Първоначално от Сингапур, Синди сега е базирана в Тбилиси, Грузия. Тя има бакалавърска степен по комуникации и медийни изследвания от Университета на Южна Австралия и има десетилетие опит в журналистиката и писането. Свържете се с нея чрез [имейл защитен] с представяния за пресата, съобщения и възможности за интервю.