Новини Технологии
Септември 25, 2023

OpenAIЕ ChatGPT Разкрива основна надстройка, добавя гласов разговор и чат с изображения

Накратко

OpenAI ще въведе нови възможности за глас и изображение ChatGPT през следващите две седмици.

Тези функции ще бъдат достъпни само за потребители на Plus и Enterprise.

OpenAI днес обяви, че ще пусне нови възможности за глас и изображения ChatGPT. Новите функции ще позволят на потребителите да водят гласов разговор с ChatGPT или разговаряйте с чатбота чрез изображения.

Съобщението следва твърдения на потребители на Reddit, които твърдят, че са получили достъп до OpenAIмоделите на и впоследствие сподели тази информация в платформата. Redditor FeltSteam описа AI модел с работното име Arrakis, който според съобщенията позволява на потребителите да „въвеждат произволна комбинация от текст, аудио и видео“.

„Новата гласова възможност се захранва от нов модел за преобразуване на текст в говор, способен да генерира звук, подобен на човешки, само от текст и няколко секунди примерна реч“, пише Open AI в блог пост. „Сътрудничихме си с професионални гласови актьори, за да създадем всеки от гласовете. Ние също използваме Whisper, нашата система за разпознаване на реч с отворен код, за да транскрибираме изговорените ви думи в текст.“

С новите функции потребителите могат да участват в разговор напред-назад с ChatGPT използвайки гласовете си. Те могат също да обсъждат изображения с чатбота. Функциите ще бъдат въведени през следващите две седмици за потребителите на Plus и Enterprise.

Гласовата възможност ще бъде достъпна за iOS и Android като опция, докато функцията за изображения ще бъде налична на всички платформи.

За да започнат да използват гласовата функция, потребителите могат да отидат в Настройки → Нови функции на мобилното приложение и да изберат „гласови разговори“. След това потребителят трябва да докосне бутона за слушалки в горния десен ъгъл на началния екран и да избере предпочитания от тях глас от пет различни гласа.

Да разговарям с ChatGPT чрез изображения, потребителят може да докосне бутона за снимка, за да заснеме изображение или да избере такова. Ако използвате iOS или Android, докоснете бутона плюс, преди да продължите. Освен това те могат да участват в дискусии с множество изображения или да ги използват, за да насочват чатбота.

OpenAI казва, че разбирането на изображението се захранва от мултимодалност GPT-3.5 и GPT-4. Тези модели използват способностите за езиково мислене, за да анализират разнообразен набор от визуално съдържание, включващо снимки, екранни снимки и документи, съдържащи комбинация от текст и изображения.

OpenAIпартньорството на Spotify

Spotify също обяви днес неговата задвижвана от AI функция за гласов превод. Новата функция може да превежда подкасти на различни езици, като използва оригиналния глас на подкаст.

Според Ръба, тази функция за превод разчита на OpenAIИнструментът за гласова транскрипция на Whisper, който може да транскрибира английска реч и да превежда различни езици на английски.

Като част от пилотния проект компанията се обедини с подкастъри Дакс Шепард, Моника Падман, Лекс Фридман, Бил Симънс и Стивън Бартлет, за да създаде управлявани от изкуствен интелект гласови преводи на езици като испански, френски и немски за конкретни епизоди от каталога и предстоящи издания.

„Ние вярваме, че обмисленият подход към AI може да помогне за изграждането на по-дълбоки връзки между слушатели и създатели, ключов компонент от мисията на Spotify да отключи потенциала на човешката креативност“, каза в изявление Зиад Султан, вицепрезидент на персонализацията в Spotify.

Гласово преведените епизоди от пилотни създатели ще бъдат достъпни по целия свят за Premium и Free потребители.

Отказ от отговорност

В съответствие с Доверете се насоките на проекта, моля, имайте предвид, че предоставената на тази страница информация не е предназначена да бъде и не трябва да се тълкува като правен, данъчен, инвестиционен, финансов или каквато и да е друга форма на съвет. Важно е да инвестирате само това, което можете да си позволите да загубите, и да потърсите независим финансов съвет, ако имате някакви съмнения. За допълнителна информация предлагаме да се обърнете към правилата и условията, както и към страниците за помощ и поддръжка, предоставени от издателя или рекламодателя. MetaversePost се ангажира с точно, безпристрастно отчитане, но пазарните условия подлежат на промяна без предизвестие.

За автора

Синди е журналист в Metaverse Post, обхващащи теми, свързани с web3, NFT, metaverse и AI, с акцент върху интервюта с Web3 играчи в индустрията. Тя е разговаряла с над 30 ръководители на ниво С и нараства, като е разказала ценните им прозрения на читателите. Първоначално от Сингапур, Синди сега е базирана в Тбилиси, Грузия. Тя има бакалавърска степен по комуникации и медийни изследвания от Университета на Южна Австралия и има десетилетие опит в журналистиката и писането. Свържете се с нея чрез [имейл защитен] с представяния за пресата, съобщения и възможности за интервю.

Още статии
Синди Тан
Синди Тан

Синди е журналист в Metaverse Post, обхващащи теми, свързани с web3, NFT, metaverse и AI, с акцент върху интервюта с Web3 играчи в индустрията. Тя е разговаряла с над 30 ръководители на ниво С и нараства, като е разказала ценните им прозрения на читателите. Първоначално от Сингапур, Синди сега е базирана в Тбилиси, Грузия. Тя има бакалавърска степен по комуникации и медийни изследвания от Университета на Южна Австралия и има десетилетие опит в журналистиката и писането. Свържете се с нея чрез [имейл защитен] с представяния за пресата, съобщения и възможности за интервю.

Hot Stories
Присъединете се към нашия бюлетин.
Последни новини

От Ripple до The Big Green DAO: Как проектите за криптовалута допринасят за благотворителността

Нека проучим инициативи, оползотворяващи потенциала на цифровите валути за благотворителни каузи.

Научете още

AlphaFold 3, Med-Gemini и други: Начинът, по който AI трансформира здравеопазването през 2024 г.

AI се проявява по различни начини в здравеопазването, от разкриване на нови генетични корелации до овластяване на роботизирани хирургически системи...

Научете още
Присъединете се към нашата иновативна техническа общност
Вижте повече
Прочети повече
От Ripple до The Big Green DAO: Как проектите за криптовалута допринасят за благотворителността
Анализ Crypto Wiki Бизнес образование Lifestyle пазари Софтуер Технологии
От Ripple до The Big Green DAO: Как проектите за криптовалута допринасят за благотворителността
Май 13, 2024
AlphaFold 3, Med-Gemini и други: Начинът, по който AI трансформира здравеопазването през 2024 г.
AI Wiki Анализ резюме Мнение Бизнес пазари Новини Софтуер Истории и рецензии Технологии
AlphaFold 3, Med-Gemini и други: Начинът, по който AI трансформира здравеопазването през 2024 г.
Май 13, 2024
Мрежата Nim ще пусне рамка за токенизиране на собственост върху AI и ще проведе продажба на доходи с моментна снимка, планирана за май
пазари Новини Технологии
Мрежата Nim ще пусне рамка за токенизиране на собственост върху AI и ще проведе продажба на доходи с моментна снимка, планирана за май
Май 13, 2024
Binance си партнира с Аржентина за борба с киберпрестъпността
Мнение Бизнес пазари Новини Софтуер Технологии
Binance си партнира с Аржентина за борба с киберпрестъпността
Май 13, 2024
CRYPTOMERIA LABS PTE. LTD.