Новостной репортаж Технологии
25 сентября, 2023

OpenAIАвтора ChatGPT Представляет крупное обновление, добавляет голосовой разговор и графический чат

Коротко

OpenAI будет внедрять новые голосовые и графические возможности в ChatGPT в течение следующих двух недель.

Эти функции будут доступны только пользователям Plus и Enterprise.

OpenAI сегодня объявила, что будет внедрять новые голосовые и графические возможности в ChatGPT. Новые функции позволят пользователям вести голосовой разговор с ChatGPT или пообщайтесь с чат-ботом через изображения.

Это объявление последовало за заявлениями пользователей Reddit, которые утверждали, что получили доступ к OpenAIи впоследствии поделился этой информацией на платформе. Реддитор FeltSteam описал модель искусственного интеллекта с рабочим названием Arrakis, которая, как сообщается, позволяет пользователям «вводить любую комбинацию текста, аудио и видео».

«Новые голосовые возможности основаны на новой модели преобразования текста в речь, способной генерировать человеческий звук из просто текста и нескольких секунд образца речи», — пишет Open AI в своем отчете. блоге. «Мы сотрудничали с профессиональными актерами озвучивания, чтобы создать каждый голос. Мы также используем Whisper, нашу систему распознавания речи с открытым исходным кодом, чтобы транскрибировать произнесенные вами слова в текст».

Благодаря новым функциям пользователи могут участвовать в двустороннем разговоре с ChatGPT используя свои голоса. Они также могут обсуждать изображения с чат-ботом. Эти функции будут доступны в течение следующих двух недель для пользователей Plus и Enterprise.

Голосовая возможность появится на iOS и Android по желанию, а функция изображения будет доступна на всех платформах.

Чтобы начать использовать голосовую функцию, пользователи могут перейти в «Настройки» → «Новые функции» в мобильном приложении и выбрать «Голосовые разговоры». Затем пользователь должен нажать кнопку наушников, расположенную в правом верхнем углу главного экрана, и выбрать предпочитаемый голос из пяти разных голосов.

Чтобы поговорить с ChatGPT Просматривая изображения, пользователь может нажать кнопку фото, чтобы сделать снимок или выбрать его. Если вы используете iOS или Android, нажмите кнопку «плюс», прежде чем продолжить. Кроме того, они могут участвовать в обсуждениях с несколькими изображениями или использовать их для управления чат-ботом.

OpenAI говорит, что понимание изображений основано на мультимодальном GPT-3.5 И GPT-4. Эти модели используют способности языкового мышления для анализа разнообразного визуального контента, включая фотографии, снимки экрана и документы, содержащие комбинацию текста и изображений.

OpenAIпартнерство со Spotify

Spotify тоже сегодня объявлено функция голосового перевода на базе искусственного интеллекта. Новая функция позволяет переводить подкасты на разные языки, используя оригинальный голос подкастера.

По Грань, эта функция перевода зависит от OpenAIИнструмент транскрипции голоса Whisper, который способен транскрибировать английскую речь и переводить различные языки на английский.

В рамках пилотного проекта компания объединилась с подкастерами Даксом Шепардом, Моникой Падман, Лексом Фридманом, Биллом Симмонсом и Стивеном Бартлеттом, чтобы создать голосовые переводы на основе искусственного интеллекта на такие языки, как испанский, французский и немецкий, для конкретных эпизодов каталога и будущих выпусков. релизы.

«Мы считаем, что продуманный подход к ИИ может помочь построить более глубокие связи между слушателями и создателями, что является ключевым компонентом миссии Spotify по раскрытию потенциала человеческого творчества», — заявил в своем заявлении Зиад Султан, вице-президент по персонализации Spotify.

Эпизоды с голосовым переводом от создателей пилотных версий будут доступны по всему миру премиум-пользователям и бесплатным пользователям.

Отказ от ответственности

В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.

Об авторе

Синди работает журналистом в Metaverse Post, охватывающие темы, связанные с web3, NFT, метавселенная и ИИ, с акцентом на интервью с Web3 игроки отрасли. Она поговорила с более чем 30 руководителями высшего звена, и их число продолжает расти, поделившись с читателями их ценной информацией. Синди родом из Сингапура, сейчас живет в Тбилиси, Грузия. Она имеет степень бакалавра в области коммуникаций и медиа-исследований Университета Южной Австралии и десятилетний опыт журналистики и писательской деятельности. Свяжитесь с ней через [электронная почта защищена] с презентациями для прессы, объявлениями и возможностями для интервью.

Другие статьи
Синди Тан
Синди Тан

Синди работает журналистом в Metaverse Post, охватывающие темы, связанные с web3, NFT, метавселенная и ИИ, с акцентом на интервью с Web3 игроки отрасли. Она поговорила с более чем 30 руководителями высшего звена, и их число продолжает расти, поделившись с читателями их ценной информацией. Синди родом из Сингапура, сейчас живет в Тбилиси, Грузия. Она имеет степень бакалавра в области коммуникаций и медиа-исследований Университета Южной Австралии и десятилетний опыт журналистики и писательской деятельности. Свяжитесь с ней через [электронная почта защищена] с презентациями для прессы, объявлениями и возможностями для интервью.

Hot Stories
Подпишитесь на нашу рассылку.
Новости

Институциональный аппетит к биткойн-ETF растет на фоне волатильности

Раскрытие информации через отчеты 13F показывает, что известные институциональные инвесторы балуются биткойн-ETF, подчеркивая растущее признание...

Узнать больше

Наступил день вынесения приговора: судьба CZ висит на волоске, поскольку суд США рассматривает ходатайство Министерства юстиции

Чанпэн Чжао сегодня предстанет перед судом США в Сиэтле.

Узнать больше
Присоединяйтесь к нашему сообществу инновационных технологий
Узнать больше
Читать далее
Nexo начинает «охоту», чтобы вознаградить пользователей токенами NEXO на сумму 12 миллионов долларов за взаимодействие с ее экосистемой
Области применения: Новостной репортаж Технологии
Nexo начинает «охоту», чтобы вознаградить пользователей токенами NEXO на сумму 12 миллионов долларов за взаимодействие с ее экосистемой
8 мая 2024
Биржа Revolut X Revolut привлекает криптотрейдеров нулевой комиссией производителя и расширенной аналитикой
Области применения: Software Истории и обзоры Технологии
Биржа Revolut X Revolut привлекает криптотрейдеров нулевой комиссией производителя и расширенной аналитикой
8 мая 2024
Криптовалютная торговая платформа BitMEX представляет торговлю опционами с нулевой комиссией и денежными стимулами
Бизнес Области применения: Новостной репортаж
Криптовалютная торговая платформа BitMEX представляет торговлю опционами с нулевой комиссией и денежными стимулами
8 мая 2024
Lisk официально переходит на Ethereum Layer 2 и представляет ядро ​​v4.0.6
Новостной репортаж Технологии
Lisk официально переходит на Ethereum Layer 2 и представляет ядро ​​v4.0.6
8 мая 2024
CRYPTOMERIA LABS PTE. ООО