OpenAIАвтора ChatGPT Представляет крупное обновление, добавляет голосовой разговор и графический чат
Коротко
OpenAI будет внедрять новые голосовые и графические возможности в ChatGPT в течение следующих двух недель.
Эти функции будут доступны только пользователям Plus и Enterprise.
OpenAI сегодня объявила, что будет внедрять новые голосовые и графические возможности в ChatGPT. Новые функции позволят пользователям вести голосовой разговор с ChatGPT или пообщайтесь с чат-ботом через изображения.
Это объявление последовало за заявлениями пользователей Reddit, которые утверждали, что получили доступ к OpenAIи впоследствии поделился этой информацией на платформе. Реддитор FeltSteam описал модель искусственного интеллекта с рабочим названием Arrakis, которая, как сообщается, позволяет пользователям «вводить любую комбинацию текста, аудио и видео».
«Новые голосовые возможности основаны на новой модели преобразования текста в речь, способной генерировать человеческий звук из просто текста и нескольких секунд образца речи», — пишет Open AI в своем отчете. блоге. «Мы сотрудничали с профессиональными актерами озвучивания, чтобы создать каждый голос. Мы также используем Whisper, нашу систему распознавания речи с открытым исходным кодом, чтобы транскрибировать произнесенные вами слова в текст».
На Reddit я нашел несколько странных неподтвержденных предположений о мощных внутренних моделях.
— Ям Пелег (@Yampeleg) 25 сентября, 2023
– Пожалуйста, относитесь ко всему с недоверием. –
Судя по всему,
Два разных пользователя утверждают, что получили доступ к OpenAIвнутренние модели и делятся информацией на Reddit.
Фетровый пар… pic.twitter.com/JRJH4xADZX
Благодаря новым функциям пользователи могут участвовать в двустороннем разговоре с ChatGPT используя свои голоса. Они также могут обсуждать изображения с чат-ботом. Эти функции будут доступны в течение следующих двух недель для пользователей Plus и Enterprise.
Голосовая возможность появится на iOS и Android по желанию, а функция изображения будет доступна на всех платформах.
Чтобы начать использовать голосовую функцию, пользователи могут перейти в «Настройки» → «Новые функции» в мобильном приложении и выбрать «Голосовые разговоры». Затем пользователь должен нажать кнопку наушников, расположенную в правом верхнем углу главного экрана, и выбрать предпочитаемый голос из пяти разных голосов.
Чтобы поговорить с ChatGPT Просматривая изображения, пользователь может нажать кнопку фото, чтобы сделать снимок или выбрать его. Если вы используете iOS или Android, нажмите кнопку «плюс», прежде чем продолжить. Кроме того, они могут участвовать в обсуждениях с несколькими изображениями или использовать их для управления чат-ботом.
OpenAI говорит, что понимание изображений основано на мультимодальном GPT-3.5 И GPT-4. Эти модели используют способности языкового мышления для анализа разнообразного визуального контента, включая фотографии, снимки экрана и документы, содержащие комбинацию текста и изображений.
OpenAIпартнерство со Spotify
Spotify тоже сегодня объявлено функция голосового перевода на базе искусственного интеллекта. Новая функция позволяет переводить подкасты на разные языки, используя оригинальный голос подкастера.
По Грань, эта функция перевода зависит от OpenAIИнструмент транскрипции голоса Whisper, который способен транскрибировать английскую речь и переводить различные языки на английский.
В рамках пилотного проекта компания объединилась с подкастерами Даксом Шепардом, Моникой Падман, Лексом Фридманом, Биллом Симмонсом и Стивеном Бартлеттом, чтобы создать голосовые переводы на основе искусственного интеллекта на такие языки, как испанский, французский и немецкий, для конкретных эпизодов каталога и будущих выпусков. релизы.
«Мы считаем, что продуманный подход к ИИ может помочь построить более глубокие связи между слушателями и создателями, что является ключевым компонентом миссии Spotify по раскрытию потенциала человеческого творчества», — заявил в своем заявлении Зиад Султан, вице-президент по персонализации Spotify.
Эпизоды с голосовым переводом от создателей пилотных версий будут доступны по всему миру премиум-пользователям и бесплатным пользователям.
Отказ от ответственности
В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.
Об авторе
Синди работает журналистом в Metaverse Post, охватывающие темы, связанные с web3, NFT, метавселенная и ИИ, с акцентом на интервью с Web3 игроки отрасли. Она поговорила с более чем 30 руководителями высшего звена, и их число продолжает расти, поделившись с читателями их ценной информацией. Синди родом из Сингапура, сейчас живет в Тбилиси, Грузия. Она имеет степень бакалавра в области коммуникаций и медиа-исследований Университета Южной Австралии и десятилетний опыт журналистики и писательской деятельности. Свяжитесь с ней через [электронная почта защищена] с презентациями для прессы, объявлениями и возможностями для интервью.
Другие статьиСинди работает журналистом в Metaverse Post, охватывающие темы, связанные с web3, NFT, метавселенная и ИИ, с акцентом на интервью с Web3 игроки отрасли. Она поговорила с более чем 30 руководителями высшего звена, и их число продолжает расти, поделившись с читателями их ценной информацией. Синди родом из Сингапура, сейчас живет в Тбилиси, Грузия. Она имеет степень бакалавра в области коммуникаций и медиа-исследований Университета Южной Австралии и десятилетний опыт журналистики и писательской деятельности. Свяжитесь с ней через [электронная почта защищена] с презентациями для прессы, объявлениями и возможностями для интервью.