Звіт про новини Технологія
Вересень 25, 2023

OpenAIАвтора ChatGPT Розкриває значне оновлення, додає голосову розмову та чат із зображеннями

Коротко

OpenAI запровадить нові можливості голосу та зображення ChatGPT протягом наступних двох тижнів.

Ці функції будуть доступні лише для користувачів Plus і Enterprise.

OpenAI сьогодні оголосив про впровадження нових можливостей голосу та зображення ChatGPT. Нові функції дозволять користувачам вести голосову розмову з ChatGPT або спілкуйтеся з чат-ботом за допомогою зображень.

Оголошення було зроблено після заяв користувачів Reddit, які стверджували, що вони отримали доступ до OpenAIмоделей і згодом поділився цією інформацією на платформі. Redditor FeltSteam описав модель ШІ з робочою назвою Arrakis, яка, як повідомляється, дозволяє користувачам «вводити будь-яку комбінацію тексту, аудіо та відео».

«Нова голосова можливість базується на новій моделі перетворення тексту в мовлення, здатній генерувати звук, схожий на людину, лише з тексту та кількох секунд зразка мовлення», — написав Open AI у блог. «Ми співпрацювали з професійними акторами озвучування, щоб створити кожен із голосів. Ми також використовуємо Whisper, нашу систему розпізнавання мовлення з відкритим кодом, щоб транскрибувати ваші вимовлені слова в текст».

Завдяки новим функціям користувачі можуть брати участь у бесіді ChatGPT використовуючи свої голоси. Вони також можуть обговорювати зображення з чат-ботом. Протягом наступних двох тижнів ці функції будуть доступні для користувачів Plus і Enterprise.

Голосовий зв’язок з’явиться в iOS і Android за бажанням, тоді як функція зображення буде доступна на всіх платформах.

Щоб почати користуватися функцією голосу, користувачі можуть перейти в Налаштування → Нові функції в мобільному додатку та вибрати «голосові розмови». Далі користувач повинен торкнутися кнопки навушників у верхньому правому куті головного екрана та вибрати бажаний голос із п’яти різних голосів.

Розмовляти з ChatGPT за допомогою зображень користувач може натиснути кнопку фото, щоб зробити знімок або вибрати його. Якщо ви використовуєте iOS або Android, торкніться кнопки з плюсом, перш ніж продовжити. Крім того, вони можуть брати участь в обговореннях за допомогою кількох зображень або використовувати їх для керування чат-ботом.

OpenAI каже, що розуміння зображення залежить від мультимодальності GPT-3.5 і GPT-4. Ці моделі використовують можливості мовного мислення для аналізу різноманітного масиву візуального вмісту, включаючи фотографії, знімки екрана та документи, що містять поєднання тексту та зображень.

OpenAIпартнерство з Spotify

Spotify також сьогодні оголосив його функція голосового перекладу на основі ШІ. Нова функція може перекладати подкасти різними мовами, використовуючи оригінальний голос автора подкастів.

За оцінками Грань, на яку спирається ця функція перекладу OpenAIінструмент транскрипції голосу, Whisper, який може транскрибувати англійську мову та перекладати різні мови англійською.

У рамках пілотного проекту компанія об’єдналася з подкастерами Дексом Шепардом, Монікою Падман, Лексом Фрідманом, Біллом Сіммонсом і Стівеном Бартлеттом, щоб створити голосовий переклад на основі штучного інтелекту такими мовами, як іспанська, французька та німецька, для окремих епізодів каталогу та майбутніх серій. випуски.

«Ми віримо, що продуманий підхід до штучного інтелекту може допомогти побудувати глибші зв’язки між слухачами та творцями, що є ключовим компонентом місії Spotify, щоб розкрити потенціал людської творчості», — сказав у заяві Зіад Султан, віце-президент із персоналізації Spotify.

Епізоди з голосовим перекладом від пілотних творців будуть доступні по всьому світу для користувачів преміум-класу та безкоштовних користувачів.

відмова

Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.

про автора

Сінді працює журналістом у Metaverse Post, що охоплює теми, пов’язані з web3, NFT, метавсесвіт та ШІ, зосереджуючись на інтерв’ю з Web3 гравців галузі. Вона поспілкувалася з понад 30 керівниками вищого рівня та розповіла читачам про їхні цінні ідеї. Родом із Сінгапуру, Сінді тепер живе в Тбілісі, Грузія. Вона отримала ступінь бакалавра з комунікацій та медіа-досліджень в Університеті Південної Австралії та має десятирічний досвід роботи в журналістиці та письменництві. Зв'яжіться з нею через [захищено електронною поштою] з презентаціями для преси, оголошеннями та можливостями для інтерв’ю.

інші статті
Сінді Тан
Сінді Тан

Сінді працює журналістом у Metaverse Post, що охоплює теми, пов’язані з web3, NFT, метавсесвіт та ШІ, зосереджуючись на інтерв’ю з Web3 гравців галузі. Вона поспілкувалася з понад 30 керівниками вищого рівня та розповіла читачам про їхні цінні ідеї. Родом із Сінгапуру, Сінді тепер живе в Тбілісі, Грузія. Вона отримала ступінь бакалавра з комунікацій та медіа-досліджень в Університеті Південної Австралії та має десятирічний досвід роботи в журналістиці та письменництві. Зв'яжіться з нею через [захищено електронною поштою] з презентаціями для преси, оголошеннями та можливостями для інтерв’ю.

Hot Stories
Приєднуйтеся до нашої розсилки.
Останні новини

Від Ripple до The Big Green DAO: як криптовалютні проекти сприяють благодійності

Давайте розглянемо ініціативи, які використовують потенціал цифрових валют для благодійних цілей.

Дізнайтеся більше

AlphaFold 3, Med-Gemini та інші: як AI трансформує охорону здоров’я у 2024 році

ШІ проявляється різними способами в охороні здоров’я, від виявлення нових генетичних кореляцій до розширення можливостей роботизованих хірургічних систем...

Дізнайтеся більше
Приєднуйтесь до нашої спільноти інноваційних технологій
Детальніше
Читати далі
Від Ripple до The Big Green DAO: як криптовалютні проекти сприяють благодійності
аналіз криптовалютні гаманці Wiki Business Освіта Стиль життя ринки Софтвер Технологія
Від Ripple до The Big Green DAO: як криптовалютні проекти сприяють благодійності
Травень 13, 2024
AlphaFold 3, Med-Gemini та інші: як AI трансформує охорону здоров’я у 2024 році
AI Wiki аналіз Digest Думка Business ринки Звіт про новини Софтвер Розповіді та огляди Технологія
AlphaFold 3, Med-Gemini та інші: як AI трансформує охорону здоров’я у 2024 році
Травень 13, 2024
Мережа Nim розгортає структуру токенізації AI Ownership і проводить продаж доходів із датою моментального знімка, запланованою на травень
ринки Звіт про новини Технологія
Мережа Nim розгортає структуру токенізації AI Ownership і проводить продаж доходів із датою моментального знімка, запланованою на травень
Травень 13, 2024
Binance співпрацює з Аргентиною для боротьби з кіберзлочинністю
Думка Business ринки Звіт про новини Софтвер Технологія
Binance співпрацює з Аргентиною для боротьби з кіберзлочинністю
Травень 13, 2024
CRYPTOMERIA LABS PTE. LTD.