Новостной репортаж Технологии
07 ноября 2023

Шепот V3 от OpenAI Переходит на открытый исходный код, расширяя возможности распознавания голоса на разных языках

Коротко

OpenAI объявила о выпуске с открытым исходным кодом WHISPER V3, современной модели распознавания голоса на нескольких языках.

OpenAI Представляет Whisper V3: революция в распознавании голоса на разных языках

Исследовательская компания по искусственному интеллекту (ИИ) OpenAI, совершила значительный шаг в области распознавания речи, открыв исходный код своей современной модели. Шепот большой-v3, во время мероприятия «День разработчика».

Эта последняя версия модели Whisper демонстрирует замечательную способность понимать и расшифровывать речь на множестве языков, расширяя ее применимость за пределы англоориентированных моделей прошлого.

Whisper big-v3 хорошо себя чувствует в самых разных условиях, умело обрабатывая различные языковые вводы. По OpenAI, а модели, ориентированные на англоязычные приложения, такие как tiny.en и base.en показать превосходную производительность. Однако эффективность Whisper big-v3 может колебаться в зависимости от транскрибируемого языка.

Первоначально ориентированная на английский язык после ее запуска в сентябре прошлого года, модель расширила свои возможности с версией 2 в декабре, включив поддержку ряда языков, хотя и не уточнила, какие именно.

Whisper big-v3 доступен по разрешительной лицензии на GitHub, позволяет пользователям расшифровывать различные формы контента с лучшей в своем классе точностью. Его уникальная функция временных меток добавляет значительную ценность, потенциально революционизируя создание субтитров на таких видеоплатформах, как YouTube.

Источник: OpenAI

OpenAIПрорыв в области многоязычного распознавания речи

Whisper big-v3 обрабатывает звук, сначала сегментируя его на 30-секундные клипы, а затем пропуская его через сложную систему, включающую кодировщик и декодер для генерации выходного сигнала.

Эти компоненты работают в унисон, предсказывая текстовую транскрипцию произнесенных слов. Одной из технических особенностей Whisper big-v3 является функция идентификации языка, которая не только расшифровывает многоязычную речь, но и переводит ее на английский язык.

Хотя первоначальные планы предполагали интеграцию с популярной ChatGPT для облегчения прямого голосового взаимодействия с чат-ботом, OpenAI решил предоставить общественности прямой доступ к Whisper big-v3. Стоит отметить, что нынешняя целевая аудитория Whisper — это прежде всего исследователи, а не широкая общественность.

OpenAIПриверженность компании развитию надежной обработки речи очевидна в их решении открыть исходный код Whisper big-v3. Организация подчеркивает свою цель способствовать развитию практического применения и дальнейшим исследованиям в этой области.

OpenAI усовершенствовала свой инструмент искусственного интеллекта, используя обширный набор данных, включающий 680,000 XNUMX часов тщательно отслеживаемых данных, собранных из Интернета, включая значительную долю неанглоязычных аудиозаписей. Этот шаг направлен на стимулирование инноваций и расширение сферы применения технологий распознавания голоса во всем мире.

Отказ от ответственности

В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.

Об авторе

Ник — опытный аналитик и писатель в Metaverse Post, специализирующаяся на предоставлении передовых знаний о быстро меняющемся мире технологий с особым акцентом на AI / ML, XR, VR, аналитику в цепочке и разработку блокчейна. Его статьи вовлекают и информируют разнообразную аудиторию, помогая ей опережать технологические достижения. Обладая степенью магистра экономики и менеджмента, Ник хорошо разбирается в нюансах делового мира и его взаимосвязи с новыми технологиями.

Другие статьи
Ник Асти
Ник Асти

Ник — опытный аналитик и писатель в Metaverse Post, специализирующаяся на предоставлении передовых знаний о быстро меняющемся мире технологий с особым акцентом на AI / ML, XR, VR, аналитику в цепочке и разработку блокчейна. Его статьи вовлекают и информируют разнообразную аудиторию, помогая ей опережать технологические достижения. Обладая степенью магистра экономики и менеджмента, Ник хорошо разбирается в нюансах делового мира и его взаимосвязи с новыми технологиями.

Hot Stories
Подпишитесь на нашу рассылку.
Новости

Институциональный аппетит к биткойн-ETF растет на фоне волатильности

Раскрытие информации через отчеты 13F показывает, что известные институциональные инвесторы балуются биткойн-ETF, подчеркивая растущее признание...

Узнать больше

Наступил день вынесения приговора: судьба CZ висит на волоске, поскольку суд США рассматривает ходатайство Министерства юстиции

Чанпэн Чжао сегодня предстанет перед судом США в Сиэтле.

Узнать больше
Присоединяйтесь к нашему сообществу инновационных технологий
Узнать больше
Читать далее
Puffer Finance запускает свою основную сеть и расширяет возможности операторов узлов для децентрализации сети
Новостной репортаж Технологии
Puffer Finance запускает свою основную сеть и расширяет возможности операторов узлов для децентрализации сети
9 мая 2024
Nexo начинает «охоту», чтобы вознаградить пользователей токенами NEXO на сумму 12 миллионов долларов за взаимодействие с ее экосистемой
Области применения: Новостной репортаж Технологии
Nexo начинает «охоту», чтобы вознаградить пользователей токенами NEXO на сумму 12 миллионов долларов за взаимодействие с ее экосистемой
8 мая 2024
Биржа Revolut X Revolut привлекает криптотрейдеров нулевой комиссией производителя и расширенной аналитикой
Области применения: Software Истории и обзоры Технологии
Биржа Revolut X Revolut привлекает криптотрейдеров нулевой комиссией производителя и расширенной аналитикой
8 мая 2024
Криптовалютная торговая платформа BitMEX представляет торговлю опционами с нулевой комиссией и денежными стимулами
Бизнес Области применения: Новостной репортаж
Криптовалютная торговая платформа BitMEX представляет торговлю опционами с нулевой комиссией и денежными стимулами
8 мая 2024
CRYPTOMERIA LABS PTE. ООО