Новостной репортаж Технологии
23 мая 2023

Meta разработала речевой ИИ с открытым исходным кодом, который распознает более 4,000 разговорных языков

Коротко

Проект компании MMS может распознавать более 4,000 языков.

Как и большинство других публично объявленных проектов ИИ, Meta делится своими моделями и кодом, чтобы помочь сохранить языковое разнообразие.

Благодаря этой работе они надеются внести небольшой вклад в сохранение невероятного языкового разнообразия мира.

Мета создал модель языка искусственного интеллекта, которая представляет собой освежающий поворот ChatGPT. с открытым исходным кодом ММС проект был создан для сохранения языкового разнообразия и поощрения исследований и может распознавать более 4,000 разговорных языков и воспроизводить текст (речь) на более чем 1,100 языках. Компания имеет публично выпущенный свои модели и код сегодня для достижения своих целей.

«Мы публично делимся нашими творениями и кодом, чтобы побудить других членов исследовательского сообщества опираться на нашу работу», — написал Мета. «Благодаря этому начинанию мы надеемся сохранить огромное языковое разнообразие мира».

Meta разработала речевой ИИ с открытым исходным кодом, который распознает более 4,000 разговорных языков

Типична сложность обучения распознавателей речи и моделей преобразования текста в речь на большом количестве аудио без меток транскрипции. Этикетки имеют решающее значение для обучение с помощью машины, который может правильно идентифицировать и классифицировать данные. Однако для языков, которые исчезнут в ближайшие десятилетия, «этих данных просто не существует», как объясняет Мета.

Мета использовала аудиозаписи религиозных текстов для сбора данных нетрадиционным способом. «Мы использовали переводы религиозных текстов, таких как Библия, которые широко изучались для исследования языкового перевода на основе текста на многих языках, потому что они переведены на множество разных языков», — сказали в компании. Мы извлекли аудиозаписи людей, читающих эти тексты на разных языках, из общедоступных переводов». Исследователи Meta добавили в список более 4,000 языков. модель.

Такой подход звучит как рецепт сильно предвзятой модели ИИ, которая поддерживает христианское мировоззрение. Однако, прежде чем насмехаться над этой идеей, рассмотрите ее с точки зрения Мета: исследователи считают, что это так, потому что они используют коннекционистскую временную классификацию CTC (или модель последовательностей-последовательностей или последовательностей-типов), которая гораздо более ограничена в терминах. вычислительной мощности по сравнению с большие языковые модели (также известные как типы последовательности) или последовательные модели для распознавания речи. Мета говорит, что это не привело к предвзятости мужчин в религиозных записях, записанных большинством говорящих мужчин.

Meta использовала wav2vec 2.0, модель «обучения речевому представлению с самоконтролем», для обучения wav2vec 2.0. модель выравнивания что делает данные более пригодными для использования. Самоконтролируемая модель речи, которую Мета самостоятельно контролировала на основе немаркированных данных, привела к отличным результатам. Мета обнаружила, что массовые многоязычные речевые модели работают лучше по сравнению с существующими моделями и охватывают в 10 раз больше языков, особенно по сравнению с Whisper. Мета достигла вдвое меньшего количества ошибок в словах, в то время как Массовая многоязычная речь охватывала в 11 раз больше языков.

Meta говорит, что ее новые модели преобразования речи в текст не идеальны. Например, они могут неправильно переводить слова или фразы, что может привести к оскорбительной и/или некорректной речи, пишет компания. Ответственное развитие технологий искусственного интеллекта должно осуществляться посредством сотрудничества между сообществом искусственного интеллекта.

Поскольку Meta выпустила MMS для исследования с открытым исходным кодом, она надеется, что сможет обратить вспять тенденцию к исчезновению использования языка. В этом видении вспомогательные технологии, TTS и даже технологии виртуальной и дополненной реальности могут позволить каждому говорить и учиться на своем родном языке. В нем говорилось: «Мы представляем себе мир, в котором технологии имеют противоположный эффект, побуждая людей поддерживать свой язык, поскольку они могут получить доступ к информации и использовать технологии, говоря на предпочитаемом ими языке».

  • В последнее время Мета объявила финансовые результаты за первый квартал 2023 года. Несмотря на недавние усилия по реструктуризации, компания удивила инвесторов неожиданным ростом продаж за первый квартал. Акции выросли на 12% в среду.

Читайте больше статей по теме:

Отказ от ответственности

В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.

Об авторе

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Другие статьи
Дамир Ялалов
Дамир Ялалов

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Hot Stories
Подпишитесь на нашу рассылку.
Новости

Институциональный аппетит к биткойн-ETF растет на фоне волатильности

Раскрытие информации через отчеты 13F показывает, что известные институциональные инвесторы балуются биткойн-ETF, подчеркивая растущее признание...

Узнать больше

Наступил день вынесения приговора: судьба CZ висит на волоске, поскольку суд США рассматривает ходатайство Министерства юстиции

Чанпэн Чжао сегодня предстанет перед судом США в Сиэтле.

Узнать больше
Присоединяйтесь к нашему сообществу инновационных технологий
Узнать больше
Читать далее
Injective объединяет усилия с AltLayer, чтобы внести изменения в безопасность в inEVM
Бизнес Новостной репортаж Технологии
Injective объединяет усилия с AltLayer, чтобы внести изменения в безопасность в inEVM
3 мая 2024
Masa объединяется с Teller, чтобы представить кредитный пул MASA, позволяющий заимствовать USDC на базе
Области применения: Новостной репортаж Технологии
Masa объединяется с Teller, чтобы представить кредитный пул MASA, позволяющий заимствовать USDC на базе
3 мая 2024
Velodrome запускает бета-версию Superchain в ближайшие недели и распространяется на блокчейны второго уровня стека OP
Области применения: Новостной репортаж Технологии
Velodrome запускает бета-версию Superchain в ближайшие недели и распространяется на блокчейны второго уровня стека OP
3 мая 2024
CARV объявляет о партнерстве с Aethir для децентрализации уровня данных и распределения вознаграждений
Бизнес Новостной репортаж Технологии
CARV объявляет о партнерстве с Aethir для децентрализации уровня данных и распределения вознаграждений
3 мая 2024
CRYPTOMERIA LABS PTE. ООО