Звіт про новини Технологія
Травень 23, 2023

Meta розробила штучний інтелект з відкритим вихідним кодом, який розпізнає понад 4,000 розмовних мов

Коротко

MMS-проект компанії розпізнає понад 4,000 мов.

Як і більшість інших публічно оголошених проектів AI, Meta ділиться своїми моделями та кодом, щоб допомогти зберегти мовне розмаїття.

Завдяки цій роботі вони сподіваються зробити невеликий внесок у збереження неймовірного мовного розмаїття світу.

Meta створив мовна модель штучного інтелекту, яка є освіжаючим поворотом ChatGPT. Відкритий код Проект MMS був створений для збереження мовного розмаїття та заохочення досліджень і може розпізнавати понад 4,000 розмовних мов і створювати текст (мовлення) понад 1,100. Компанія має публічно оприлюднено його моделі та код сьогодні для досягнення своїх цілей.

«Ми публічно ділимося своїми творіннями та кодом, щоб заохотити інших у дослідницькому співтоваристві розвивати нашу роботу», — написав Мета. «Завдяки цій спробі ми сподіваємося зберегти величезне мовне розмаїття світу».

Meta розробила штучний інтелект з відкритим вихідним кодом, який розпізнає понад 4,000 розмовних мов

Типовою є складність навчання засобів розпізнавання мовлення та моделей синтезу мовлення на великих обсягах аудіо без міток транскрипції. Мітки мають вирішальне значення для навчання за допомогою машини, який може правильно ідентифікувати та класифікувати дані. Однак для мов, які зникнуть у найближчі десятиліття, «ціх даних просто не існує», як пояснює Мета.

Meta використовувала аудіозаписи релігійних текстів для збору даних у нетрадиційний спосіб. «Ми використовували переклади релігійних текстів, таких як Біблія, які були широко вивчені для дослідження мовного перекладу на основі тексту багатьма мовами, оскільки вони перекладені багатьма різними мовами», — заявили в компанії. Ми вилучили аудіозаписи людей, які читають ці тексти різними мовами, із загальнодоступних перекладів». Дослідники Meta додали до 4,000 мов модель.

Цей підхід звучить як рецепт сильно упередженої моделі штучного інтелекту, яка підтримує християнський світогляд. Однак перш ніж насміхатися над цією ідеєю, погляньте на неї з точки зору Мети: дослідники вважають, що це так, оскільки вони використовують коннекціоністську часову класифікацію CTC (або модель послідовності до послідовності чи послідовності), яка є набагато обмеженішою у термінах. обчислювальної потужності в порівнянні з великі мовні моделі (також відомі як типи послідовності) або послідовні моделі для розпізнавання мовлення. Мета каже, що це не призвело до чоловічої упередженості в релігійних записах, записаних більшістю чоловіків-мовців.

Meta використовувала wav2vec 2.0, модель «самоконтрольованого навчання репрезентації мовлення», щоб навчити wav2vec 2.0 модель вирівнювання що робить дані більш зручними для використання. Модель самоконтрольованого мовлення, яку Meta самостійно контролював із немаркованих даних, дала чудові результати. Meta виявив, що масові багатомовні моделі мовлення працюють добре порівняно з існуючими моделями та охоплюють у 10 разів більше мов, особливо порівняно з Шепіт. Meta досягла удвічі меншого рівня помилок у словах, тоді як Massively Multilingual Speech охоплювала в 11 разів більше мов.

Meta каже, що її нові моделі перетворення мови в текст не ідеальні. Наприклад, вони можуть неправильно перекладати слова чи фрази, що може призвести до образливої ​​та/або неправильної мови, пише компанія. Відповідальна розробка технологій штучного інтелекту повинна здійснюватися через співпрацю спільноти штучного інтелекту.

Оскільки Meta випустила MMS для дослідження з відкритим вихідним кодом, вона сподівається, що зможе змінити тенденцію до зникнення використання мови. У цьому баченні допоміжні технології, TTS і навіть віртуальна реальність і технології доповненої реальності можуть дозволити кожному говорити та навчатися рідною мовою. У ньому сказано: «Ми уявляємо світ, у якому технологія має протилежний ефект, спонукаючи людей підтримувати свої мови, оскільки вони можуть отримати доступ до інформації та використовувати технології, розмовляючи мовою, яку вони віддають перевагу».

  • Нещодавно Мета оголосила фінансові результати за перший квартал 2023 р. Незважаючи на нещодавні зусилля з реструктуризації, компанія здивувала інвесторів несподіваним зростанням продажів за перший квартал. У середу акції виросли на 12%.

Читайте більше пов’язаних статей:

відмова

Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.

про автора

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

інші статті
Дамір Ялалов
Дамір Ялалов

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

Hot Stories
Приєднуйтеся до нашої розсилки.
Останні новини

Інституційний апетит зростає до біткойн ETF на тлі волатильності

Розкриття інформації через документи 13F свідчить про те, що відомі інституційні інвестори займаються біткойн ETF, підкреслюючи зростаюче визнання ...

Дізнайтеся більше

Настав день винесення вироку: суд США розглядає прохання Міністерства юстиції щодо долі CZ.

Changpeng Zhao готовий зіткнутися з вироком у американському суді в Сіетлі сьогодні.

Дізнайтеся більше
Приєднуйтесь до нашої спільноти інноваційних технологій
Детальніше
Читати далі
Injective об’єднує зусилля з AltLayer, щоб перенести безпеку в inEVM
Business Звіт про новини Технологія
Injective об’єднує зусилля з AltLayer, щоб перенести безпеку в inEVM
Травень 3, 2024
Masa об’єднується з Teller, щоб представити MASA Lending Pool, що дає можливість USDC запозичувати на базі
ринки Звіт про новини Технологія
Masa об’єднується з Teller, щоб представити MASA Lending Pool, що дає можливість USDC запозичувати на базі
Травень 3, 2024
Найближчими тижнями Velodrome запускає бета-версію Superchain і розповсюджується на блокчейни рівня 2 OP Stack
ринки Звіт про новини Технологія
Найближчими тижнями Velodrome запускає бета-версію Superchain і розповсюджується на блокчейни рівня 2 OP Stack
Травень 3, 2024
CARV оголошує про партнерство з Aethir для децентралізації рівня даних і розподілу винагород
Business Звіт про новини Технологія
CARV оголошує про партнерство з Aethir для децентралізації рівня даних і розподілу винагород
Травень 3, 2024
CRYPTOMERIA LABS PTE. LTD.