Meta розробила штучний інтелект з відкритим вихідним кодом, який розпізнає понад 4,000 розмовних мов
Коротко
MMS-проект компанії розпізнає понад 4,000 мов.
Як і більшість інших публічно оголошених проектів AI, Meta ділиться своїми моделями та кодом, щоб допомогти зберегти мовне розмаїття.
Завдяки цій роботі вони сподіваються зробити невеликий внесок у збереження неймовірного мовного розмаїття світу.
Meta створив мовна модель штучного інтелекту, яка є освіжаючим поворотом ChatGPT. Відкритий код Проект MMS був створений для збереження мовного розмаїття та заохочення досліджень і може розпізнавати понад 4,000 розмовних мов і створювати текст (мовлення) понад 1,100. Компанія має публічно оприлюднено його моделі та код сьогодні для досягнення своїх цілей.
«Ми публічно ділимося своїми творіннями та кодом, щоб заохотити інших у дослідницькому співтоваристві розвивати нашу роботу», — написав Мета. «Завдяки цій спробі ми сподіваємося зберегти величезне мовне розмаїття світу».
Типовою є складність навчання засобів розпізнавання мовлення та моделей синтезу мовлення на великих обсягах аудіо без міток транскрипції. Мітки мають вирішальне значення для навчання за допомогою машини, який може правильно ідентифікувати та класифікувати дані. Однак для мов, які зникнуть у найближчі десятиліття, «ціх даних просто не існує», як пояснює Мета.
Meta використовувала аудіозаписи релігійних текстів для збору даних у нетрадиційний спосіб. «Ми використовували переклади релігійних текстів, таких як Біблія, які були широко вивчені для дослідження мовного перекладу на основі тексту багатьма мовами, оскільки вони перекладені багатьма різними мовами», — заявили в компанії. Ми вилучили аудіозаписи людей, які читають ці тексти різними мовами, із загальнодоступних перекладів». Дослідники Meta додали до 4,000 мов модель.
Цей підхід звучить як рецепт сильно упередженої моделі штучного інтелекту, яка підтримує християнський світогляд. Однак перш ніж насміхатися над цією ідеєю, погляньте на неї з точки зору Мети: дослідники вважають, що це так, оскільки вони використовують коннекціоністську часову класифікацію CTC (або модель послідовності до послідовності чи послідовності), яка є набагато обмеженішою у термінах. обчислювальної потужності в порівнянні з великі мовні моделі (також відомі як типи послідовності) або послідовні моделі для розпізнавання мовлення. Мета каже, що це не призвело до чоловічої упередженості в релігійних записах, записаних більшістю чоловіків-мовців.
Meta використовувала wav2vec 2.0, модель «самоконтрольованого навчання репрезентації мовлення», щоб навчити wav2vec 2.0 модель вирівнювання що робить дані більш зручними для використання. Модель самоконтрольованого мовлення, яку Meta самостійно контролював із немаркованих даних, дала чудові результати. Meta виявив, що масові багатомовні моделі мовлення працюють добре порівняно з існуючими моделями та охоплюють у 10 разів більше мов, особливо порівняно з Шепіт. Meta досягла удвічі меншого рівня помилок у словах, тоді як Massively Multilingual Speech охоплювала в 11 разів більше мов.
Meta каже, що її нові моделі перетворення мови в текст не ідеальні. Наприклад, вони можуть неправильно перекладати слова чи фрази, що може призвести до образливої та/або неправильної мови, пише компанія. Відповідальна розробка технологій штучного інтелекту повинна здійснюватися через співпрацю спільноти штучного інтелекту.
Оскільки Meta випустила MMS для дослідження з відкритим вихідним кодом, вона сподівається, що зможе змінити тенденцію до зникнення використання мови. У цьому баченні допоміжні технології, TTS і навіть віртуальна реальність і технології доповненої реальності можуть дозволити кожному говорити та навчатися рідною мовою. У ньому сказано: «Ми уявляємо світ, у якому технологія має протилежний ефект, спонукаючи людей підтримувати свої мови, оскільки вони можуть отримати доступ до інформації та використовувати технології, розмовляючи мовою, яку вони віддають перевагу».
- Нещодавно Мета оголосила фінансові результати за перший квартал 2023 р. Незважаючи на нещодавні зусилля з реструктуризації, компанія здивувала інвесторів несподіваним зростанням продажів за перший квартал. У середу акції виросли на 12%.
Читайте більше пов’язаних статей:
- 4,000 людей пройшли психотерапію роботів ШІ, не підозрюючи про це
- Порушення зриву: як Stage Meta's Teleport Plaque Addresses захопить Метавсесвіт.
- FTC стримує амбіції Meta щодо віртуальної реальності судовим позовом
відмова
Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.
про автора
Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється.
інші статтіДамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється.