Звіт про новини Технологія
Травень 23, 2023

Meta розробила штучний інтелект з відкритим вихідним кодом, який розпізнає понад 4,000 розмовних мов

Коротко

MMS-проект компанії розпізнає понад 4,000 мов.

Як і більшість інших публічно оголошених проектів AI, Meta ділиться своїми моделями та кодом, щоб допомогти зберегти мовне розмаїття.

Завдяки цій роботі вони сподіваються зробити невеликий внесок у збереження неймовірного мовного розмаїття світу.

Meta створив мовна модель штучного інтелекту, яка є освіжаючим поворотом ChatGPT. Відкритий код Проект MMS був створений для збереження мовного розмаїття та заохочення досліджень і може розпізнавати понад 4,000 розмовних мов і створювати текст (мовлення) понад 1,100. Компанія має публічно оприлюднено його моделі та код сьогодні для досягнення своїх цілей.

«Ми публічно ділимося своїми творіннями та кодом, щоб заохотити інших у дослідницькому співтоваристві розвивати нашу роботу», — написав Мета. «Завдяки цій спробі ми сподіваємося зберегти величезне мовне розмаїття світу».

Meta розробила штучний інтелект з відкритим вихідним кодом, який розпізнає понад 4,000 розмовних мов

Типовою є складність навчання засобів розпізнавання мовлення та моделей синтезу мовлення на великих обсягах аудіо без міток транскрипції. Мітки мають вирішальне значення для навчання за допомогою машини, який може правильно ідентифікувати та класифікувати дані. Однак для мов, які зникнуть у найближчі десятиліття, «ціх даних просто не існує», як пояснює Мета.

Meta використовувала аудіозаписи релігійних текстів для збору даних у нетрадиційний спосіб. «Ми використовували переклади релігійних текстів, таких як Біблія, які були широко вивчені для дослідження мовного перекладу на основі тексту багатьма мовами, оскільки вони перекладені багатьма різними мовами», — заявили в компанії. Ми вилучили аудіозаписи людей, які читають ці тексти різними мовами, із загальнодоступних перекладів». Дослідники Meta додали до 4,000 мов модель.

Цей підхід звучить як рецепт сильно упередженої моделі штучного інтелекту, яка підтримує християнський світогляд. Однак перш ніж насміхатися над цією ідеєю, погляньте на неї з точки зору Мети: дослідники вважають, що це так, оскільки вони використовують коннекціоністську часову класифікацію CTC (або модель послідовності до послідовності чи послідовності), яка є набагато обмеженішою у термінах. обчислювальної потужності в порівнянні з великі мовні моделі (також відомі як типи послідовності) або послідовні моделі для розпізнавання мовлення. Мета каже, що це не призвело до чоловічої упередженості в релігійних записах, записаних більшістю чоловіків-мовців.

Meta використовувала wav2vec 2.0, модель «самоконтрольованого навчання репрезентації мовлення», щоб навчити wav2vec 2.0 модель вирівнювання що робить дані більш зручними для використання. Модель самоконтрольованого мовлення, яку Meta самостійно контролював із немаркованих даних, дала чудові результати. Meta виявив, що масові багатомовні моделі мовлення працюють добре порівняно з існуючими моделями та охоплюють у 10 разів більше мов, особливо порівняно з Шепіт. Meta досягла удвічі меншого рівня помилок у словах, тоді як Massively Multilingual Speech охоплювала в 11 разів більше мов.

Meta каже, що її нові моделі перетворення мови в текст не ідеальні. Наприклад, вони можуть неправильно перекладати слова чи фрази, що може призвести до образливої ​​та/або неправильної мови, пише компанія. Відповідальна розробка технологій штучного інтелекту повинна здійснюватися через співпрацю спільноти штучного інтелекту.

Оскільки Meta випустила MMS для дослідження з відкритим вихідним кодом, вона сподівається, що зможе змінити тенденцію до зникнення використання мови. У цьому баченні допоміжні технології, TTS і навіть віртуальна реальність і технології доповненої реальності можуть дозволити кожному говорити та навчатися рідною мовою. У ньому сказано: «Ми уявляємо світ, у якому технологія має протилежний ефект, спонукаючи людей підтримувати свої мови, оскільки вони можуть отримати доступ до інформації та використовувати технології, розмовляючи мовою, яку вони віддають перевагу».

  • Нещодавно Мета оголосила фінансові результати за перший квартал 2023 р. Незважаючи на нещодавні зусилля з реструктуризації, компанія здивувала інвесторів несподіваним зростанням продажів за перший квартал. У середу акції виросли на 12%.

Читайте більше пов’язаних статей:

відмова

Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.

про автора

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

інші статті
Дамір Ялалов
Дамір Ялалов

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

Hot Stories
Приєднуйтеся до нашої розсилки.
Останні новини

Від Ripple до The Big Green DAO: як криптовалютні проекти сприяють благодійності

Давайте розглянемо ініціативи, які використовують потенціал цифрових валют для благодійних цілей.

Дізнайтеся більше

AlphaFold 3, Med-Gemini та інші: як AI трансформує охорону здоров’я у 2024 році

ШІ проявляється різними способами в охороні здоров’я, від виявлення нових генетичних кореляцій до розширення можливостей роботизованих хірургічних систем...

Дізнайтеся більше
Приєднуйтесь до нашої спільноти інноваційних технологій
Детальніше
Читати далі
Crypto Exchange Jupiter представить Jupiter Swap V3, Dynamic Slippage та інші ключові оновлення в найближчі тижні
ринки Звіт про новини Технологія
Crypto Exchange Jupiter представить Jupiter Swap V3, Dynamic Slippage та інші ключові оновлення в найближчі тижні
14 Червня, 2024.
Polygon дебютує як центр управління, що забезпечує єдиний прозорий інтерфейс для управління спільнотою
Звіт про новини Технологія
Polygon дебютує як центр управління, що забезпечує єдиний прозорий інтерфейс для управління спільнотою 
14 Червня, 2024.
Binance зареєструвала понад 30 мільйонів нових користувачів у 2024 році, активи клієнтів перевищили позначку в 100 мільярдів доларів
ринки Звіт про новини Технологія
Binance зареєструвала понад 30 мільйонів нових користувачів у 2024 році, активи клієнтів перевищили позначку в 100 мільярдів доларів
14 Червня, 2024.
Amazon підтримує стартапи Generative AI, інвестувавши 230 мільйонів доларів, виділяє 80 мільйонів доларів на свою другу програму AWS Generative AI Accelerator
Business Звіт про новини Технологія
Amazon підтримує стартапи Generative AI, інвестувавши 230 мільйонів доларів, виділяє 80 мільйонів доларів на свою другу програму AWS Generative AI Accelerator
14 Червня, 2024.
CRYPTOMERIA LABS PTE. LTD.