Новини Технологии
Ноември 11, 2025

Meta AI въвежда всеезично ASR, усъвършенствайки автоматичното разпознаване на реч на повече от 1,600 езика

Накратко

Meta AI стартира системата Omnilingual ASR, която осигурява разпознаване на реч за над 1,600 езика, и пусна модели с отворен код и корпус за 350 недостатъчно обслужвани езика.

Meta AI въвежда всеезично ASR, усъвършенствайки автоматичното разпознаване на реч на повече от 1,600 езика

Изследователско подразделение на технологичната компания Meta, специализирано в изкуствен интелект и добавена реалност, Мета AI обяви пускането на пазара на системата за автоматично разпознаване на реч (ASR) на Meta Omnilingual. 

Този набор от модели осигурява автоматично разпознаване на реч за над 1,600 езика, постигайки висококачествена производителност в безпрецедентен мащаб. В допълнение, Meta AI е Omnilingual wav2vec 2.0 с отворен код, самоконтролиран, масово многоезичен модел за представяне на реч със 7 милиарда параметъра, проектиран да поддържа различни задачи, свързани с речта.

Наред с тези инструменти, организацията публикува и Omnilingual ASR Corpus, курирана колекция от транскрибирана реч от 350 недостатъчно обслужвани езика, разработена в партньорство с глобални сътрудници.

Автоматичното разпознаване на реч се е усъвършенствало през последните години, постигайки почти перфектна точност за много широко разпространени езици. Разширяването на обхвата до езици с по-малко ресурси обаче остава предизвикателство поради високите изисквания за данни и изчислителни ресурси на съществуващите архитектури с изкуствен интелект. Системата Omnilingual ASR се справя с това ограничение, като мащабира речевия енкодер wav2vec 2.0 до 7 милиарда параметъра, създавайки богати многоезични представяния от сурова, нетранскрибирана реч. Два варианта на декодер преобразуват тези представяния в символни маркери: единият използва конекционистка темпорална класификация (CTC), а другият използва трансформаторен подход, подобен на тези в моделите на големи езици.

Тозият ASR подход, вдъхновен от LLM, постига най-съвременна производителност на повече от 1,600 езика, с процент на грешки в символите под 10 за 78% от тях, и въвежда по-гъвкав метод за добавяне на нови езици. 

За разлика от традиционните системи, които изискват експертна фина настройка, Omnilingual ASR може да включи неподдържан преди това език, използвайки само няколко сдвоени примера за аудио-текст, което позволява транскрипция без обширни данни, специализирана експертиза или високотехнологични изчисления. Въпреки че резултатите с нулев резултат все още не съответстват на напълно обучени системи, този метод предоставя мащабируем начин за включване на недостатъчно обслужвани езици в дигиталната екосистема.

Мета ИИ ще подобри разпознаването на реч с многоезичен ASR пакет и корпус 

Изследователският отдел пусна цялостен набор от модели и набор от данни, предназначени да усъвършенстват речевите технологии за всеки език. Надграждайки върху предишни изследвания на FAIR, Omnilingual ASR включва два варианта на декодери, вариращи от леки 300M модели за устройства с ниска мощност до 7B модели, предлагащи висока точност в различни приложения. Универсалният модел за реч wav2vec 2.0 се предлага и в множество размери, което позволява широк спектър от задачи, свързани с речта, извън ASR. Всички модели се предоставят под лиценз Apache 2.0, а наборът от данни е достъпен под CC-BY, което позволява на изследователи, разработчици и езикови защитници да адаптират и разширяват речевите решения, използвайки рамката с отворен код fairseq2 на FAIR в екосистемата PyTorch.

Омнилингвалният ASR се обучава върху един от най-големите и езиково разнообразни ASR корпуси, създавани някога, комбинирайки публично достъпни набори от данни със записи, предоставени от общността. За да се поддържат езици с ограничено дигитално присъствие, Мета AI си партнира с местни организации за набиране и компенсиране на носители на езика в отдалечени или недостатъчно документирани региони, създавайки Omnilingual ASR Corpus, най-големият спонтанен ASR набор от данни с ултра ниски ресурси до момента. Допълнителни сътрудничества чрез Програмата за партньори в езиковите технологии обединиха лингвисти, изследователи и езикови общности по целия свят, включително партньорства с Common Voice и Lanfrica/NaijaVoices на фондация Mozilla. Тези усилия предоставиха задълбочена езикова информация и културен контекст, гарантирайки, че технологията отговаря на местните нужди, като същевременно овластява разнообразните езикови общности в световен мащаб.

Отказ от отговорност

В съответствие с Доверете се насоките на проекта, моля, имайте предвид, че предоставената на тази страница информация не е предназначена да бъде и не трябва да се тълкува като правен, данъчен, инвестиционен, финансов или каквато и да е друга форма на съвет. Важно е да инвестирате само това, което можете да си позволите да загубите, и да потърсите независим финансов съвет, ако имате някакви съмнения. За допълнителна информация предлагаме да се обърнете към правилата и условията, както и към страниците за помощ и поддръжка, предоставени от издателя или рекламодателя. MetaversePost се ангажира с точно, безпристрастно отчитане, но пазарните условия подлежат на промяна без предизвестие.

За автора

Алиса, всеотдаен журналист в MPost, специализира в криптовалута, доказателства с нулево знание, инвестиции и обширната сфера на Web3. С остър поглед към нововъзникващите тенденции и технологии, тя предоставя изчерпателно покритие, за да информира и ангажира читателите в непрекъснато развиващия се пейзаж на дигиталните финанси.

Още статии
Алиса Дейвидсън
Алиса Дейвидсън

Алиса, всеотдаен журналист в MPost, специализира в криптовалута, доказателства с нулево знание, инвестиции и обширната сфера на Web3. С остър поглед към нововъзникващите тенденции и технологии, тя предоставя изчерпателно покритие, за да информира и ангажира читателите в непрекъснато развиващия се пейзаж на дигиталните финанси.

Hot Stories
Присъединете се към нашия бюлетин.
Последни новини

Спокойствието преди бурята Солана: Какво казват графиките, китовете и сигналите на веригата сега

Солана демонстрира силно представяне, обусловено от нарастващото приемане, институционалния интерес и ключовите партньорства, като същевременно е изправена пред потенциални...

Научете още

Крипто през април 2025 г.: Ключови тенденции, промени и какво предстои

През април 2025 г. крипто пространството се фокусира върху укрепването на основната инфраструктура, като Ethereum се подготвяше за Pectra ...

Научете още
Вижте повече
Прочети повече
Bitget Wallet си партнира с Ondo за пускането на над 100 токенизирани акции в BNB Chain 
Бизнес Новини Технологии
Bitget Wallet си партнира с Ondo за пускането на над 100 токенизирани акции в BNB Chain 
Декември 11, 2025
Gate публикува Доклад за прозрачност за ноември 2025 г., в който се открояват важни етапи в основните бизнес направления 
Новини Технологии
Gate публикува Доклад за прозрачност за ноември 2025 г., в който се открояват важни етапи в основните бизнес направления 
Декември 11, 2025
Animoca Brands Japan и Solv си сътрудничат за подобряване на институционалното управление на биткойн трезора
Новини Технологии
Animoca Brands Japan и Solv си сътрудничат за подобряване на институционалното управление на биткойн трезора
Декември 11, 2025
Sei стартира предварително инсталирано приложение на устройства Xiaomi, разработвайки платежна инфраструктура за стимулиране на растежа на партньорствата
Новини Технологии
Sei стартира предварително инсталирано приложение на устройства Xiaomi, разработвайки платежна инфраструктура за стимулиране на растежа на партньорствата
Декември 11, 2025
CRYPTOMERIA LABS PTE. LTD.