Yangiliklar hisoboti texnologiya
Noyabr 11, 2025

Meta AI 1,600 dan ortiq tillarda nutqni avtomatik aniqlashni taraqqiy ettiruvchi Omnilingual ASR ni taqdim etadi

Qisqacha

Meta AI 1,600 dan ortiq tillar uchun nutqni aniqlashni ta'minlovchi Omnilingual ASR tizimini ishga tushirdi va ochiq manbali modellarni va 350 ta kam xizmat ko'rsatuvchi tillar uchun korpusni chiqardi.

Meta AI 1,600 dan ortiq tillarda nutqni avtomatik aniqlashni taraqqiy ettiruvchi Omnilingual ASR ni taqdim etadi

Meta texnologiya kompaniyasining AI va kengaytirilgan haqiqatga ixtisoslashgan tadqiqot bo'limi, Meta AI Meta Omnilingual Automatic Speech Recognition (ASR) tizimining chiqarilishini e'lon qildi. 

Ushbu modellar to'plami 1,600 dan ortiq tillar uchun avtomatik nutqni aniqlash imkonini beradi va misli ko'rilmagan miqyosda yuqori sifatli ishlashga erishadi. Bundan tashqari, Meta AI ochiq manbali Omnilingual wav2vec 2.0 bo‘lib, o‘z-o‘zidan boshqariladigan, massiv ko‘p tilli nutqni namoyish qilish modeli bo‘lib, 7 milliard parametrga ega bo‘lib, turli quyi oqimdagi nutq vazifalarini qo‘llab-quvvatlash uchun mo‘ljallangan.

Ushbu vositalar bilan bir qatorda tashkilot global hamkorlar bilan hamkorlikda ishlab chiqilgan Omnilingual ASR Corpusni, 350 ta xizmat koʻrsatilmagan tillardan transkripsiyalangan nutqlar toʻplamini ham chiqaradi.

Nutqni avtomatik aniqlash so‘nggi yillarda rivojlanib, ko‘plab keng tarqalgan tillar uchun deyarli mukammal aniqlikka erishdi. Mavjud AI arxitekturalarining yuqori ma'lumotlari va hisoblash talablari tufayli kam resursli tillar uchun qamrovni kengaytirish qiyin bo'lib qolmoqda. Omnilingual ASR tizimi ushbu cheklovni wav2vec 2.0 nutq kodlagichini 7 milliard parametrgacha kengaytirib, xom, transkripsiyalanmagan nutqdan boy ko'p tilli tasvirlarni yaratish orqali hal qiladi. Ikkita dekoder varianti bu tasvirlarni belgilar tokenlariga moslashtiradi: biri ulanish vaqtinchalik tasnifi (CTC) yordamida, ikkinchisi esa katta til modellaridagi kabi transformatorga asoslangan yondashuvdan foydalanadi.

LLM tomonidan ilhomlantirilgan ushbu ASR yondashuvi 1,600 dan ortiq tillarda eng soʻnggi samaradorlikka erishadi, ularning 78 foizida belgilar xatosi darajasi 10 dan past boʻladi va yangi tillarni qoʻshishning yanada moslashuvchan usulini joriy qiladi. 

Mutaxassis tomonidan nozik sozlashni talab qiladigan an'anaviy tizimlardan farqli o'laroq, Omnilingual ASR ilgari qo'llab-quvvatlanmaydigan tilni faqat bir nechta juftlashtirilgan audio-matnli misollar yordamida o'z ichiga oladi, bu esa keng ko'lamli ma'lumotlar, maxsus tajriba yoki yuqori darajadagi hisoblashlarsiz transkripsiyani ta'minlaydi. Nolinchi otish natijalari hali toʻliq oʻqitilgan tizimlarga mos kelmasa-da, bu usul yetarli darajada xizmat koʻrsatilmagan tillarni raqamli ekotizimga olib kirishning kengaytiriladigan usulini taʼminlaydi.

Meta AI Omnilingual ASR Suite va korpus yordamida nutqni aniqlashni yaxshilaydi 

Tadqiqot bo'limi har qanday til uchun nutq texnologiyasini rivojlantirish uchun mo'ljallangan keng qamrovli modellar to'plamini va ma'lumotlar to'plamini chiqardi. FAIRning oldingi tadqiqotlariga asoslanib, Omnilingual ASR ikkita dekoder variantini o'z ichiga oladi, ular kam quvvatli qurilmalar uchun engil vaznli 300M modellardan turli xil ilovalarda yuqori aniqlikni ta'minlovchi 7B modellarigacha. Umumiy maqsadli wav2vec 2.0 nutq asosi modeli bir nechta oʻlchamlarda ham mavjud boʻlib, bu ASRdan tashqari nutq bilan bogʻliq keng koʻlamli vazifalarni bajarish imkonini beradi. Barcha modellar Apache 2.0 litsenziyasi ostida taqdim etilgan va maʼlumotlar toʻplami CC-BY ostida mavjud boʻlib, tadqiqotchilar, ishlab chiquvchilar va til himoyachilariga PyTorch ekotizimida FAIRning ochiq manbali fairseq2 tizimidan foydalangan holda nutq yechimlarini moslashtirish va kengaytirish imkonini beradi.

Omnilingual ASR hozirgacha yig‘ilgan eng katta va til jihatidan eng xilma-xil ASR korpuslaridan birida o‘qitilib, ommaga ochiq ma’lumotlar to‘plamini hamjamiyat manbalaridan olingan yozuvlar bilan birlashtiradi. Raqamli mavjudligi cheklangan tillarni qo'llab-quvvatlash uchun, Meta AI Olis yoki hujjatsiz hududlarda ona tilida so'zlashuvchilarni yollash va ularga kompensatsiya to'lash uchun mahalliy tashkilotlar bilan hamkorlik qilib, Omnilingual ASR Corpus, hozirgi kunga qadar eng katta ultra kam resursli spontan ASR ma'lumotlar to'plamini yaratdi. Til texnologiyasi boʻyicha hamkorlik dasturi orqali qoʻshimcha hamkorliklar butun dunyo boʻylab tilshunoslar, tadqiqotchilar va til hamjamiyatlarini, jumladan Mozilla Foundation Common Voice va Lanfrica/NaijaVoices bilan hamkorlikni birlashtirdi. Ushbu sa'y-harakatlar chuqur lingvistik tushuncha va madaniy kontekstni ta'minlab, texnologiyaning mahalliy ehtiyojlarga javob berishini ta'minlab, global miqyosdagi turli til jamoalariga imkoniyat yaratdi.

Masʼuliyatdan voz kechish

Bunga javoban Ishonch loyihasi bo'yicha ko'rsatmalar, iltimos, ushbu sahifada taqdim etilgan ma'lumotlar yuridik, soliq, investitsiya, moliyaviy yoki boshqa har qanday maslahat shakli sifatida talqin qilinmasligi va talqin qilinmasligini unutmang. Faqat yo'qotishingiz mumkin bo'lgan narsaga investitsiya qilish va agar shubhangiz bo'lsa, mustaqil moliyaviy maslahat olish muhimdir. Qo'shimcha ma'lumot olish uchun biz shartlar va emitent yoki reklama beruvchi tomonidan taqdim etilgan yordam va qo'llab-quvvatlash sahifalariga murojaat qilishni tavsiya qilamiz. MetaversePost to'g'ri, xolis hisobot berish majburiyatini oladi, lekin bozor sharoitlari ogohlantirilmasdan o'zgarishi mumkin.

Muallif haqida

Alisa, ixtisoslashgan jurnalist MPost, kriptovalyuta, nol bilim dalillari, investitsiyalar va keng qamrovli sohaga ixtisoslashgan. Web3. Rivojlanayotgan tendentsiyalar va texnologiyalarni diqqat bilan kuzatib, u o'quvchilarni raqamli moliyaning doimiy rivojlanayotgan manzarasi haqida xabardor qilish va jalb qilish uchun keng qamrovli yoritishni taqdim etadi.

Boshqa maqolalar
Alisa Devidson
Alisa Devidson

Alisa, ixtisoslashgan jurnalist MPost, kriptovalyuta, nol bilim dalillari, investitsiyalar va keng qamrovli sohaga ixtisoslashgan. Web3. Rivojlanayotgan tendentsiyalar va texnologiyalarni diqqat bilan kuzatib, u o'quvchilarni raqamli moliyaning doimiy rivojlanayotgan manzarasi haqida xabardor qilish va jalb qilish uchun keng qamrovli yoritishni taqdim etadi.

Hot Stories
Bizning xabarnomamizga qo'shiling.
So'nggi yangiliklar

Solana bo'roni oldidagi xotirjamlik: jadvallar, kitlar va zanjirdagi signallar hozir nima demoqda

Solana, potentsial muammolarga duch kelganda, farzand asrab olish, institutsional qiziqish va asosiy hamkorlikka asoslangan kuchli ish faoliyatini namoyish etdi ...

Ko'proq ma'lumot oling

2025 yil aprel oyida kripto: asosiy tendentsiyalar, siljishlar va keyin nima bo'ladi

2025 yil aprel oyida kripto maydoni asosiy infratuzilmani mustahkamlashga e'tibor qaratdi, Ethereum esa Pectra ga tayyorlanmoqda ...

Ko'proq ma'lumot oling
Ko'proq o'qing
Ko'proq o'qing
Crypto.com dan StraitsX ga: Yirik o'yinchilar dekabr oyi boshida yangi shartnomalarni chiqarishadi
ish Yangiliklar hisoboti texnologiya
Crypto.com dan StraitsX ga: Yirik o'yinchilar dekabr oyi boshida yangi shartnomalarni chiqarishadi
Dekabr 5, 2025
Maxfiylikka yo'naltirilgan blokcheyn Dusk DuskEVM Testnet-ni ishga tushiradi, bu esa ishlab chiqaruvchilarga o'rganish va sinab ko'rish imkonini beradi
Yangiliklar hisoboti texnologiya
Maxfiylikka yo'naltirilgan blokcheyn Dusk DuskEVM Testnet-ni ishga tushiradi, bu esa ishlab chiqaruvchilarga o'rganish va sinab ko'rish imkonini beradi
Dekabr 5, 2025
Solv Foundation USDCda 200 million dollarlik daromadni ochish uchun Stellar bilan birlashadi
ish Yangiliklar hisoboti texnologiya
Solv Foundation USDCda 200 million dollarlik daromadni ochish uchun Stellar bilan birlashadi
Dekabr 5, 2025
Visa hisoboti AQSH isteʼmolchilarining deyarli yarmi ushbu mavsumda bayram xaridlari uchun sunʼiy intellektdan foydalanganligini aniqladi
Yangiliklar hisoboti texnologiya
Visa hisoboti AQSH isteʼmolchilarining deyarli yarmi ushbu mavsumda bayram xaridlari uchun sunʼiy intellektdan foydalanganligini aniqladi
Dekabr 5, 2025
CRYPTOMERIA LABS PTE. LTD.