Haber Raporu Teknoloji
11 Kasım 2025

Meta AI, 1,600'den Fazla Dilde Otomatik Konuşma Tanıma Özelliğini Geliştiren Çok Dilli ASR'yi Tanıttı

Kısaca

Meta AI, 1,600'den fazla dil için konuşma tanıma özelliği sağlayan Omnilingual ASR sistemini başlattı ve 350 yetersiz hizmet alan dil için açık kaynaklı modeller ve bir korpus yayınladı.

Meta AI, 1,600'den Fazla Dilde Otomatik Konuşma Tanıma Özelliğini Geliştiren Çok Dilli ASR'yi Tanıttı

Yapay zeka ve artırılmış gerçeklik konusunda uzmanlaşmış teknoloji şirketi Meta'nın araştırma bölümü, meta yapay zeka Meta Omnilingual Otomatik Konuşma Tanıma (ASR) sisteminin piyasaya sürüldüğünü duyurdu. 

Bu model paketi, 1,600'den fazla dil için otomatik konuşma tanıma sağlayarak benzeri görülmemiş bir ölçekte yüksek kaliteli performans sunar. Ayrıca, Meta AI, çeşitli alt akış konuşma görevlerini desteklemek üzere tasarlanmış, 7 milyar parametreye sahip, kendi kendini denetleyen, çok dilli bir konuşma temsil modeli olan Omnilingual wav2vec 2.0'ı açık kaynaklı hale getirir.

Bu araçların yanı sıra kuruluş, küresel işbirlikçileriyle ortaklaşa geliştirilen, 350 yetersiz hizmet alan dilden derlenmiş konuşmaların derlendiği Omnilingual ASR Corpus'u da yayınlıyor.

Otomatik konuşma tanıma, son yıllarda ilerleyerek yaygın olarak konuşulan birçok dil için neredeyse mükemmel doğruluk elde etti. Ancak, mevcut yapay zekâ mimarilerinin yüksek veri ve hesaplama gereksinimleri nedeniyle, kapsamın daha az kaynaklı dillere genişletilmesi zorlu olmaya devam etti. Omnilingual ASR sistemi, wav2vec 2.0 konuşma kodlayıcısını 7 milyar parametreye ölçeklendirerek ve ham, yazıya geçirilmemiş konuşmadan zengin çok dilli temsiller oluşturarak bu sınırlamayı giderir. İki kod çözücü çeşidi, bu temsilleri karakter belirteçlerine eşler: biri bağlantısal zamansal sınıflandırma (CTC) kullanırken, diğeri büyük dil modellerindekine benzer bir dönüştürücü tabanlı yaklaşım kullanır.

LLM'den ilham alan bu ASR yaklaşımı, 1,600'den fazla dilde en son teknoloji performansına ulaşıyor, bunların %78'inde karakter hata oranları 10'un altında kalıyor ve yeni diller eklemek için daha esnek bir yöntem sunuyor. 

Uzman ince ayar gerektiren geleneksel sistemlerin aksine, Omnilingual ASR, daha önce desteklenmeyen bir dili yalnızca birkaç eşleştirilmiş ses-metin örneği kullanarak entegre edebilir ve kapsamlı veri, özel uzmanlık veya üst düzey bilgi işlem gerektirmeden transkripsiyonu mümkün kılar. Sıfırdan alınan sonuçlar henüz tam eğitimli sistemlerle eşleşmese de, bu yöntem, yetersiz hizmet alan dilleri dijital ekosisteme dahil etmek için ölçeklenebilir bir yol sunar.

Meta AI, Omnilingual ASR Suite ve Corpus ile Konuşma Tanıma'yı Geliştirecek 

Araştırma bölümü, herhangi bir dil için konuşma teknolojisini geliştirmek üzere tasarlanmış kapsamlı bir model paketi ve veri seti yayınladı. FAIR'in önceki araştırmalarına dayanan Omnilingual ASR, düşük güçlü cihazlar için hafif 300M modellerden çeşitli uygulamalarda yüksek doğruluk sunan 7B modellere kadar iki kod çözücü çeşidi içerir. Genel amaçlı wav2vec 2.0 konuşma temeli modeli de çeşitli boyutlarda mevcuttur ve ASR'nin ötesinde çok çeşitli konuşma görevlerini mümkün kılar. Tüm modeller Apache 2.0 lisansı altında sağlanır ve veri seti CC-BY kapsamındadır; bu da araştırmacıların, geliştiricilerin ve dil savunucularının PyTorch ekosisteminde FAIR'in açık kaynaklı fairseq2 çerçevesini kullanarak konuşma çözümlerini uyarlamalarına ve genişletmelerine olanak tanır.

Çok dilli ASR, şimdiye kadar derlenmiş en büyük ve dilsel açıdan en çeşitli ASR veri kümelerinden biri üzerinde eğitilmiştir ve kamuya açık veri kümelerini topluluk kaynaklı kayıtlarla bir araya getirmektedir. Sınırlı dijital varlığa sahip dilleri desteklemek için, meta yapay zeka Uzak veya yetersiz belgelenmiş bölgelerdeki ana dili İngilizce olan kişileri işe almak ve ücretlendirmek için yerel kuruluşlarla ortaklık kurarak, bugüne kadarki en büyük ultra düşük kaynaklı spontan ASR veri kümesi olan Omnilingual ASR Corpus'u oluşturdu. Dil Teknolojisi Ortak Programı aracılığıyla gerçekleştirilen ek iş birlikleri, Mozilla Vakfı'nın Common Voice ve Lanfrica/NaijaVoices ile ortaklıklar da dahil olmak üzere dünya çapındaki dilbilimcileri, araştırmacıları ve dil topluluklarını bir araya getirdi. Bu çabalar, derin bir dilbilimsel içgörü ve kültürel bağlam sağlayarak, teknolojinin yerel ihtiyaçları karşılamasını ve küresel olarak çeşitli dil topluluklarını güçlendirmesini sağladı.

Feragatname

Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.

Yazar hakkında

Alisa, kendini işine adamış bir gazetecidir. MPost, kripto para birimi, sıfır bilgi kanıtları, yatırımlar ve geniş kapsamlı bilgi alanında uzmanlaşmıştır. Web3. Gelişmekte olan trendlere ve teknolojilere yönelik keskin bir bakış açısıyla, okuyucuları sürekli gelişen dijital finans ortamı hakkında bilgilendirmek ve etkileşime geçirmek için kapsamlı bir kapsam sunuyor.

Daha fazla haber
Alisa Davidson
Alisa Davidson

Alisa, kendini işine adamış bir gazetecidir. MPost, kripto para birimi, sıfır bilgi kanıtları, yatırımlar ve geniş kapsamlı bilgi alanında uzmanlaşmıştır. Web3. Gelişmekte olan trendlere ve teknolojilere yönelik keskin bir bakış açısıyla, okuyucuları sürekli gelişen dijital finans ortamı hakkında bilgilendirmek ve etkileşime geçirmek için kapsamlı bir kapsam sunuyor.

Solana Fırtınasından Önceki Sessizlik: Grafikler, Balinalar ve Zincir Üstü Sinyaller Şu Anda Ne Söylüyor?

Solana, potansiyel ... ile karşı karşıya kalırken, artan benimsenme, kurumsal ilgi ve önemli ortaklıklar sayesinde güçlü bir performans gösterdi.

bilmek Daha

Nisan 2025'te Kripto: Önemli Trendler, Değişimler ve Sırada Ne Var

Nisan 2025'te kripto alanı, Ethereum'un Pectra ... için hazırlanmasıyla birlikte temel altyapının güçlendirilmesine odaklandı.

bilmek Daha
Devamını Oku
Daha fazla
Bakkt, Distributed Technologies Research'ü Satın Alarak Stablecoin ve Dijital Varlıkların Genişlemesini Hızlandıracak
İşletme Haber Raporu Teknoloji
Bakkt, Distributed Technologies Research'ü Satın Alarak Stablecoin ve Dijital Varlıkların Genişlemesini Hızlandıracak
Ocak 12, 2026
Ocak Ortasında Kripto Para Piyasası: Dalgalı, Tereddütlü ve Hala Karar Verme Aşamasında
Piyasalar Haber Raporu
Ocak Ortasında Kripto Para Piyasası: Dalgalı, Tereddütlü ve Hala Karar Verme Aşamasında
Ocak 12, 2026
CoinShares: ABD Kripto ETF'lerinde Çıkışlar Görülürken XRP, Solana ve Sui Sermaye Çekiyor
Piyasalar Haber Raporu Teknoloji
CoinShares: ABD Kripto ETF'lerinde Çıkışlar Görülürken XRP, Solana ve Sui Sermaye Çekiyor
Ocak 12, 2026
Şubat Ayında Hong Kong'da Katılmanız Gereken En Önemli Kripto ve Dijital Varlık Etkinlikleri
Sezonları Hackle İşletme Yaşam Tarzı Haber Raporu Teknoloji
Şubat Ayında Hong Kong'da Katılmanız Gereken En Önemli Kripto ve Dijital Varlık Etkinlikleri
Ocak 12, 2026
CRYPTOMERIA LABS PTE. LTD.