Meta, 4,000'den Fazla Konuşulan Dili Tanıyan Açık Kaynaklı Bir Konuşma Yapay Zekası Geliştirdi
Kısaca
Şirketin MMS projesi 4,000'den fazla dili tanıyabilir.
Kamuya duyurulan diğer yapay zeka projelerinin çoğu gibi Meta da dil çeşitliliğini korumaya yardımcı olmak için modellerini ve kodunu paylaşıyor.
Bu çalışma sayesinde, dünyadaki inanılmaz dil çeşitliliğinin korunmasına küçük bir katkı sağlamayı umuyorlar.
Meta yaratıldı üzerinde canlandırıcı bir değişiklik olan bir AI dil modeli ChatGPT. açık kaynak MMS projesi dil çeşitliliğini korumak ve araştırmayı teşvik etmek için oluşturulmuştur ve 4,000'den fazla konuşulan dili tanıyabilir ve 1,100'den fazla dilde metin (konuşma) üretebilir. şirket var halka açık hedeflerini ilerletmek için bugün modelleri ve kodu.
Meta, "Araştırma topluluğundaki diğer kişileri çalışmalarımızı geliştirmeye teşvik etmek için kreasyonlarımızı ve kodumuzu herkese açık bir şekilde paylaşıyoruz" diye yazdı. "Bu çaba sayesinde, dünyanın muazzam dil çeşitliliğini korumayı umuyoruz."
Konuşma tanıyıcıları ve metin okuma modellerini, transkripsiyon etiketleri olmadan büyük miktarlarda ses üzerinde eğitmenin zorluğu tipiktir. Etiketler kritik öneme sahiptir makine öğrenme, verileri doğru bir şekilde tanımlayabilen ve sınıflandırabilen. Ancak, Meta'nın açıkladığı gibi, önümüzdeki on yıllarda yok olacak diller için "bu veriler mevcut değil".
Meta, geleneksel olmayan bir şekilde veri toplamak için dini metinlerin ses kayıtlarını kullandı. Şirket, "Birçok farklı dile çevrildikleri için birçok dilde metin tabanlı dil çevirisi araştırması için geniş çapta incelenen İncil gibi dini metinlerin çevirilerini kullandık" dedi. Bu metinleri farklı dillerde okuyan kişilerin ses kayıtlarını halka açık çevirilerden çıkardık.” Meta'nın araştırmacıları, 4,000'den fazla dil ekledi. model.
Yaklaşım, Hıristiyan dünya görüşlerini destekleyen, oldukça önyargılı bir AI modeli için bir tarif gibi geliyor. Bununla birlikte, bu fikirle alay etmeden önce, bunu Meta'nın bakış açısıyla düşünün: Araştırmacılar bunun böyle olduğuna inanıyorlar çünkü onlar, terimler açısından çok daha sınırlı olan bağlantıcı bir CTC zamansal sınıflandırma (veya diziden diziye veya dizi tipi model) kullanıyorlar. ile karşılaştırıldığında hesaplama gücü büyük dil modelleri (dizi türleri olarak da bilinir) veya konuşma tanıma için sıralı modeller. Meta, bunun çoğu erkek konuşmacı tarafından kaydedilen dini kayıtlarda bir erkek önyargısına yol açmadığını söylüyor.
Meta, bir wav2vec 2.0'ı eğitmek için "kendi kendini denetleyen konuşma temsili öğrenme" modeli olan wav2vec 2.0'ı kullandı. hizalama modeli bu da verileri daha kullanışlı hale getirir. Meta'nın etiketlenmemiş verilerden kendi kendini denetlediği kendi kendini denetleyen konuşma modeli harika sonuçlara yol açtı. Meta, kitlesel olarak çok dilli konuşma modellerinin mevcut modellere kıyasla iyi performans gösterdiğini ve özellikle önceki modellere kıyasla 10 kat daha fazla dili kapsadığını buldu. Fısıltı. Meta, kelime hata oranının yarısını elde ederken, Massively Multilingual Speech 11 kat daha fazla dili kapsıyordu.
Meta, yeni konuşmadan metne modellerinin mükemmel olmadığını söylüyor. Örneğin, şirket, saldırgan ve/veya yanlış konuşmaya neden olabilecek kelimeleri veya cümleleri yanlış tercüme edebilirler. AI teknolojilerinin sorumlu gelişimi, AI topluluğu arasındaki işbirliği yoluyla gerçekleştirilmelidir.
Meta, açık kaynak araştırması için MMS yayınladığından, dil kullanımının ortadan kalkma eğilimini tersine çevirebileceğini umuyor. Bu vizyonda, yardımcı teknoloji, TTS ve hatta sanal gerçeklik ve artırılmış gerçeklik teknolojisi, herkesin kendi ana dilinde konuşmasına ve öğrenmesine izin verebilir. “Teknolojinin tam tersi bir etkiye sahip olduğu, insanları tercih ettikleri dilde konuşarak bilgiye erişebildikleri ve teknolojiyi kullanabildikleri için dillerini yaşatmaya teşvik eden bir dünya tasavvur ediyoruz.”
- Son zamanlarda meta duyurdu 2023'ün ilk çeyreğine ilişkin finansal sonuçlar. Son dönemdeki yeniden yapılandırma çabalarına rağmen şirket, ilk çeyrek satışlarında beklenmedik bir artışla yatırımcıları şaşırttı. Hisseler Çarşamba günü% 12 arttı.
Daha fazla ilgili makale okuyun:
- 4,000 kişi farkında olmadan AI robot psikoterapisine maruz kaldı
- Kesintiyi bozmak: Stage Meta'nın Işınlanma Plak Adresleri Metaverse'yi nasıl ele geçirecek?
- FTC, Meta'nın VR emellerini bir dava ile kısıtlıyor
Feragatname
Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.
Yazar hakkında
Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.
Daha fazla haberDamir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.