मेटा ने एक ओपन-सोर्स स्पीच एआई विकसित किया है जो 4,000 से अधिक बोली जाने वाली भाषाओं को पहचानता है
संक्षेप में
कंपनी का MMS प्रोजेक्ट 4,000 से अधिक भाषाओं को पहचान सकता है।
अपनी अन्य सार्वजनिक रूप से घोषित एआई परियोजनाओं की तरह, मेटा भाषा विविधता को बनाए रखने में मदद के लिए अपने मॉडल और कोड साझा कर रहा है।
इस कार्य के माध्यम से, वे दुनिया की अविश्वसनीय भाषा विविधता को संरक्षित करने में एक छोटा सा योगदान करने की उम्मीद करते हैं।
मेटा बन चुका है एक एआई भाषा मॉडल जो एक ताज़ा मोड़ है ChatGPT. खुला स्रोत एमएमएस परियोजना भाषा विविधता को संरक्षित करने और अनुसंधान को प्रोत्साहित करने के लिए बनाया गया है और यह 4,000 से अधिक बोली जाने वाली भाषाओं को पहचान सकता है और 1,100 से अधिक पाठ (भाषण) का उत्पादन कर सकता है। कंपनी के पास है सार्वजनिक रूप से जारी किया गया अपने लक्ष्यों को आगे बढ़ाने के लिए आज इसके मॉडल और कोड।
मेटा ने लिखा, "हम अनुसंधान समुदाय में दूसरों को अपने काम के निर्माण के लिए प्रोत्साहित करने के लिए सार्वजनिक रूप से अपनी कृतियों और कोड को साझा कर रहे हैं।" "इस प्रयास के माध्यम से, हम दुनिया की जबरदस्त भाषा विविधता को संरक्षित करने की उम्मीद करते हैं।"
ट्रांसक्रिप्शन लेबल के बिना बड़ी मात्रा में ऑडियो पर भाषण पहचानकर्ताओं और टेक्स्ट-टू-स्पीच मॉडल को प्रशिक्षित करने में कठिनाई विशिष्ट है। लेबल महत्वपूर्ण हैं यंत्र अधिगम, जो डेटा की सही पहचान और वर्गीकरण कर सकता है। हालाँकि, आने वाले दशकों में गायब होने वाली भाषाओं के लिए, "यह डेटा बस मौजूद नहीं है," जैसा कि मेटा बताता है।
मेटा ने अपरंपरागत तरीके से डेटा एकत्र करने के लिए धार्मिक ग्रंथों की ऑडियो रिकॉर्डिंग का उपयोग किया। कंपनी ने कहा, "हमने बाइबिल जैसे धार्मिक ग्रंथों के अनुवादों का उपयोग किया, जिनका कई भाषाओं में पाठ-आधारित भाषा अनुवाद अनुसंधान के लिए व्यापक रूप से अध्ययन किया गया है क्योंकि उनका अनुवाद कई अलग-अलग भाषाओं में किया जाता है।" हमने सार्वजनिक रूप से उपलब्ध अनुवादों से इन ग्रंथों को विभिन्न भाषाओं में पढ़ने वाले लोगों की ऑडियो रिकॉर्डिंग निकाली। मेटा के शोधकर्ताओं ने इसमें 4,000 से अधिक भाषाएं जोड़ीं आदर्श.
दृष्टिकोण एक भारी पक्षपाती एआई मॉडल के लिए एक नुस्खा जैसा लगता है जो ईसाई विश्वदृष्टि का समर्थन करता है। हालाँकि, इससे पहले कि आप इस विचार का उपहास उड़ाएँ, इसे मेटा के दृष्टिकोण से देखें: शोधकर्ताओं का मानना है कि यह मामला है क्योंकि वे एक कनेक्शनवादी सीटीसी अस्थायी वर्गीकरण (या अनुक्रम-से-अनुक्रम या अनुक्रम-प्रकार मॉडल) को नियोजित करते हैं जो शब्दों में बहुत अधिक सीमित है। कम्प्यूटेशनल शक्ति की तुलना में बड़े भाषा मॉडल (अनुक्रम प्रकार के रूप में भी जाना जाता है) या वाक् पहचान के लिए अनुक्रमिक मॉडल। मेटा का कहना है कि अधिकांश पुरुष वक्ताओं द्वारा रिकॉर्ड की गई धार्मिक रिकॉर्डिंग में इसका परिणाम पुरुष पूर्वाग्रह नहीं था।
मेटा ने wav2vec 2.0 को प्रशिक्षित करने के लिए wav2vec 2.0, एक "स्व-पर्यवेक्षित भाषण प्रतिनिधित्व सीखने" मॉडल का उपयोग किया संरेखण मॉडल जो डेटा को अधिक उपयोगी बनाता है। स्व-पर्यवेक्षित भाषण मॉडल जिसे मेटा ने बिना लेबल वाले डेटा से स्व-पर्यवेक्षित किया, ने बहुत अच्छे परिणाम दिए। मेटा ने पाया कि बड़े पैमाने पर बहुभाषी भाषण मॉडल ने मौजूदा मॉडलों की तुलना में अच्छा प्रदर्शन किया और 10 गुना अधिक भाषाओं को कवर किया, विशेष रूप से फुसफुसाना. मेटा ने शब्द त्रुटि दर का आधा हासिल किया, जबकि व्यापक बहुभाषी भाषण ने 11 गुना अधिक भाषाओं को कवर किया।
मेटा का कहना है कि इसके नए स्पीच-टू-टेक्स्ट मॉडल सही नहीं हैं। उदाहरण के लिए, वे शब्दों या वाक्यांशों का गलत अनुवाद कर सकते हैं, जिसके परिणामस्वरूप आपत्तिजनक और / या गलत भाषण हो सकता है, कंपनी ने लिखा। एआई प्रौद्योगिकियों का जिम्मेदार विकास एआई समुदाय के बीच सहयोग के माध्यम से पूरा किया जाना चाहिए।
जैसा कि मेटा ने ओपन-सोर्स रिसर्च के लिए एमएमएस जारी किया है, यह आशा करता है कि यह भाषा के उपयोग के गायब होने की प्रवृत्ति को उलट सकता है। इस दृष्टि से, सहायक तकनीक, टीटीएस, और यहां तक कि आभासी वास्तविकता और संवर्धित वास्तविकता तकनीक हर किसी को अपनी मूल भाषा में बोलने और सीखने की अनुमति दे सकती है। इसने कहा, "हम एक ऐसी दुनिया की कल्पना करते हैं जहां तकनीक का विपरीत प्रभाव पड़ता है, लोगों को अपनी भाषाओं को जीवित रखने के लिए प्रेरित करता है क्योंकि वे अपनी पसंदीदा भाषा में बोलकर सूचना तक पहुंच सकते हैं और प्रौद्योगिकी का उपयोग कर सकते हैं।"
- हाल ही में, मेटा की घोषणा की है 2023 की पहली तिमाही के लिए वित्तीय परिणाम। हाल के पुनर्गठन प्रयासों के बावजूद, कंपनी ने पहली तिमाही में बिक्री में अप्रत्याशित वृद्धि के साथ निवेशकों को चौंका दिया। बुधवार को शेयरों में 12% की वृद्धि हुई।
अधिक संबंधित लेख पढ़ें:
- 4,000 लोगों ने बिना जाने-समझे एआई रोबोट मनोचिकित्सा की
- व्यवधान को बाधित करना: कैसे स्टेज मेटा का टेलीपोर्ट प्लाक एड्रेस मेटावर्स पर कब्जा कर लेगा।
- FTC एक मुकदमे के द्वारा मेटा की VR महत्वाकांक्षाओं को नियंत्रित करता है
Disclaimer
साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।
के बारे में लेखक
दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है।
और अधिक लेखदामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है।