समाचार रिपोर्ट टेक्नोलॉजी
23 मई 2023

मेटा ने एक ओपन-सोर्स स्पीच एआई विकसित किया है जो 4,000 से अधिक बोली जाने वाली भाषाओं को पहचानता है

संक्षेप में

कंपनी का MMS प्रोजेक्ट 4,000 से अधिक भाषाओं को पहचान सकता है।

अपनी अन्य सार्वजनिक रूप से घोषित एआई परियोजनाओं की तरह, मेटा भाषा विविधता को बनाए रखने में मदद के लिए अपने मॉडल और कोड साझा कर रहा है।

इस कार्य के माध्यम से, वे दुनिया की अविश्वसनीय भाषा विविधता को संरक्षित करने में एक छोटा सा योगदान करने की उम्मीद करते हैं।

मेटा बन चुका है एक एआई भाषा मॉडल जो एक ताज़ा मोड़ है ChatGPT. खुला स्रोत एमएमएस परियोजना भाषा विविधता को संरक्षित करने और अनुसंधान को प्रोत्साहित करने के लिए बनाया गया है और यह 4,000 से अधिक बोली जाने वाली भाषाओं को पहचान सकता है और 1,100 से अधिक पाठ (भाषण) का उत्पादन कर सकता है। कंपनी के पास है सार्वजनिक रूप से जारी किया गया अपने लक्ष्यों को आगे बढ़ाने के लिए आज इसके मॉडल और कोड।

मेटा ने लिखा, "हम अनुसंधान समुदाय में दूसरों को अपने काम के निर्माण के लिए प्रोत्साहित करने के लिए सार्वजनिक रूप से अपनी कृतियों और कोड को साझा कर रहे हैं।" "इस प्रयास के माध्यम से, हम दुनिया की जबरदस्त भाषा विविधता को संरक्षित करने की उम्मीद करते हैं।"

मेटा ने एक ओपन-सोर्स स्पीच एआई विकसित किया है जो 4,000 से अधिक बोली जाने वाली भाषाओं को पहचानता है

ट्रांसक्रिप्शन लेबल के बिना बड़ी मात्रा में ऑडियो पर भाषण पहचानकर्ताओं और टेक्स्ट-टू-स्पीच मॉडल को प्रशिक्षित करने में कठिनाई विशिष्ट है। लेबल महत्वपूर्ण हैं यंत्र अधिगम, जो डेटा की सही पहचान और वर्गीकरण कर सकता है। हालाँकि, आने वाले दशकों में गायब होने वाली भाषाओं के लिए, "यह डेटा बस मौजूद नहीं है," जैसा कि मेटा बताता है।

मेटा ने अपरंपरागत तरीके से डेटा एकत्र करने के लिए धार्मिक ग्रंथों की ऑडियो रिकॉर्डिंग का उपयोग किया। कंपनी ने कहा, "हमने बाइबिल जैसे धार्मिक ग्रंथों के अनुवादों का उपयोग किया, जिनका कई भाषाओं में पाठ-आधारित भाषा अनुवाद अनुसंधान के लिए व्यापक रूप से अध्ययन किया गया है क्योंकि उनका अनुवाद कई अलग-अलग भाषाओं में किया जाता है।" हमने सार्वजनिक रूप से उपलब्ध अनुवादों से इन ग्रंथों को विभिन्न भाषाओं में पढ़ने वाले लोगों की ऑडियो रिकॉर्डिंग निकाली। मेटा के शोधकर्ताओं ने इसमें 4,000 से अधिक भाषाएं जोड़ीं आदर्श.

दृष्टिकोण एक भारी पक्षपाती एआई मॉडल के लिए एक नुस्खा जैसा लगता है जो ईसाई विश्वदृष्टि का समर्थन करता है। हालाँकि, इससे पहले कि आप इस विचार का उपहास उड़ाएँ, इसे मेटा के दृष्टिकोण से देखें: शोधकर्ताओं का मानना ​​​​है कि यह मामला है क्योंकि वे एक कनेक्शनवादी सीटीसी अस्थायी वर्गीकरण (या अनुक्रम-से-अनुक्रम या अनुक्रम-प्रकार मॉडल) को नियोजित करते हैं जो शब्दों में बहुत अधिक सीमित है। कम्प्यूटेशनल शक्ति की तुलना में बड़े भाषा मॉडल (अनुक्रम प्रकार के रूप में भी जाना जाता है) या वाक् पहचान के लिए अनुक्रमिक मॉडल। मेटा का कहना है कि अधिकांश पुरुष वक्ताओं द्वारा रिकॉर्ड की गई धार्मिक रिकॉर्डिंग में इसका परिणाम पुरुष पूर्वाग्रह नहीं था।

मेटा ने wav2vec 2.0 को प्रशिक्षित करने के लिए wav2vec 2.0, एक "स्व-पर्यवेक्षित भाषण प्रतिनिधित्व सीखने" मॉडल का उपयोग किया संरेखण मॉडल जो डेटा को अधिक उपयोगी बनाता है। स्व-पर्यवेक्षित भाषण मॉडल जिसे मेटा ने बिना लेबल वाले डेटा से स्व-पर्यवेक्षित किया, ने बहुत अच्छे परिणाम दिए। मेटा ने पाया कि बड़े पैमाने पर बहुभाषी भाषण मॉडल ने मौजूदा मॉडलों की तुलना में अच्छा प्रदर्शन किया और 10 गुना अधिक भाषाओं को कवर किया, विशेष रूप से फुसफुसाना. मेटा ने शब्द त्रुटि दर का आधा हासिल किया, जबकि व्यापक बहुभाषी भाषण ने 11 गुना अधिक भाषाओं को कवर किया।

मेटा का कहना है कि इसके नए स्पीच-टू-टेक्स्ट मॉडल सही नहीं हैं। उदाहरण के लिए, वे शब्दों या वाक्यांशों का गलत अनुवाद कर सकते हैं, जिसके परिणामस्वरूप आपत्तिजनक और / या गलत भाषण हो सकता है, कंपनी ने लिखा। एआई प्रौद्योगिकियों का जिम्मेदार विकास एआई समुदाय के बीच सहयोग के माध्यम से पूरा किया जाना चाहिए।

जैसा कि मेटा ने ओपन-सोर्स रिसर्च के लिए एमएमएस जारी किया है, यह आशा करता है कि यह भाषा के उपयोग के गायब होने की प्रवृत्ति को उलट सकता है। इस दृष्टि से, सहायक तकनीक, टीटीएस, और यहां तक ​​कि आभासी वास्तविकता और संवर्धित वास्तविकता तकनीक हर किसी को अपनी मूल भाषा में बोलने और सीखने की अनुमति दे सकती है। इसने कहा, "हम एक ऐसी दुनिया की कल्पना करते हैं जहां तकनीक का विपरीत प्रभाव पड़ता है, लोगों को अपनी भाषाओं को जीवित रखने के लिए प्रेरित करता है क्योंकि वे अपनी पसंदीदा भाषा में बोलकर सूचना तक पहुंच सकते हैं और प्रौद्योगिकी का उपयोग कर सकते हैं।"

  • हाल ही में, मेटा की घोषणा की है 2023 की पहली तिमाही के लिए वित्तीय परिणाम। हाल के पुनर्गठन प्रयासों के बावजूद, कंपनी ने पहली तिमाही में बिक्री में अप्रत्याशित वृद्धि के साथ निवेशकों को चौंका दिया। बुधवार को शेयरों में 12% की वृद्धि हुई।

अधिक संबंधित लेख पढ़ें:

Disclaimer

साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।

के बारे में लेखक

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

और अधिक लेख
दामिर यालालोव
दामिर यालालोव

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

Hot Stories
हमारे समाचार पत्र शामिल हों।
नवीनतम समाचार

अस्थिरता के बीच बिटकॉइन ईटीएफ के प्रति संस्थागत रुचि बढ़ी

13एफ फाइलिंग के माध्यम से प्रकटीकरण से पता चलता है कि उल्लेखनीय संस्थागत निवेशक बिटकॉइन ईटीएफ में रुचि ले रहे हैं, जो इसकी बढ़ती स्वीकार्यता को रेखांकित करता है...

अधिक जानिए

सजा का दिन आ गया: सीजेड का भाग्य अधर में लटक गया क्योंकि अमेरिकी अदालत ने डीओजे की याचिका पर विचार किया

चांगपेंग झाओ आज सिएटल की एक अमेरिकी अदालत में सजा का सामना करने के लिए तैयार हैं।

अधिक जानिए
हमारे इनोवेटिव टेक समुदाय से जुड़ें
विस्तार में पढ़ें
अधिक पढ़ें
InEVM में सुरक्षा बहाल करने के लिए Injective AltLayer के साथ जुड़ गया है
व्यवसाय समाचार रिपोर्ट टेक्नोलॉजी
InEVM में सुरक्षा बहाल करने के लिए Injective AltLayer के साथ जुड़ गया है
3 मई 2024
मासा ने टेलर के साथ मिलकर मासा लेंडिंग पूल की शुरुआत की, यूएसडीसी को आधार पर उधार लेने में सक्षम बनाया
Markets समाचार रिपोर्ट टेक्नोलॉजी
मासा ने टेलर के साथ मिलकर मासा लेंडिंग पूल की शुरुआत की, यूएसडीसी को आधार पर उधार लेने में सक्षम बनाया
3 मई 2024
वेलोड्रोम ने आने वाले हफ्तों में सुपरचेन बीटा संस्करण लॉन्च किया और ओपी स्टैक लेयर 2 ब्लॉकचेन में विस्तार किया
Markets समाचार रिपोर्ट टेक्नोलॉजी
वेलोड्रोम ने आने वाले हफ्तों में सुपरचेन बीटा संस्करण लॉन्च किया और ओपी स्टैक लेयर 2 ब्लॉकचेन में विस्तार किया
3 मई 2024
CARV ने अपने डेटा स्तर को विकेंद्रीकृत करने और पुरस्कार वितरित करने के लिए एथिर के साथ साझेदारी की घोषणा की
व्यवसाय समाचार रिपोर्ट टेक्नोलॉजी
CARV ने अपने डेटा स्तर को विकेंद्रीकृत करने और पुरस्कार वितरित करने के लिए एथिर के साथ साझेदारी की घोषणा की
3 मई 2024
क्रिप्टोमेरिया लैब्स पीटीई। लिमिटेड