Google ने भाषण निर्माण के लिए एक शक्तिशाली AI भाषा मॉडल AudioPaLM पेश किया
संक्षेप में
AudioPaLM द्वारा विकसित एक शक्तिशाली भाषा मॉडल है गूगल जो निर्बाध भाषण और पाठ प्रसंस्करण के लिए पाठ-आधारित और भाषण-आधारित मॉडल को जोड़ती है।
यह पारभाषिक जानकारी को सुरक्षित रखता है और वाक् अनुवाद कार्यों में मौजूदा प्रणालियों से बेहतर प्रदर्शन करता है।
AudioPaLM उच्चारण वाली भाषाओं का अनुवाद कर सकता है और वाक्-से-वाक् अनुवाद के लिए ध्वनि स्थानांतरण कर सकता है।
Google ने एक भाषा मॉडल का अनावरण किया है जिसे कहा जाता है ऑडियोपाएलएम, जो भाषण और पाठ को निर्बाध रूप से संसाधित करने और उत्पन्न करने के लिए पाठ-आधारित और भाषण-आधारित भाषा मॉडल को जोड़ती है। की क्षमताओं का विलय करके पालम-2 और ऑडियो एलएम, AudioPaLM एक एकीकृत मल्टीमॉडल आर्किटेक्चर प्रदान करता है जो वाक् पहचान और वाक्-से-वाक् अनुवाद सहित अनुप्रयोगों की एक विस्तृत श्रृंखला को खोलता है।
AudioPaLM की एक उल्लेखनीय विशेषता ऑडियोएलएम के प्रभाव के कारण स्पीकर की पहचान और स्वर-शैली जैसी पारभाषिक जानकारी को संरक्षित करने की क्षमता है। साथ ही, यह PaLM-2 जैसे पाठ-आधारित भाषा मॉडल में पाए जाने वाले भाषाई ज्ञान का उपयोग करता है। केवल-पाठ वाले बड़े भाषा मॉडल के भार के साथ AudioPaLM को आरंभ करके, मॉडल पूर्व-प्रशिक्षण में उपयोग किए जाने वाले व्यापक पाठ प्रशिक्षण डेटा का लाभ उठाते हुए, भाषण प्रसंस्करण में उत्कृष्टता प्राप्त करता है।
AudioPaLM की उल्लेखनीय क्षमताओं को विभिन्न प्रयोगों के माध्यम से प्रदर्शित किया गया है। इसने भाषण अनुवाद कार्यों में मौजूदा प्रणालियों से बेहतर प्रदर्शन किया है और शून्य-शॉट प्रदर्शन करने की क्षमता प्रदर्शित की है वाक्-से-पाठ अनुवाद उन भाषाओं के लिए जिनका प्रशिक्षण के दौरान सामना नहीं हुआ।
इसके अतिरिक्त, AudioPaLM की विशेषताएं प्रदर्शित करता है ऑडियो भाषा मॉडल कम बोले गए संकेतों के आधार पर आवाज़ों को विभिन्न भाषाओं में स्थानांतरित करके।
Google ने बनाया है AudioPaLM की क्षमताओं के उदाहरण अन्वेषण हेतु उपलब्ध है। इतालवी और जर्मन जैसी विशिष्ट उच्चारण वाली भाषाओं का अनुवाद करने की मॉडल की क्षमता ने शोधकर्ताओं और उपयोगकर्ताओं को समान रूप से आकर्षित किया है। इसके अलावा, वाक्-से-वाक् अनुवाद के लिए ध्वनि स्थानांतरण करने में इसकी दक्षता इसे मौजूदा आधार रेखाओं से अलग करती है, जैसा कि स्वचालित मेट्रिक्स और मानव मूल्यांकनकर्ताओं दोनों द्वारा पुष्टि की गई है।
यह मॉडल किसी व्यक्ति की आवाज और भावनाओं को संरक्षित करते हुए, किसी भाषा को ऑडियो से ऑडियो में दूसरी भाषा में अनुवाद करने में बहुत अच्छा है। दिलचस्प बात यह है कि इतालवी और जर्मन जैसी कुछ भाषाओं का अनुवाद करते समय, मॉडल का उच्चारण ध्यान देने योग्य होता है, और दूसरों का अनुवाद करते समय, उदाहरण के लिए, फ्रेंच, यह एक आदर्श अमेरिकी लहजे के साथ बोलता है।
एआई के बारे में और पढ़ें:
Disclaimer
साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।
के बारे में लेखक
दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है।
और अधिक लेखदामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है।