26 जून 2023

Google ने भाषण निर्माण के लिए एक शक्तिशाली AI भाषा मॉडल AudioPaLM पेश किया

प्रकाशित: 26 जून, 2023 अपराह्न 1:00 बजे अद्यतन: 26 जून, 2023 पूर्वाह्न 9:07 बजे

संपादित और तथ्य-जांचा गया: 26 जून, 2023 रात्रि 1:00 बजे

संक्षेप में

AudioPaLM द्वारा विकसित एक शक्तिशाली भाषा मॉडल है गूगल जो निर्बाध भाषण और पाठ प्रसंस्करण के लिए पाठ-आधारित और भाषण-आधारित मॉडल को जोड़ती है।

यह पारभाषिक जानकारी को सुरक्षित रखता है और वाक् अनुवाद कार्यों में मौजूदा प्रणालियों से बेहतर प्रदर्शन करता है।

AudioPaLM उच्चारण वाली भाषाओं का अनुवाद कर सकता है और वाक्-से-वाक् अनुवाद के लिए ध्वनि स्थानांतरण कर सकता है।

Google ने एक भाषा मॉडल का अनावरण किया है जिसे कहा जाता है ऑडियोपाएलएम, जो भाषण और पाठ को निर्बाध रूप से संसाधित करने और उत्पन्न करने के लिए पाठ-आधारित और भाषण-आधारित भाषा मॉडल को जोड़ती है। की क्षमताओं का विलय करके पालम-2 और ऑडियो एलएम, AudioPaLM एक एकीकृत मल्टीमॉडल आर्किटेक्चर प्रदान करता है जो वाक् पहचान और वाक्-से-वाक् अनुवाद सहित अनुप्रयोगों की एक विस्तृत श्रृंखला को खोलता है।

Google ने भाषण निर्माण के लिए एक शक्तिशाली भाषा मॉडल AudioPaLM पेश किया — क्रेडिट: Metaverse Post (mpost.io)

AudioPaLM की एक उल्लेखनीय विशेषता ऑडियोएलएम के प्रभाव के कारण स्पीकर की पहचान और स्वर-शैली जैसी पारभाषिक जानकारी को संरक्षित करने की क्षमता है। साथ ही, यह PaLM-2 जैसे पाठ-आधारित भाषा मॉडल में पाए जाने वाले भाषाई ज्ञान का उपयोग करता है। केवल-पाठ वाले बड़े भाषा मॉडल के भार के साथ AudioPaLM को आरंभ करके, मॉडल पूर्व-प्रशिक्षण में उपयोग किए जाने वाले व्यापक पाठ प्रशिक्षण डेटा का लाभ उठाते हुए, भाषण प्रसंस्करण में उत्कृष्टता प्राप्त करता है।

AudioPaLM की उल्लेखनीय क्षमताओं को विभिन्न प्रयोगों के माध्यम से प्रदर्शित किया गया है। इसने भाषण अनुवाद कार्यों में मौजूदा प्रणालियों से बेहतर प्रदर्शन किया है और शून्य-शॉट प्रदर्शन करने की क्षमता प्रदर्शित की है वाक्-से-पाठ अनुवाद उन भाषाओं के लिए जिनका प्रशिक्षण के दौरान सामना नहीं हुआ।

इसके अतिरिक्त, AudioPaLM की विशेषताएं प्रदर्शित करता है ऑडियो भाषा मॉडल कम बोले गए संकेतों के आधार पर आवाज़ों को विभिन्न भाषाओं में स्थानांतरित करके।

Google ने बनाया है AudioPaLM की क्षमताओं के उदाहरण अन्वेषण हेतु उपलब्ध है। इतालवी और जर्मन जैसी विशिष्ट उच्चारण वाली भाषाओं का अनुवाद करने की मॉडल की क्षमता ने शोधकर्ताओं और उपयोगकर्ताओं को समान रूप से आकर्षित किया है। इसके अलावा, वाक्-से-वाक् अनुवाद के लिए ध्वनि स्थानांतरण करने में इसकी दक्षता इसे मौजूदा आधार रेखाओं से अलग करती है, जैसा कि स्वचालित मेट्रिक्स और मानव मूल्यांकनकर्ताओं दोनों द्वारा पुष्टि की गई है।

यह मॉडल किसी व्यक्ति की आवाज और भावनाओं को संरक्षित करते हुए, किसी भाषा को ऑडियो से ऑडियो में दूसरी भाषा में अनुवाद करने में बहुत अच्छा है। दिलचस्प बात यह है कि इतालवी और जर्मन जैसी कुछ भाषाओं का अनुवाद करते समय, मॉडल का उच्चारण ध्यान देने योग्य होता है, और दूसरों का अनुवाद करते समय, उदाहरण के लिए, फ्रेंच, यह एक आदर्श अमेरिकी लहजे के साथ बोलता है।

वाक्-से-वाक् अनुवाद और स्वचालित वाक् पहचान के उदाहरणों के साथ AudioPaLM मॉडल।

एआई के बारे में और पढ़ें:

टैग:

Disclaimer

साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।

के बारे में लेखक

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है।

और अधिक लेख

दामिर यालालोव

Hot Stories

ZKP-संचालित इन्फ्रास्ट्रक्चर प्रोटोकॉल ZKBase ने रोडमैप का अनावरण किया, मई में टेस्टनेट लॉन्च की योजना बनाई

by अलीसा डेविडसन

09 मई 2024

जर्मनी के सबसे बड़े के लिए ब्लॉकचांस और कॉन्फ3रेंस एकजुट Web3 डॉर्टमुंड में सम्मेलन

by विक्टोरिया पालचिक

09 मई 2024

न्यूलिंक बायबिट पर लॉन्च हुआ Web3 आईडीओ प्लेटफार्म. सदस्यता चरण 13 मई तक बढ़ा दिया गया है

by अलीसा डेविडसन

09 मई 2024

UXLINK और Binance ने नए अभियान पर सहयोग किया, उपयोगकर्ताओं को 20M UXUY अंक प्रदान किए Airdrop पुरस्कार

by अलीसा डेविडसन

09 मई 2024

नवीनतम समाचार

ZKP-संचालित इन्फ्रास्ट्रक्चर प्रोटोकॉल ZKBase ने रोडमैप का अनावरण किया, मई में टेस्टनेट लॉन्च की योजना बनाई

by अलीसा डेविडसन

09 मई 2024

न्यूलिंक बायबिट पर लॉन्च हुआ Web3 आईडीओ प्लेटफार्म. सदस्यता चरण 13 मई तक बढ़ा दिया गया है

by अलीसा डेविडसन

09 मई 2024

UXLINK और Binance ने नए अभियान पर सहयोग किया, उपयोगकर्ताओं को 20M UXUY अंक प्रदान किए Airdrop पुरस्कार

by अलीसा डेविडसन

09 मई 2024

साइड प्रोटोकॉल ने प्रोत्साहन टेस्टनेट लॉन्च किया और इनसाइडर पॉइंट सिस्टम की शुरुआत की, जिससे उपयोगकर्ता साइड पॉइंट अर्जित कर सकें

by अलीसा डेविडसन

09 मई 2024

अस्थिरता के बीच बिटकॉइन ईटीएफ के प्रति संस्थागत रुचि बढ़ी

13एफ फाइलिंग के माध्यम से प्रकटीकरण से पता चलता है कि उल्लेखनीय संस्थागत निवेशक बिटकॉइन ईटीएफ में रुचि ले रहे हैं, जो इसकी बढ़ती स्वीकार्यता को रेखांकित करता है...

अधिक जानिए