समाचार रिपोर्ट टेक्नोलॉजी
जनवरी ७,२०२१

एआई स्टार्टअप माईशेल ने सटीक वॉयस क्लोनिंग के लिए ओपनवॉइस एल्गोरिदम जारी किया

संक्षेप में

कनाडाई एआई स्टार्टअप माईशेल ने घोषणा की है कि उसने तत्काल वॉयस क्लोनिंग के लिए अपने ओपनवॉइस एल्गोरिदम को ओपन-सोर्स किया है।

एआई स्टार्टअप माईशेल ने सटीक वॉयस क्लोनिंग के लिए ओपनवॉइस एल्गोरिदम जारी किया

रिस्पीचर, वॉयसमॉड और ग्यारहलैब्स - तीनों स्टार्टअप में एक बात समान है - वे सभी वॉयस क्लोन बनाने के लिए एल्गोरिदम और एआई सॉफ्टवेयर प्रदान करते हैं। अब, एक नया खिलाड़ी, कनाडाई एआई स्टार्टअप माईशेल ने घोषणा की कि उसने तत्काल वॉयस क्लोनिंग के लिए अपने ओपनवॉइस एल्गोरिदम को ओपन-सोर्स किया है।

MyShell ने अपडेट साझा किया सोशल मीडिया प्लेटफॉर्म एक्स और कहा, "सिर्फ एक छोटी ऑडियो क्लिप का उपयोग करके, भावना से लेकर उच्चारण, लय, विराम और स्वर तक, स्वर के बारीक नियंत्रण के साथ, अद्वितीय सटीकता के साथ आवाज़ों को क्लोन करें।"

सहयोग के तहत, MIT, MyShell.ai और सिंघुआ विश्वविद्यालय के शोधकर्ताओं ने OpenVoice का अनावरण किया, जो एक वक्ता की आवाज़ और उत्पन्न भाषण की नकल कर सकता है। विभिन्न भाषाएं, मूल स्रोत से केवल एक संक्षिप्त ऑडियो स्निपेट का उपयोग करते हुए। यह स्पीकर की आवाज़ के अनूठे स्वर और रंग को भी कैप्चर करता है।

कंपनी के अनुसार, एल्गोरिदम भावना, उच्चारण, लय, विराम और स्वर-शैली जैसे महत्वपूर्ण शैलीगत तत्वों को जोड़ता है। ये तत्व भाषण को वास्तविक बनाने और दिलचस्प बातचीत बनाने के लिए महत्वपूर्ण हैं। यह उस उबाऊ ध्वनि से बचने में मदद करता है जो आपको नियमित टेक्स्ट-टू-स्पीच के साथ अक्सर मिलती है।

वॉयस-क्लोनिंग एआई मॉडल कैसे काम करता है

में शोध पत्र, OpenVoice ने अपनी वॉयस-क्लोनिंग AI के पीछे की कार्यप्रणाली साझा की। ओपनवॉइस दो अलग-अलग से बना है एआई मॉडल: एक टेक्स्ट-टू-स्पीच (टीटीएस) मॉडल और एक "टोन कनवर्टर।"

मॉडल शैली मापदंडों और भाषाओं को प्रबंधित कर सकता है, और अंग्रेजी (अमेरिकी और ब्रिटिश दोनों लहजे में), चीनी और जापानी बोलने वालों से "30,000 वाक्यों का उपयोग करके प्रशिक्षण" ले चुका है। प्रशिक्षण में व्यक्त भावनाओं के आधार पर नमूनों को लेबल करना शामिल था, और मॉडल ने इन ऑडियो क्लिप से स्वर, लय और ठहराव सीखा।

दूसरी ओर, टोन कनवर्टर मॉडल को 300,000 से अधिक विभिन्न स्पीकरों से 20,000 से अधिक ऑडियो नमूनों के विशाल डेटासेट पर प्रशिक्षित किया गया था। दोनों ही मामलों में, मानव भाषण ऑडियो को स्वरों में परिवर्तित किया गया था - विशिष्ट ध्वनियाँ जो शब्दों को अलग करती हैं - और वेक्टर एम्बेडिंग का उपयोग करके दर्शाया गया है।

टीटीएस मॉडल, "बेस स्पीकर" का उपयोग करते हुए, प्रशिक्षण प्रक्रिया में उपयोगकर्ता के रिकॉर्ड किए गए ऑडियो से प्राप्त टोन के साथ जुड़ जाता है। साथ में, ये दोनों मॉडल उपयोगकर्ता की आवाज़ की नकल कर सकते हैं और टोन रंग को संशोधित कर सकते हैं - बोले गए पाठ में बताई गई भावनात्मक अभिव्यक्ति।

स्टार्टअप की स्थापना 2023 में हुई थी। पिछले साल, MyShell ने INCE Capital के नेतृत्व में सीड फंडिंग में 5.6 मिलियन डॉलर जुटाए थे, और इसमें फोलियस वेंचर्स, हैशकी कैपिटल, सेवनएक्स वेंचर्स, TSVC और ओपी क्रिप्टो जैसे प्रमुख निवेशकों की भागीदारी देखी गई थी।

कंपनी के मुताबिक, फंडिंग से मालिकाना हक को आगे बढ़ाने में मदद मिलेगी एआई मॉडल, एआई-नेटिव ऐप्स के लिए तैयार क्रिएटर स्टूडियो का निर्माण, और ब्लॉकचेन तकनीक के दायरे में एक जीवंत क्रिएटर इकोसिस्टम की स्थापना।

Disclaimer

साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।

के बारे में लेखक

कुमार एआई/एमएल, मार्केटिंग टेक्नोलॉजी और क्रिप्टो, ब्लॉकचेन जैसे उभरते क्षेत्रों के गतिशील चौराहों में विशेषज्ञता के साथ एक अनुभवी टेक पत्रकार हैं। NFTएस। उद्योग में 3 वर्षों से अधिक के अनुभव के साथ, कुमार ने सम्मोहक कथाएँ तैयार करने, व्यावहारिक साक्षात्कार आयोजित करने और व्यापक अंतर्दृष्टि प्रदान करने में एक सिद्ध ट्रैक रिकॉर्ड स्थापित किया है। कुमार की विशेषज्ञता प्रमुख उद्योग प्लेटफार्मों के लिए लेख, रिपोर्ट और शोध प्रकाशन सहित उच्च प्रभाव वाली सामग्री तैयार करने में निहित है। तकनीकी ज्ञान और कहानी कहने के संयोजन वाले एक अद्वितीय कौशल सेट के साथ, कुमार जटिल तकनीकी अवधारणाओं को स्पष्ट और आकर्षक तरीके से विविध दर्शकों तक संप्रेषित करने में उत्कृष्टता प्राप्त करते हैं।

और अधिक लेख
कुमार गंधर्व
कुमार गंधर्व

कुमार एआई/एमएल, मार्केटिंग टेक्नोलॉजी और क्रिप्टो, ब्लॉकचेन जैसे उभरते क्षेत्रों के गतिशील चौराहों में विशेषज्ञता के साथ एक अनुभवी टेक पत्रकार हैं। NFTएस। उद्योग में 3 वर्षों से अधिक के अनुभव के साथ, कुमार ने सम्मोहक कथाएँ तैयार करने, व्यावहारिक साक्षात्कार आयोजित करने और व्यापक अंतर्दृष्टि प्रदान करने में एक सिद्ध ट्रैक रिकॉर्ड स्थापित किया है। कुमार की विशेषज्ञता प्रमुख उद्योग प्लेटफार्मों के लिए लेख, रिपोर्ट और शोध प्रकाशन सहित उच्च प्रभाव वाली सामग्री तैयार करने में निहित है। तकनीकी ज्ञान और कहानी कहने के संयोजन वाले एक अद्वितीय कौशल सेट के साथ, कुमार जटिल तकनीकी अवधारणाओं को स्पष्ट और आकर्षक तरीके से विविध दर्शकों तक संप्रेषित करने में उत्कृष्टता प्राप्त करते हैं।

Hot Stories
हमारे समाचार पत्र शामिल हों।
नवीनतम समाचार

अस्थिरता के बीच बिटकॉइन ईटीएफ के प्रति संस्थागत रुचि बढ़ी

13एफ फाइलिंग के माध्यम से प्रकटीकरण से पता चलता है कि उल्लेखनीय संस्थागत निवेशक बिटकॉइन ईटीएफ में रुचि ले रहे हैं, जो इसकी बढ़ती स्वीकार्यता को रेखांकित करता है...

अधिक जानिए

सजा का दिन आ गया: सीजेड का भाग्य अधर में लटक गया क्योंकि अमेरिकी अदालत ने डीओजे की याचिका पर विचार किया

चांगपेंग झाओ आज सिएटल की एक अमेरिकी अदालत में सजा का सामना करने के लिए तैयार हैं।

अधिक जानिए
हमारे इनोवेटिव टेक समुदाय से जुड़ें
विस्तार में पढ़ें
अधिक पढ़ें
क्रिप्टो एक्सचेंज ओकेएक्स ने नोटकॉइन को सूचीबद्ध किया है, जो 16 मई को नॉट-यूएसडीटी जोड़ी के साथ स्पॉट ट्रेडिंग शुरू करने के लिए तैयार है।
Markets समाचार रिपोर्ट टेक्नोलॉजी
क्रिप्टो एक्सचेंज ओकेएक्स ने नोटकॉइन को सूचीबद्ध किया है, जो 16 मई को नॉट-यूएसडीटी जोड़ी के साथ स्पॉट ट्रेडिंग शुरू करने के लिए तैयार है।  
10 मई 2024
ब्लास्ट ने तीसरा ब्लास्ट गोल्ड डिस्ट्रीब्यूशन इवेंट लॉन्च किया, डीएपी को 15M अंक आवंटित किए
Markets समाचार रिपोर्ट टेक्नोलॉजी
ब्लास्ट ने तीसरा ब्लास्ट गोल्ड डिस्ट्रीब्यूशन इवेंट लॉन्च किया, डीएपी को 15M अंक आवंटित किए
10 मई 2024
एस्प्रेसो सिस्टम्स ने रोलअप इंटरऑपरेबिलिटी को बढ़ाने के लिए एग्गलेयर विकसित करने के लिए पॉलीगॉन लैब्स के साथ सहयोग किया है
व्यवसाय समाचार रिपोर्ट टेक्नोलॉजी
एस्प्रेसो सिस्टम्स ने रोलअप इंटरऑपरेबिलिटी को बढ़ाने के लिए एग्गलेयर विकसित करने के लिए पॉलीगॉन लैब्स के साथ सहयोग किया है
9 मई 2024
ZKP-संचालित इन्फ्रास्ट्रक्चर प्रोटोकॉल ZKBase ने रोडमैप का अनावरण किया, मई में टेस्टनेट लॉन्च की योजना बनाई
समाचार रिपोर्ट टेक्नोलॉजी
ZKP-संचालित इन्फ्रास्ट्रक्चर प्रोटोकॉल ZKBase ने रोडमैप का अनावरण किया, मई में टेस्टनेट लॉन्च की योजना बनाई
9 मई 2024
क्रिप्टोमेरिया लैब्स पीटीई। लिमिटेड