एआई प्रतिरूपण आवाज की कला में इलेवनलैब्स भयावह रूप से अच्छा हो जाता है
संक्षेप में
तंत्रिका जाल प्रौद्योगिकी का भविष्य हैं, और इलेवनलैब्स न्यूरॉन का नवीनतम अपडेट इसे और भी प्रभावशाली कुछ करने की अनुमति देता है: किसी की भी आवाज़ का प्रतिरूपण करना।
सिंथेसाइज़र को जनवरी के अंत में बीटा में जारी किया गया था, और एक हफ्ते बाद, प्रसिद्ध लोगों की आवाज़ों की विशेषता वाले ऑडियो फेक के साथ इंटरनेट भर गया था।
इलेवनलैब्स ने फेक से निपटने और एल्गोरिथम के पुनर्निर्माण का वादा किया है।
कुछ लोग कहते हैं कि तंत्रिका नेटवर्क भविष्य हैं। वे इंसानों से ज्यादा तेजी से काम कर सकते हैं और यहां तक कि वे चीजें हासिल कर सकते हैं जो इंसान नहीं कर सकते। लेकिन क्या होगा अगर वे कुछ और भी प्रभावशाली कर सकते हैं, जैसे कि किसी की आवाज का प्रतिरूपण करना? इलेवनलैब्स न्यूरॉन का नवीनतम अपडेट यही करने की अनुमति देता है, और यह अब तक की सबसे अच्छी चीज है।
अनुशंसित पोस्ट: 120 में शीर्ष 2023+ AI जनित सामग्री: चित्र, संगीत, वीडियो |
यदि आप कभी टोनी स्टार्क या स्टीव जॉब्स की तरह दिखना चाहते थे, तो अब आप ऐसा कर सकते हैं। या यदि आप अतिरिक्त महत्वाकांक्षी महसूस कर रहे हैं, तो आप किम कार्दशियन का प्रतिरूपण भी कर सकते हैं। आपको बस किसी की आवाज़ का एक मिनट का नमूना चाहिए, और बाकी काम एआई करेगा। तो यदि आप अपने आप को प्रभावित करना चाह रहे हैं आपके हाजिर सेलिब्रिटी के साथ मित्र इंप्रेशन या बस अलग-अलग आवाज़ों के साथ कुछ मज़ेदार प्रयोग करना चाहते हैं, तो यह निश्चित रूप से एक धमाका होगा।
बेशक, कुछ बीटा उपयोगकर्ता इसे डरावने प्रयोगों में उपयोग करना शुरू कर देते हैं। समुदाय में ऐसी कुछ रिपोर्टें आई हैं जिनमें कुछ बेहद खौफनाक बातें कही गई हैं, जैसे जब बॉट को इनमें से किसी एक अंश को पढ़ने के लिए कहा गया था हैरी पॉटर एम्मा वॉटसन की आवाज में किताबें, इसके बजाय हैरी पॉटर फ्रेंचाइजी स्टार द्वारा पढ़ा गया "मीन काम्फ" का एक अंश प्रदान किया गया। लेकिन कुल मिलाकर, यह प्रौद्योगिकी की एक प्रभावशाली उपलब्धि है, और यहां से यह केवल बेहतर ही होगी।
ElevenLabs, एक स्टार्टअप, ने जनवरी के अंत में सिंथेसाइज़र को बीटा में रिलीज़ किया। और एक हफ्ते बाद, प्रसिद्ध लोगों की आवाज़ों की विशेषता वाले नकली ऑडियो से इंटरनेट भर गया: जो बिडेन, मार्गोट रोबी, जो रोगन, जॉर्ज लुकास, एम्मा वाटसन और टॉम क्रूज़। तथ्य यह है कि सेवा के प्रशिक्षण के लिए बहुत कम ऑडियो या वीडियो नमूने पर्याप्त हैं। और आवाजें असली हैं! इलेवनलैब्स ने फेक से निपटने और एल्गोरिथम के पुनर्निर्माण का वादा किया। |
अनुशंसित पोस्ट: प्रभावी डिजिटल विज्ञापन के लिए 10 सर्वश्रेष्ठ AI मार्केटिंग टूल |
तो अगर आप अपने दोस्तों को अपने स्पॉट-ऑन सेलेब्रिटी इंप्रेशन से प्रभावित करना चाहते हैं या बस अलग-अलग आवाज़ों के साथ कुछ मज़ा लेना चाहते हैं, ElevenLabs न्यूरॉन देखें. धमाका होना तय है।
- जनवरी में, Microsoft ने घोषणा की घाटी, एक नया ज़ीरो-शॉट टेक्स्ट-टू-स्पीच मॉडल जो हर किसी की आवाज़ की नकल कर सकता है। Microsoft का VALL-E एक ट्रांसफ़ॉर्मर-आधारित TTS मॉडल है जो केवल तीन सेकंड के नमूने को सुनने के बाद किसी भी आवाज़ में भाषण उत्पन्न कर सकता है। यह पिछले मॉडलों की तुलना में एक महत्वपूर्ण सुधार है और इसमें डिजिटल मीडिया के साथ हमारे इंटरैक्ट करने के तरीके को बदलने की क्षमता है। कोड में अभी भी कमी है, लेकिन माइक्रोसॉफ्ट ने कार्रवाई में मॉडल के उदाहरण जारी किए हैं।
- वैल-ई प्रतीत होता है सबसे खतरनाक घोटाला सॉफ्टवेयर कभी जारी किया गया. यह एक सिंथेटिक आवाज है जिसका उपयोग वास्तविक लोगों की नकल करने के लिए किया जा सकता है और इसे वास्तविक व्यक्ति की आवाज की रिकॉर्डिंग और माइक्रोसॉफ्ट कोड का उपयोग करके बनाया जाता है। सबसे अच्छी बात यह है कि सीखने के लिए, या अधिक सटीक रूप से, माइक्रोलर्निंग के लिए केवल तीन सेकंड के भाषण की आवश्यकता होती है। वैल-ई खतरनाक है क्योंकि इसका उपयोग कमजोर लोगों को कार्ड में धनराशि स्थानांतरित करने के लिए धोखा देने के लिए किया जा सकता है, और धोखेबाज इसका उपयोग पीड़ित के किसी परिचित व्यक्ति का रूप धारण करने के लिए कर सकते हैं।
एआई के बारे में और पढ़ें:
Disclaimer
साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।
के बारे में लेखक
दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है।
और अधिक लेखदामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है।