समाचार रिपोर्ट टेक्नोलॉजी
जनवरी ७,२०२१

MusicLM: Google की ओर से एक नया टेक्स्ट-टू-म्यूज़िक और इमेज-टू-म्यूज़िक AI मॉडल

संक्षेप में

Google MusicLM पेश करता है, पाठ विवरण से उच्च-निष्ठा संगीत उत्पन्न करने के लिए एक मॉडल।

MusicLM को टेक्स्ट और मेलोडी दोनों पर अनुकूलित किया जा सकता है, क्योंकि यह सीटी और गुनगुनाने वाली धुनों को टेक्स्ट कैप्शन में वर्णित शैली के अनुसार रूपांतरित कर सकता है।

मॉडल कर सकता है संगीत उत्पन्न करें शास्त्रीय, जैज़ और रॉक सहित विभिन्न शैलियों में।

Google MusicLM पेश करता है, "एक विकृत गिटार रिफ़ द्वारा समर्थित एक शांत वायलिन राग" जैसे पाठ विवरणों से उच्च-निष्ठा संगीत उत्पन्न करने के लिए एक मॉडल। MusicLM सशर्त संगीत निर्माण की प्रक्रिया को एक पदानुक्रमित अनुक्रम-से-अनुक्रम मॉडलिंग कार्य के रूप में प्रस्तुत करता है, और यह 24 kHz पर संगीत उत्पन्न करता है जो कई मिनटों तक बना रहता है।

MusicLM: Google की ओर से एक नया टेक्स्ट-टू-म्यूज़िक और इमेज-टू-म्यूज़िक AI मॉडल

Google प्रयोगों से पता चलता है कि MusicLM पिछले सिस्टम से बेहतर प्रदर्शन करता है, ऑडियो गुणवत्ता और पाठ विवरण के अनुपालन दोनों में। इसके अलावा, यह दर्शाता है कि MusicLM को टेक्स्ट और मेलोडी दोनों पर अनुकूलित किया जा सकता है, क्योंकि यह सीटी और गुनगुनाने वाली धुनों को टेक्स्ट कैप्शन में वर्णित शैली के अनुसार रूपांतरित कर सकता है। भविष्य के अनुसंधान का समर्थन करने के लिए, हम MusicCaps को सार्वजनिक रूप से रिलीज़ करते हैं, जो मानव विशेषज्ञों द्वारा प्रदान किए गए समृद्ध पाठ विवरणों के साथ 5.5k संगीत-पाठ जोड़े से बना एक डेटासेट है।

संबंधित लेख: टेक्स्ट-टू-3डी: गूगल ने एक तंत्रिका नेटवर्क विकसित किया है जो टेक्स्ट विवरण से 3डी मॉडल तैयार करता है

MusicLM मॉडल को संगीत स्कोर के एक बड़े संग्रह पर प्रशिक्षित किया गया है, जिसने AI को संगीत की संरचना सीखने की अनुमति दी है। मॉडल कर सकता है संगीत उत्पन्न करें शास्त्रीय, जैज़ और रॉक सहित विभिन्न शैलियों में। इसके अलावा, AI मॉडल नई, मौलिक रचनाएँ बना सकता है।

MusicLM मॉडल AI जनित संगीत के क्षेत्र में एक महत्वपूर्ण विकास है। मॉडल पिछले मॉडलों की तुलना में एक महत्वपूर्ण प्रगति का प्रतिनिधित्व करता है, जो संगीत के छोटे टुकड़ों तक सीमित थे या केवल साधारण धुन पैदा करने में सक्षम थे। नया मॉडल संगीत के लंबे, जटिल टुकड़े उत्पन्न करने के लिए एआई का उपयोग करने की संभावना को खोलता है, जिसका उपयोग फिल्मों, वीडियो गेम या अन्य मीडिया में किया जा सकता है।

नया AI मॉडल लंबा संगीत उत्पन्न कर सकता है पाँच मिनट तक की पीढ़ियाँ.

संबंधित लेख: Stable Diffusion पाठ के आधार पर स्पेक्ट्रोग्राम उत्पन्न करके नया संगीत बना सकते हैं

एआई मॉडल गेम और मूवी से कैप्शन का उपयोग करके संगीत बना सकता है।

इसके अलावा, एआई मॉडल छवियों को इनपुट के रूप में उपयोग करके संगीत उत्पन्न कर सकता है।

संगीत उद्योग में एआई के बारे में और पढ़ें:

Disclaimer

साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।

के बारे में लेखक

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

और अधिक लेख
दामिर यालालोव
दामिर यालालोव

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

Hot Stories
हमारे समाचार पत्र शामिल हों।
नवीनतम समाचार

अस्थिरता के बीच बिटकॉइन ईटीएफ के प्रति संस्थागत रुचि बढ़ी

13एफ फाइलिंग के माध्यम से प्रकटीकरण से पता चलता है कि उल्लेखनीय संस्थागत निवेशक बिटकॉइन ईटीएफ में रुचि ले रहे हैं, जो इसकी बढ़ती स्वीकार्यता को रेखांकित करता है...

अधिक जानिए

सजा का दिन आ गया: सीजेड का भाग्य अधर में लटक गया क्योंकि अमेरिकी अदालत ने डीओजे की याचिका पर विचार किया

चांगपेंग झाओ आज सिएटल की एक अमेरिकी अदालत में सजा का सामना करने के लिए तैयार हैं।

अधिक जानिए
हमारे इनोवेटिव टेक समुदाय से जुड़ें
विस्तार में पढ़ें
अधिक पढ़ें
डोनाल्ड ट्रम्प का क्रिप्टो में बदलाव: प्रतिद्वंद्वी से वकील तक, और अमेरिकी क्रिप्टोकरेंसी बाजार के लिए इसका क्या मतलब है
व्यवसाय Markets कहानियाँ और समीक्षाएँ टेक्नोलॉजी
डोनाल्ड ट्रम्प का क्रिप्टो में बदलाव: प्रतिद्वंद्वी से वकील तक, और अमेरिकी क्रिप्टोकरेंसी बाजार के लिए इसका क्या मतलब है
10 मई 2024
लेयर3 इस गर्मी में एल3 टोकन लॉन्च करेगा, कुल आपूर्ति का 51% समुदाय को आवंटित करेगा
Markets समाचार रिपोर्ट टेक्नोलॉजी
लेयर3 इस गर्मी में एल3 टोकन लॉन्च करेगा, कुल आपूर्ति का 51% समुदाय को आवंटित करेगा
10 मई 2024
एडवर्ड स्नोडेन की बिटकॉइन डेवलपर्स को अंतिम चेतावनी: "गोपनीयता को प्रोटोकॉल-स्तर की प्राथमिकता बनाएं या इसे खोने का जोखिम उठाएं"
Markets सुरक्षा Wiki सॉफ्टवेयर कहानियाँ और समीक्षाएँ टेक्नोलॉजी
एडवर्ड स्नोडेन की बिटकॉइन डेवलपर्स को अंतिम चेतावनी: "गोपनीयता को प्रोटोकॉल-स्तर की प्राथमिकता बनाएं या इसे खोने का जोखिम उठाएं"
10 मई 2024
आशावाद-संचालित एथेरियम लेयर 2 नेटवर्क मिंट 15 मई को अपना मेननेट लॉन्च करेगा
समाचार रिपोर्ट टेक्नोलॉजी
आशावाद-संचालित एथेरियम लेयर 2 नेटवर्क मिंट 15 मई को अपना मेननेट लॉन्च करेगा
10 मई 2024
क्रिप्टोमेरिया लैब्स पीटीई। लिमिटेड