समाचार रिपोर्ट
अक्टूबर 06

Google ने एक नया टेक्स्ट-टू-वीडियो AI जेनरेटर, इमेजन वीडियो लॉन्च करके मेटा पर काबू पा लिया 

संक्षेप में

Google का इमेजेन वीडियो वीडियो-जनरेटर को किलर ऐप्स में बदलने में मदद करने का प्रयास करता है

Google को मेटा से मेक-ए-वीडियो का जवाब देने में देर नहीं लगी। टेक्स्ट प्रॉम्प्ट का उपयोग करके, इमेजन वीडियो शानदार वीडियो बना सकता है। कई कमियों के बावजूद परिणाम कला की स्थिति से ऊपर हैं।

फेसबुक के टेक्स्ट-टू-वीडियो एआई जनरेटर की तुलना में वीडियो बनाओ, परिणाम काफ़ी बेहतर हैं। हालाँकि, इस रणनीति ने और अधिक निगरानी की भी माँग की। इमेजेन वीडियो के विपरीत, जहां सूक्ष्म कार्यकर्ताओं ने लिखित विवरण के साथ फिल्मों को एनोटेट करने के लिए कड़ी मेहनत की, मेक-ए-सीन ने प्रशिक्षण के लिए बिना लेबल वाले वीडियो का इस्तेमाल किया।

वास्तुकला की बारीकियों में जाना व्यर्थ है; आपको इसके बारे में लेख में पढ़ना चाहिए यहाँ उत्पन्न करें. हम केवल इस बात की पुष्टि कर सकते हैं कि 16 फ्रेम पहले T5 एनकोडर के टेक्स्ट एम्बेडिंग से 48 × 24 के रिज़ॉल्यूशन पर 3 फ्रेम प्रति सेकंड के साथ उत्पन्न होते हैं, और यह कि 128 फ्रेम की अंतिम फिल्म में कई प्रसार मॉडल द्वारा इसे बढ़ाया जाता है। 1280×768 और 24 फ्रेम प्रति सेकंड।

इमेजन वीडियो क्या है?

इमेजन वीडियो वीडियो प्रसार मॉडल की एक श्रृंखला के आधार पर टेक्स्ट-सशर्त वीडियो बनाने की एक विधि है। इमेजन वीडियो उच्च गुणवत्ता वाली फिल्में बनाता है पाठ संकेत देता है इंटरलेस्ड स्थानिक और अस्थायी वीडियो सुपर-रिज़ॉल्यूशन मॉडल की एक श्रृंखला के साथ बेस वीडियो उत्पादन मॉडल को जोड़कर। सिस्टम को उच्च स्तर पर बढ़ाते समय डिज़ाइन विकल्पों की टीम द्वारा बनाई गई चीज़ों पर गौर करें।defiइसमें टेक्स्ट-टू-वीडियो मॉडल शामिल है, जिसमें प्रसार मॉडल को वी-पैरामीटराइज़ करने का निर्णय और विशिष्ट रिज़ॉल्यूशन पर पूरी तरह से कनवल्शनल टेम्पोरल और स्थानिक सुपर-रिज़ॉल्यूशन मॉडल का चयन शामिल है। इसके अलावा, यह प्रसार-आधारित छवि उत्पादन पर पहले के काम के परिणामों को मान्य और लागू करता है वीडियो पीढ़ी. फिर वीडियो मॉडल को त्वरित, उच्च-गुणवत्ता वाले नमूने के लिए क्लासिफायर-मुक्त मार्गदर्शन के साथ प्रगतिशील आसवन के अधीन किया जाता है।

Google अनुसंधान दल का दावा है कि प्रणाली पाठ्य विवरण को स्वीकार करती है और 16-फ़्रेम वाली फ़िल्म बनाता है 24 x 48 पिक्सेल के रिज़ॉल्यूशन के साथ प्रति सेकंड तीन फ़्रेम पर। सिस्टम 128 फ्रेम प्रति सेकंड और 24p रिज़ॉल्यूशन (720 × 1280) पर 768 फ्रेम के साथ अंतिम वीडियो बनाते हुए अतिरिक्त फ्रेम को मापता है और "भविष्यवाणी" करता है। इमेजन वीडियो को प्रशिक्षित करने के लिए 60 मिलियन छवि-पाठ जोड़े और 14 मिलियन वीडियो-पाठ जोड़े का उपयोग किया गया था।

इमेजन वीडियो नमूने

भले ही केवल इसलिए कि वीडियो बनाने के लिए एआई का उपयोग तेज और कम खर्चीला है, ऐसी तकनीकों को निस्संदेह हर जगह नियोजित किया जाएगा।

अधिक पढ़ने में रुचि है? यहां देखने के लिए कुछ अतिरिक्त विषय दिए गए हैं:

Disclaimer

साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।

के बारे में लेखक

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

और अधिक लेख
दामिर यालालोव
दामिर यालालोव

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

Hot Stories
हमारे समाचार पत्र शामिल हों।
नवीनतम समाचार

DOGE उन्माद: डॉगकोइन (DOGE) के मूल्य में हालिया वृद्धि का विश्लेषण

क्रिप्टोक्यूरेंसी उद्योग तेजी से विस्तार कर रहा है, और मेम सिक्के एक महत्वपूर्ण उछाल की तैयारी कर रहे हैं। डॉगकॉइन (DOGE), ...

अधिक जानिए

मेटावर्स में एआई-जनित सामग्री का विकास

जेनरेटिव एआई सामग्री का उद्भव आभासी वातावरण के अंदर सबसे आकर्षक विकासों में से एक है...

अधिक जानिए
हमारे इनोवेटिव टेक समुदाय से जुड़ें
विस्तार में पढ़ें
अधिक पढ़ें
टाइगर ब्रोकर्स बोसेरा हैशकी, चाइना एसेट मैनेजमेंट और हार्वेस्ट स्पॉट क्रिप्टो ईटीएफ के लिए जीरो-कमीशन ट्रेडिंग शुरू करेंगे
व्यवसाय Markets समाचार रिपोर्ट
टाइगर ब्रोकर्स बोसेरा हैशकी, चाइना एसेट मैनेजमेंट और हार्वेस्ट स्पॉट क्रिप्टो ईटीएफ के लिए जीरो-कमीशन ट्रेडिंग शुरू करेंगे
अप्रैल १, २०२४
स्क्रॉल ने बर्नौली मेननेट अपग्रेड पूरा किया, लेनदेन लागत में 10 गुना कमी की उम्मीद
समाचार रिपोर्ट टेक्नोलॉजी
स्क्रॉल ने बर्नौली मेननेट अपग्रेड पूरा किया, लेनदेन लागत में 10 गुना कमी की उम्मीद
अप्रैल १, २०२४
ओकेएक्स जम्पस्टार्ट रूणकॉइन को सूचीबद्ध करता है, रूण टोकन अर्जित करने के लिए बीटीसी स्टेकिंग को सक्षम बनाता है
Markets समाचार रिपोर्ट टेक्नोलॉजी
ओकेएक्स जम्पस्टार्ट रूणकॉइन को सूचीबद्ध करता है, रूण टोकन अर्जित करने के लिए बीटीसी स्टेकिंग को सक्षम बनाता है
अप्रैल १, २०२४
इस सप्ताह के शीर्ष सौदे, एआई, आईटी में प्रमुख निवेश, Web3, और क्रिप्टो (22-26.04)
संग्रह व्यवसाय Markets टेक्नोलॉजी
इस सप्ताह के शीर्ष सौदे, एआई, आईटी में प्रमुख निवेश, Web3, और क्रिप्टो (22-26.04)
अप्रैल १, २०२४
क्रिप्टोमेरिया लैब्स पीटीई। लिमिटेड