Google ने इनोवेटिव जेनरेटिव इमेज डायनेमिक्स पेश किया है जो स्थिर छवियों में गतिशील दृश्यों का अनुकरण करता है
Google ने एक का अनावरण किया है जनरेटिव इमेज डायनेमिक्स, एक नवीन दृष्टिकोण एक के परिवर्तन को सक्षम बनाता है एक निर्बाध लूपिंग वीडियो में एकल स्थिर छवि या एक इंटरैक्टिव गतिशील दृश्य, जो व्यावहारिक अनुप्रयोगों की एक विस्तृत श्रृंखला पेश करता है।
इस अग्रणी तकनीक के मूल में दृश्य गतिशीलता से पहले एक छवि-स्थान का मॉडलिंग है। इसका उद्देश्य इस बात की व्यापक समझ पैदा करना है कि किसी छवि के भीतर वस्तुएं और तत्व विभिन्न गतिशील इंटरैक्शन के अधीन होने पर कैसे व्यवहार कर सकते हैं। इस समझ का उपयोग उपयोगकर्ता इंटरैक्शन के लिए ऑब्जेक्ट डायनेमिक्स की प्रतिक्रिया को प्रभावी ढंग से अनुकरण करने के लिए किया जा सकता है।
इस तकनीक की प्रमुख विशेषता निर्बाध लूपिंग वीडियो उत्पन्न करने की क्षमता है। दृश्य गतिशीलता से पहले छवि-स्थान का लाभ उठाकर, Google की प्रणाली एक छवि के भीतर तत्वों की गति को एक्सट्रपलेशन और विस्तारित कर सकती है, इसे एक मनोरम और निरंतर वीडियो लूप में बदल सकती है। यह कार्यक्षमता सामग्री निर्माताओं और डिजाइनरों के लिए कई रचनात्मक संभावनाएं खोलती है।
प्रौद्योगिकी उपयोगकर्ताओं को स्थिर छवियों के भीतर वस्तुओं के साथ वास्तविक रूप से बातचीत करने में सक्षम बनाती है। उपयोगकर्ता उत्तेजना के प्रति वस्तु गतिशीलता की प्रतिक्रिया का अनुकरण करके, Google की प्रणाली इसकी अनुमति देती है गहन और इंटरैक्टिव अनुभव छवियों के भीतर. इसमें क्रांति लाने की क्षमता है मेटावर्स स्पेस और उपयोगकर्ता दृश्य सामग्री से कैसे जुड़ते हैं।
इस नवाचार की नींव एक सावधानीपूर्वक प्रशिक्षित मॉडल में निहित है। Google का मॉडल प्राकृतिक, दोलन गति की विशेषता वाले वास्तविक वीडियो अनुक्रमों से निकाले गए गति प्रक्षेपवक्र के विशाल डेटासेट से सीखता है। इन दृश्यों में पेड़ों के हिलने, फूल हिलने, मोमबत्तियाँ टिमटिमाने और हवा में कपड़े लहराने जैसे तत्व शामिल हैं। यह विविध डेटासेट मॉडल को गतिशील व्यवहारों की एक विस्तृत श्रृंखला को समझने में सक्षम बनाता है।
जब एक के साथ प्रस्तुत किया गया एकल छविप्रशिक्षित मॉडल एक आवृत्ति-समन्वित प्रसार नमूनाकरण प्रक्रिया को नियोजित करता है। यह प्रक्रिया फूरियर डोमेन में प्रति-पिक्सेल दीर्घकालिक गति प्रतिनिधित्व की भविष्यवाणी करती है, जिसे तंत्रिका स्टोकेस्टिक गति बनावट कहा जाता है। यह प्रतिनिधित्व फिर सघन गति प्रक्षेप पथों में बदल जाता है जो पूरे वीडियो को फैलाता है। छवि-आधारित रेंडरिंग मॉड्यूल के साथ मिलकर, इन प्रक्षेप पथों का उपयोग विभिन्न व्यावहारिक अनुप्रयोगों के लिए किया जा सकता है।
कच्चे आरजीबी पिक्सल पर प्रीर्स की तुलना में, प्रीर्स ओवर मोशन अधिक मौलिक, निम्न-आयामी अंडर-आयामी संरचना को कैप्चर करता है जो पिक्सेल मानों में भिन्नता को कुशलता से समझाता है। इससे प्रदर्शन करने वाली पूर्व विधियों की तुलना में अधिक सुसंगत दीर्घकालिक पीढ़ी और एनिमेशन पर अधिक सूक्ष्म नियंत्रण होता है छवि एनीमेशन कच्चे वीडियो संश्लेषण के माध्यम से.
उत्पन्न गति प्रतिनिधित्व कई डाउनस्ट्रीम अनुप्रयोगों के लिए सुविधाजनक है, जैसे निर्बाध लूपिंग वीडियो बनाना, उत्पन्न गति को संपादित करना और इंटरैक्टिव को सक्षम करना गतिशील छवियां, उपयोगकर्ता द्वारा लागू बलों के लिए ऑब्जेक्ट गतिशीलता की प्रतिक्रिया का अनुकरण करना।
अधिक संबंधित विषय पढ़ें:
Disclaimer
साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।
के बारे में लेखक
दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है।
और अधिक लेखदामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है।