समाचार रिपोर्ट टेक्नोलॉजी
सितम्बर 19, 2023

Google ने इनोवेटिव जेनरेटिव इमेज डायनेमिक्स पेश किया है जो स्थिर छवियों में गतिशील दृश्यों का अनुकरण करता है

Google ने एक का अनावरण किया है जनरेटिव इमेज डायनेमिक्स, एक नवीन दृष्टिकोण एक के परिवर्तन को सक्षम बनाता है एक निर्बाध लूपिंग वीडियो में एकल स्थिर छवि या एक इंटरैक्टिव गतिशील दृश्य, जो व्यावहारिक अनुप्रयोगों की एक विस्तृत श्रृंखला पेश करता है।

Google ने इनोवेटिव जेनरेटिव इमेज डायनेमिक्स पेश किया है जो स्थिर छवियों में गतिशील दृश्यों का अनुकरण करता है

इस अग्रणी तकनीक के मूल में दृश्य गतिशीलता से पहले एक छवि-स्थान का मॉडलिंग है। इसका उद्देश्य इस बात की व्यापक समझ पैदा करना है कि किसी छवि के भीतर वस्तुएं और तत्व विभिन्न गतिशील इंटरैक्शन के अधीन होने पर कैसे व्यवहार कर सकते हैं। इस समझ का उपयोग उपयोगकर्ता इंटरैक्शन के लिए ऑब्जेक्ट डायनेमिक्स की प्रतिक्रिया को प्रभावी ढंग से अनुकरण करने के लिए किया जा सकता है।

इस तकनीक की प्रमुख विशेषता निर्बाध लूपिंग वीडियो उत्पन्न करने की क्षमता है। दृश्य गतिशीलता से पहले छवि-स्थान का लाभ उठाकर, Google की प्रणाली एक छवि के भीतर तत्वों की गति को एक्सट्रपलेशन और विस्तारित कर सकती है, इसे एक मनोरम और निरंतर वीडियो लूप में बदल सकती है। यह कार्यक्षमता सामग्री निर्माताओं और डिजाइनरों के लिए कई रचनात्मक संभावनाएं खोलती है।

पेपर दृश्य गतिशीलता के आधार पर छवि-स्थान को मॉडलिंग करने के लिए एक दृष्टिकोण प्रस्तुत करता है, जो वास्तविक वीडियो अनुक्रमों से निकाले गए गति प्रक्षेप पथों के संग्रह से सीखा जाता है जिसमें प्राकृतिक, दोलन गति जैसे कि पेड़, फूल, मोमबत्तियाँ और हवा में उड़ते कपड़े शामिल हैं। . प्रशिक्षित मॉडल फूरियर डोमेन में प्रति-पिक्सेल दीर्घकालिक गति प्रतिनिधित्व की भविष्यवाणी करने के लिए आवृत्ति-समन्वित प्रसार नमूनाकरण प्रक्रिया का उपयोग करता है, जिसे वे तंत्रिका स्टोकेस्टिक गति बनावट कहते हैं। इस प्रतिनिधित्व को सघन गति प्रक्षेप पथों में परिवर्तित किया जा सकता है जो पूरे वीडियो को फैलाता है।

प्रौद्योगिकी उपयोगकर्ताओं को स्थिर छवियों के भीतर वस्तुओं के साथ वास्तविक रूप से बातचीत करने में सक्षम बनाती है। उपयोगकर्ता उत्तेजना के प्रति वस्तु गतिशीलता की प्रतिक्रिया का अनुकरण करके, Google की प्रणाली इसकी अनुमति देती है गहन और इंटरैक्टिव अनुभव छवियों के भीतर. इसमें क्रांति लाने की क्षमता है मेटावर्स स्पेस और उपयोगकर्ता दृश्य सामग्री से कैसे जुड़ते हैं।

अध्ययन छवि-अंतरिक्ष दृश्य गति के लिए एक जेनरेटर पूर्व मॉडलिंग की खोज करता है, यानी, एक ही छवि में सभी पिक्सेल की गति। मॉडल को वास्तविक वीडियो अनुक्रमों के एक बड़े संग्रह से स्वचालित रूप से निकाले गए गति प्रक्षेप पथ पर प्रशिक्षित किया जाता है। एक इनपुट छवि पर वातानुकूलित, प्रशिक्षित मॉडल एक तंत्रिका स्टोकेस्टिक गति बनावट की भविष्यवाणी करता है: गति के आधार पर गुणांक का एक सेट जो भविष्य में प्रत्येक पिक्सेल के प्रक्षेपवक्र की विशेषता बताता है।

इस नवाचार की नींव एक सावधानीपूर्वक प्रशिक्षित मॉडल में निहित है। Google का मॉडल प्राकृतिक, दोलन गति की विशेषता वाले वास्तविक वीडियो अनुक्रमों से निकाले गए गति प्रक्षेपवक्र के विशाल डेटासेट से सीखता है। इन दृश्यों में पेड़ों के हिलने, फूल हिलने, मोमबत्तियाँ टिमटिमाने और हवा में कपड़े लहराने जैसे तत्व शामिल हैं। यह विविध डेटासेट मॉडल को गतिशील व्यवहारों की एक विस्तृत श्रृंखला को समझने में सक्षम बनाता है।

अध्ययन का दायरा प्राकृतिक, दोलनशील गतिशीलता वाले वास्तविक दुनिया के दृश्यों तक सीमित है, जैसे हवा में हिलते पेड़ और फूल। फूरियर श्रृंखला को आधार कार्यों के रूप में चुना गया है। परिणामी आवृत्ति-स्थान बनावट को फिर घने, लंबी दूरी के पिक्सेल गति प्रक्षेप पथ में परिवर्तित किया जा सकता है, जिसका उपयोग भविष्य के फ्रेम को संश्लेषित करने, स्थिर छवियों को यथार्थवादी एनिमेशन में बदलने के लिए किया जा सकता है।

जब एक के साथ प्रस्तुत किया गया एकल छविप्रशिक्षित मॉडल एक आवृत्ति-समन्वित प्रसार नमूनाकरण प्रक्रिया को नियोजित करता है। यह प्रक्रिया फूरियर डोमेन में प्रति-पिक्सेल दीर्घकालिक गति प्रतिनिधित्व की भविष्यवाणी करती है, जिसे तंत्रिका स्टोकेस्टिक गति बनावट कहा जाता है। यह प्रतिनिधित्व फिर सघन गति प्रक्षेप पथों में बदल जाता है जो पूरे वीडियो को फैलाता है। छवि-आधारित रेंडरिंग मॉड्यूल के साथ मिलकर, इन प्रक्षेप पथों का उपयोग विभिन्न व्यावहारिक अनुप्रयोगों के लिए किया जा सकता है।

कच्चे आरजीबी पिक्सल पर प्रीर्स की तुलना में, प्रीर्स ओवर मोशन अधिक मौलिक, निम्न-आयामी अंडर-आयामी संरचना को कैप्चर करता है जो पिक्सेल मानों में भिन्नता को कुशलता से समझाता है। इससे प्रदर्शन करने वाली पूर्व विधियों की तुलना में अधिक सुसंगत दीर्घकालिक पीढ़ी और एनिमेशन पर अधिक सूक्ष्म नियंत्रण होता है छवि एनीमेशन कच्चे वीडियो संश्लेषण के माध्यम से.

उत्पन्न गति प्रतिनिधित्व कई डाउनस्ट्रीम अनुप्रयोगों के लिए सुविधाजनक है, जैसे निर्बाध लूपिंग वीडियो बनाना, उत्पन्न गति को संपादित करना और इंटरैक्टिव को सक्षम करना गतिशील छवियां, उपयोगकर्ता द्वारा लागू बलों के लिए ऑब्जेक्ट गतिशीलता की प्रतिक्रिया का अनुकरण करना।

अधिक संबंधित विषय पढ़ें:

Disclaimer

साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।

के बारे में लेखक

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

और अधिक लेख
दामिर यालालोव
दामिर यालालोव

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

Hot Stories
हमारे समाचार पत्र शामिल हों।
नवीनतम समाचार

अस्थिरता के बीच बिटकॉइन ईटीएफ के प्रति संस्थागत रुचि बढ़ी

13एफ फाइलिंग के माध्यम से प्रकटीकरण से पता चलता है कि उल्लेखनीय संस्थागत निवेशक बिटकॉइन ईटीएफ में रुचि ले रहे हैं, जो इसकी बढ़ती स्वीकार्यता को रेखांकित करता है...

अधिक जानिए

सजा का दिन आ गया: सीजेड का भाग्य अधर में लटक गया क्योंकि अमेरिकी अदालत ने डीओजे की याचिका पर विचार किया

चांगपेंग झाओ आज सिएटल की एक अमेरिकी अदालत में सजा का सामना करने के लिए तैयार हैं।

अधिक जानिए
हमारे इनोवेटिव टेक समुदाय से जुड़ें
विस्तार में पढ़ें
अधिक पढ़ें
ब्लॉकचेन इनोवेशन का उपयोग: जर्मनी ने स्वास्थ्य सेवा परिवर्तन और बेहतर रोगी देखभाल की दिशा में एक साहसिक कदम उठाया है
लाइफस्टाइल Markets सॉफ्टवेयर कहानियाँ और समीक्षाएँ टेक्नोलॉजी
ब्लॉकचेन इनोवेशन का उपयोग: जर्मनी ने स्वास्थ्य सेवा परिवर्तन और बेहतर रोगी देखभाल की दिशा में एक साहसिक कदम उठाया है
13 मई 2024
बिटकॉइन रीस्टैकिंग प्लेटफॉर्म बाउंसबिट ने मेननेट लॉन्च किया, और बीबी टोकन आवंटन की घोषणा की
समाचार रिपोर्ट टेक्नोलॉजी
बिटकॉइन रीस्टैकिंग प्लेटफॉर्म बाउंसबिट ने मेननेट लॉन्च किया, और बीबी टोकन आवंटन की घोषणा की
13 मई 2024
L3 ब्लॉकचेन डीजेन चेन ने अपने डाउनटाइम मुद्दे को संबोधित करने के लिए इंफ्रास्ट्रक्चर प्लेटफॉर्म नाली के साथ साझेदारी की
समाचार रिपोर्ट टेक्नोलॉजी
L3 ब्लॉकचेन डीजेन चेन ने अपने डाउनटाइम मुद्दे को संबोधित करने के लिए इंफ्रास्ट्रक्चर प्लेटफॉर्म नाली के साथ साझेदारी की
13 मई 2024
पैरिटी मल्टी-सिग्नेचर वॉलेट से आज 3,050 ईटीएच की लॉन्डरिंग हुई, 83,017 ईटीएच हैकर के नियंत्रण में रहे, साइबर अलर्ट का पता चला
Markets समाचार रिपोर्ट टेक्नोलॉजी
पैरिटी मल्टी-सिग्नेचर वॉलेट से आज 3,050 ईटीएच की लॉन्डरिंग हुई, 83,017 ईटीएच हैकर के नियंत्रण में रहे, साइबर अलर्ट का पता चला
13 मई 2024
क्रिप्टोमेरिया लैब्स पीटीई। लिमिटेड