समाचार रिपोर्ट टेक्नोलॉजी
जनवरी ७,२०२१

Microsoft ने एक प्रसार मॉडल जारी किया है जो किसी व्यक्ति की एक तस्वीर से 3D अवतार बना सकता है

संक्षेप में

2D अवतार डिफ्यूजन मशीन लर्निंग तकनीक का उपयोग करके 3D अवतार उत्पन्न करने के लिए किसी व्यक्ति के चेहरे की एक 3D छवि का उपयोग किया जा सकता है।

इसका उपयोग गेमिंग या अन्य उपयोगों के लिए व्यक्ति का यथार्थवादी 3डी दृश्य प्रदान करने के लिए या आभासी वास्तविकता (वीआर) या संवर्धित वास्तविकता (एआर) अनुभव प्रदान करने के लिए किया जा सकता है।

3डी अवतार डिफ्यूजन एक मशीन लर्निंग एल्गोरिदम है जो मानव चेहरे की एक 2डी छवि ले सकता है और एक त्रि-आयामी (3डी) अवतार बना सकता है। तब अवतार का उपयोग आभासी वास्तविकता (वीआर) या संवर्धित वास्तविकता (एआर) अनुभव बनाने के लिए या गेमिंग या अन्य उद्देश्यों के लिए व्यक्ति का यथार्थवादी 3डी दृश्य प्रदान करने के लिए किया जा सकता है।

प्रसार मॉडल था विकसित माइक्रोसॉफ्ट रिसर्च में शोधकर्ताओं की एक टीम द्वारा और जर्नल में प्रकाशित एक पेपर में वर्णित है arXiv.

Microsoft ने एक प्रसार मॉडल जारी किया है जो किसी व्यक्ति की एक तस्वीर से 3D अवतार बना सकता है

3डी अवतार डिफ्यूजन एक प्रकार के मशीन-लर्निंग एल्गोरिदम पर आधारित है जिसे डिफ्यूजन मॉडल कहा जाता है। प्रसार मॉडल जनरेटिव मॉडल हैं, जिसका अर्थ है कि वे नया डेटा उत्पन्न कर सकते हैं जो प्रशिक्षण डेटा के समान है। प्रसार मॉडल 3D छवियों से 2D छवियां उत्पन्न करने के लिए पहले उपयोग किया गया है, लेकिन ADM पहला प्रसार मॉडल है जो एकल 3D छवि से यथार्थवादी 2D अवतार उत्पन्न कर सकता है।

मॉडल को प्रशिक्षित करने के लिए, शोधकर्ताओं ने 200,000 से अधिक 3डी फेस मॉडल के डेटासेट का उपयोग किया। डेटासेट में अलग-अलग स्किन टोन, हेयर स्टाइल और चेहरे की विशेषताओं के साथ कई तरह के चेहरे शामिल थे। ADM तब 2D छवि और 3D चेहरा मॉडल के बीच संबंध जानने में सक्षम था और एक एकल 3D छवि से यथार्थवादी 2D अवतार उत्पन्न करता था।

मॉडल का उपयोग उस तस्वीर से एक अवतार उत्पन्न करने के लिए भी किया जा सकता है जिसे एक अलग कोण से लिया गया है

वैयक्तिकृत 3D अवतार के लिए, रोडिन मॉडल पाठ-निर्देशित हेरफेर प्रदान करता है। नेचुरल लैंग्वेज एडिटिंग कई अलग-अलग 3डी अवतार सुविधाओं को बदलने का एक सहज तरीका है।

यह अध्ययन एक 3डी जनरेटिव मॉडल का प्रस्ताव करता है जो स्वचालित रूप से 3डी डिजिटल अवतार बनाता है जिसे प्रसार मॉडल का उपयोग करके तंत्रिका चमक क्षेत्रों के रूप में दर्शाया जाता है। 3डी से जुड़ी निषेधात्मक स्मृति और प्रसंस्करण आवश्यकताओं के कारण, उच्च-गुणवत्ता वाले अवतारों के लिए आवश्यक समृद्ध सुविधाओं का निर्माण एक बहुत बड़ा मुद्दा है। डेवलपर्स का सुझाव है कि रोल-आउट डिफ्यूजन नेटवर्क (रोडिन) इस समस्या का समाधान करे।

लिंग, आयु, जाति, अभिव्यक्ति, चेहरे के सामान आदि के संदर्भ में, मॉडल उत्कृष्ट पीढ़ीगत विविधता प्रदर्शित करता है।।

यह नेटवर्क एक तंत्रिका चमक क्षेत्र के कई 2डी फीचर मैप्स को एक सिंगल 2डी फीचर प्लेन में रोल आउट करता है, जहां मॉडल 3डी-जागरूक प्रसार को निष्पादित करता है। रोडिन मॉडल 3डी-जागरूक कनवल्शन का उपयोग करता है, जो 2डी में उनके मूल संबंध के अनुसार 3डी फीचर प्लेन में अनुमानित सुविधाओं पर ध्यान देता है, ताकि 3डी में प्रसार की अखंडता को बनाए रखते हुए बहुत आवश्यक कम्प्यूटेशनल दक्षता प्रदान की जा सके।

एआई के बारे में और पढ़ें:

Disclaimer

साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।

के बारे में लेखक

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

और अधिक लेख
दामिर यालालोव
दामिर यालालोव

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

Hot Stories
हमारे समाचार पत्र शामिल हों।
नवीनतम समाचार

अस्थिरता के बीच बिटकॉइन ईटीएफ के प्रति संस्थागत रुचि बढ़ी

13एफ फाइलिंग के माध्यम से प्रकटीकरण से पता चलता है कि उल्लेखनीय संस्थागत निवेशक बिटकॉइन ईटीएफ में रुचि ले रहे हैं, जो इसकी बढ़ती स्वीकार्यता को रेखांकित करता है...

अधिक जानिए

सजा का दिन आ गया: सीजेड का भाग्य अधर में लटक गया क्योंकि अमेरिकी अदालत ने डीओजे की याचिका पर विचार किया

चांगपेंग झाओ आज सिएटल की एक अमेरिकी अदालत में सजा का सामना करने के लिए तैयार हैं।

अधिक जानिए
हमारे इनोवेटिव टेक समुदाय से जुड़ें
विस्तार में पढ़ें
अधिक पढ़ें
एलडी कैपिटल, एंटालफा वेंचर्स और हाईब्लॉक लिमिटेड $128M हांगकांग ईटीएफ लिक्विडिटी फंड लॉन्च करने के लिए एकजुट हुए
व्यवसाय Markets समाचार रिपोर्ट
एलडी कैपिटल, एंटालफा वेंचर्स और हाईब्लॉक लिमिटेड $128M हांगकांग ईटीएफ लिक्विडिटी फंड लॉन्च करने के लिए एकजुट हुए
8 मई 2024
इनसाइड वॉल स्ट्रीट मेम्स (डब्ल्यूएसएम): सुर्खियों का अनावरण
व्यवसाय Markets कहानियाँ और समीक्षाएँ टेक्नोलॉजी
इनसाइड वॉल स्ट्रीट मेम्स (डब्ल्यूएसएम): सुर्खियों का अनावरण
7 मई 2024
क्रिप्टो व्हेल की खोज करें: बाज़ार में कौन है
व्यवसाय Markets कहानियाँ और समीक्षाएँ टेक्नोलॉजी
क्रिप्टो व्हेल की खोज करें: बाज़ार में कौन है
7 मई 2024
ऑर्बिटर फाइनेंस ने बिटकॉइन लेयर 2 ज़ुलु नेटवर्क के साथ साझेदारी की है और इज़ लवाज़ी टेस्टनेट पर तैनाती की है
व्यवसाय समाचार रिपोर्ट टेक्नोलॉजी
ऑर्बिटर फाइनेंस ने बिटकॉइन लेयर 2 ज़ुलु नेटवर्क के साथ साझेदारी की है और इज़ लवाज़ी टेस्टनेट पर तैनाती की है 
7 मई 2024
क्रिप्टोमेरिया लैब्स पीटीई। लिमिटेड