Microsoft ने एक प्रसार मॉडल जारी किया है जो किसी व्यक्ति की एक तस्वीर से 3D अवतार बना सकता है
संक्षेप में
2D अवतार डिफ्यूजन मशीन लर्निंग तकनीक का उपयोग करके 3D अवतार उत्पन्न करने के लिए किसी व्यक्ति के चेहरे की एक 3D छवि का उपयोग किया जा सकता है।
इसका उपयोग गेमिंग या अन्य उपयोगों के लिए व्यक्ति का यथार्थवादी 3डी दृश्य प्रदान करने के लिए या आभासी वास्तविकता (वीआर) या संवर्धित वास्तविकता (एआर) अनुभव प्रदान करने के लिए किया जा सकता है।
3डी अवतार डिफ्यूजन एक मशीन लर्निंग एल्गोरिदम है जो मानव चेहरे की एक 2डी छवि ले सकता है और एक त्रि-आयामी (3डी) अवतार बना सकता है। तब अवतार का उपयोग आभासी वास्तविकता (वीआर) या संवर्धित वास्तविकता (एआर) अनुभव बनाने के लिए या गेमिंग या अन्य उद्देश्यों के लिए व्यक्ति का यथार्थवादी 3डी दृश्य प्रदान करने के लिए किया जा सकता है।
प्रसार मॉडल था विकसित माइक्रोसॉफ्ट रिसर्च में शोधकर्ताओं की एक टीम द्वारा और जर्नल में प्रकाशित एक पेपर में वर्णित है arXiv.
3डी अवतार डिफ्यूजन एक प्रकार के मशीन-लर्निंग एल्गोरिदम पर आधारित है जिसे डिफ्यूजन मॉडल कहा जाता है। प्रसार मॉडल जनरेटिव मॉडल हैं, जिसका अर्थ है कि वे नया डेटा उत्पन्न कर सकते हैं जो प्रशिक्षण डेटा के समान है। प्रसार मॉडल 3D छवियों से 2D छवियां उत्पन्न करने के लिए पहले उपयोग किया गया है, लेकिन ADM पहला प्रसार मॉडल है जो एकल 3D छवि से यथार्थवादी 2D अवतार उत्पन्न कर सकता है।
मॉडल को प्रशिक्षित करने के लिए, शोधकर्ताओं ने 200,000 से अधिक 3डी फेस मॉडल के डेटासेट का उपयोग किया। डेटासेट में अलग-अलग स्किन टोन, हेयर स्टाइल और चेहरे की विशेषताओं के साथ कई तरह के चेहरे शामिल थे। ADM तब 2D छवि और 3D चेहरा मॉडल के बीच संबंध जानने में सक्षम था और एक एकल 3D छवि से यथार्थवादी 2D अवतार उत्पन्न करता था।
मॉडल का उपयोग उस तस्वीर से एक अवतार उत्पन्न करने के लिए भी किया जा सकता है जिसे एक अलग कोण से लिया गया है
यह अध्ययन एक 3डी जनरेटिव मॉडल का प्रस्ताव करता है जो स्वचालित रूप से 3डी डिजिटल अवतार बनाता है जिसे प्रसार मॉडल का उपयोग करके तंत्रिका चमक क्षेत्रों के रूप में दर्शाया जाता है। 3डी से जुड़ी निषेधात्मक स्मृति और प्रसंस्करण आवश्यकताओं के कारण, उच्च-गुणवत्ता वाले अवतारों के लिए आवश्यक समृद्ध सुविधाओं का निर्माण एक बहुत बड़ा मुद्दा है। डेवलपर्स का सुझाव है कि रोल-आउट डिफ्यूजन नेटवर्क (रोडिन) इस समस्या का समाधान करे।
यह नेटवर्क एक तंत्रिका चमक क्षेत्र के कई 2डी फीचर मैप्स को एक सिंगल 2डी फीचर प्लेन में रोल आउट करता है, जहां मॉडल 3डी-जागरूक प्रसार को निष्पादित करता है। रोडिन मॉडल 3डी-जागरूक कनवल्शन का उपयोग करता है, जो 2डी में उनके मूल संबंध के अनुसार 3डी फीचर प्लेन में अनुमानित सुविधाओं पर ध्यान देता है, ताकि 3डी में प्रसार की अखंडता को बनाए रखते हुए बहुत आवश्यक कम्प्यूटेशनल दक्षता प्रदान की जा सके।
एआई के बारे में और पढ़ें:
Disclaimer
साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।
के बारे में लेखक
दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है।
और अधिक लेखदामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है।