टेक्स्ट-टू-एसवीजी: बर्कले ने अमूर्त पिक्सेल-आधारित प्रसार मॉडल की घोषणा की
संक्षेप में
टेक्स्ट-टू-इमेज संश्लेषण - यूसी बर्कले के शोधकर्ता टेक्स्ट-कंडीशंड के साथ वेक्टर ग्राफिक्स प्रदर्शित करते हैं प्रसार मॉडल
टेक्स्ट-टू-इमेज सिंथेसिस में, डिफ्यूजन मॉडल में होता है साबित बकाया परिणाम। डिफ्यूजन मॉडल एनोटेट किए गए चित्रों के विशाल डेटाबेस का उपयोग करके अत्यंत विविध वस्तुओं और स्थितियों की रेखापुंज छवियां बनाना सीखते हैं। हालाँकि, डिजिटल आइकन, ग्राफिक्स और स्टिकर के लिए, डिजाइनर आमतौर पर स्केलेबल वेक्टर ग्राफिक्स (SVGs) जैसी छवियों के वेक्टर प्रतिनिधित्व को नियोजित करते हैं। वेक्टर ग्राफिक्स छोटे हैं और इन्हें किसी भी आकार में बढ़ाया जा सकता है।
यूसी बर्कले दर्शाता है कि वेक्टर ग्राफिक्स का उत्पादन कैसे किया जा सकता है जिसे टेक्स्ट-कंडीशंड डिफ्यूजन मॉडल का उपयोग करके एसवीजी के रूप में निर्यात किया जा सकता है जिसे चित्र पिक्सेल प्रतिनिधित्व पर प्रशिक्षित किया गया था। यह कैप्शन के साथ एसवीजी के व्यापक संग्रह का उपयोग किए बिना इसे पूरा करता है। इसके बजाय, बर्कले के शोधकर्ता वेक्टराइज़ करते हैं टेक्स्ट-टू-इमेज प्रसार टेक्स्ट-टू-3डी संश्लेषण पर हाल के काम से प्रेरित, स्कोर डिस्टिलेशन सैंपलिंग हानि के साथ नमूना लें और इसे ठीक करें।
उदाहरण उत्पन्न वैक्टर
ताजा जेनरेट की गई एसवीजी गैलरी देखें यहाँ उत्पन्न करें.
वेक्टर ग्राफिक्स छोटे होते हैं लेकिन किसी भी आकार में स्केल किए जाने पर उनकी तीक्ष्णता बनाए रखते हैं। बर्कले के शोधकर्ता वेक्टर ग्राफिक्स को अनुकूलित करने के लिए स्कोर डिस्टिलेशन सैंपलिंग के आधार पर छवि-पाठ हानि में सुधार करते हैं। DiffVG अलग करने योग्य SVG रेंडरर, जिसका उपयोग वेक्टरफ्यूजन द्वारा किया जाता है, उलटे दृश्यों को संभव बनाता है।
इसके अतिरिक्त, वेक्टरफ्यूजन एक बहु-स्तरीय कॉन्फ़िगरेशन की अनुमति देता है जो अधिक प्रभावी और उच्च गुणवत्ता वाला है। यह विधि रेखापुंज के नमूने लेकर शुरू होती है टेक्स्ट-टू-इमेज डिफ्यूजन मॉडल बुलाया Stable Diffusion. फिर नमूनों को LIVE का उपयोग करके वेक्टरफ्यूजन द्वारा स्वचालित रूप से पता लगाया जाता है। फिर भी, इन नमूनों में अक्सर विवरण की कमी होती है, वे उबाऊ होते हैं, या वेक्टर ग्राफिक्स के अनुकूल होना मुश्किल होता है। स्कोर डिस्टिलेशन सैम्पलिंग के माध्यम से जीवंतता और पाठ्य संगति को बढ़ाना।
वेक्टरफ्यूजन एक ग्रिड पर एसवीजी पथों को वर्गों तक सीमित करके पुराने वीडियो गेम की शैली में पिक्सेल कला का उत्पादन कर सकता है।
टेक्स्ट-टू-स्केच पीढ़ी का समर्थन करने के लिए यह दृष्टिकोण आसानी से विस्तारित है। एक सार रेखा आरेखण सीखने के लिए जो उपयोगकर्ता द्वारा प्रदान किए गए पाठ का सटीक रूप से प्रतिनिधित्व करता है, हम पहले यादृच्छिक रूप से चुने गए 16 स्ट्रोक बनाते हैं। फिर, हम अपने अव्यक्त स्कोर डिस्टिलेशन सैंपलिंग लॉस को अनुकूलित करते हैं।
संबंधित लेख पढ़ें:
Disclaimer
साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।
के बारे में लेखक
दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है।
और अधिक लेखदामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है।