समाचार रिपोर्ट टेक्नोलॉजी
नवम्बर 23/2022

टेक्स्ट-टू-एसवीजी: बर्कले ने अमूर्त पिक्सेल-आधारित प्रसार मॉडल की घोषणा की

संक्षेप में

टेक्स्ट-टू-इमेज संश्लेषण - यूसी बर्कले के शोधकर्ता टेक्स्ट-कंडीशंड के साथ वेक्टर ग्राफिक्स प्रदर्शित करते हैं प्रसार मॉडल

टेक्स्ट-टू-इमेज सिंथेसिस में, डिफ्यूजन मॉडल में होता है साबित बकाया परिणाम। डिफ्यूजन मॉडल एनोटेट किए गए चित्रों के विशाल डेटाबेस का उपयोग करके अत्यंत विविध वस्तुओं और स्थितियों की रेखापुंज छवियां बनाना सीखते हैं। हालाँकि, डिजिटल आइकन, ग्राफिक्स और स्टिकर के लिए, डिजाइनर आमतौर पर स्केलेबल वेक्टर ग्राफिक्स (SVGs) जैसी छवियों के वेक्टर प्रतिनिधित्व को नियोजित करते हैं। वेक्टर ग्राफिक्स छोटे हैं और इन्हें किसी भी आकार में बढ़ाया जा सकता है।

टेक्स्ट-टू-एसवीजी: बर्कले ने अमूर्त पिक्सेल-आधारित प्रसार मॉडल की घोषणा की

यूसी बर्कले दर्शाता है कि वेक्टर ग्राफिक्स का उत्पादन कैसे किया जा सकता है जिसे टेक्स्ट-कंडीशंड डिफ्यूजन मॉडल का उपयोग करके एसवीजी के रूप में निर्यात किया जा सकता है जिसे चित्र पिक्सेल प्रतिनिधित्व पर प्रशिक्षित किया गया था। यह कैप्शन के साथ एसवीजी के व्यापक संग्रह का उपयोग किए बिना इसे पूरा करता है। इसके बजाय, बर्कले के शोधकर्ता वेक्टराइज़ करते हैं टेक्स्ट-टू-इमेज प्रसार टेक्स्ट-टू-3डी संश्लेषण पर हाल के काम से प्रेरित, स्कोर डिस्टिलेशन सैंपलिंग हानि के साथ नमूना लें और इसे ठीक करें।

उदाहरण उत्पन्न वैक्टर

ताजा जेनरेट की गई एसवीजी गैलरी देखें यहाँ उत्पन्न करें.

वेक्टर ग्राफिक्स छोटे होते हैं लेकिन किसी भी आकार में स्केल किए जाने पर उनकी तीक्ष्णता बनाए रखते हैं। बर्कले के शोधकर्ता वेक्टर ग्राफिक्स को अनुकूलित करने के लिए स्कोर डिस्टिलेशन सैंपलिंग के आधार पर छवि-पाठ हानि में सुधार करते हैं। DiffVG अलग करने योग्य SVG रेंडरर, जिसका उपयोग वेक्टरफ्यूजन द्वारा किया जाता है, उलटे दृश्यों को संभव बनाता है।

इसके अतिरिक्त, वेक्टरफ्यूजन एक बहु-स्तरीय कॉन्फ़िगरेशन की अनुमति देता है जो अधिक प्रभावी और उच्च गुणवत्ता वाला है। यह विधि रेखापुंज के नमूने लेकर शुरू होती है टेक्स्ट-टू-इमेज डिफ्यूजन मॉडल बुलाया Stable Diffusion. फिर नमूनों को LIVE का उपयोग करके वेक्टरफ्यूजन द्वारा स्वचालित रूप से पता लगाया जाता है। फिर भी, इन नमूनों में अक्सर विवरण की कमी होती है, वे उबाऊ होते हैं, या वेक्टर ग्राफिक्स के अनुकूल होना मुश्किल होता है। स्कोर डिस्टिलेशन सैम्पलिंग के माध्यम से जीवंतता और पाठ्य संगति को बढ़ाना।

वेक्टरफ्यूजन एक ग्रिड पर एसवीजी पथों को वर्गों तक सीमित करके पुराने वीडियो गेम की शैली में पिक्सेल कला का उत्पादन कर सकता है।

टेक्स्ट-टू-स्केच पीढ़ी का समर्थन करने के लिए यह दृष्टिकोण आसानी से विस्तारित है। एक सार रेखा आरेखण सीखने के लिए जो उपयोगकर्ता द्वारा प्रदान किए गए पाठ का सटीक रूप से प्रतिनिधित्व करता है, हम पहले यादृच्छिक रूप से चुने गए 16 स्ट्रोक बनाते हैं। फिर, हम अपने अव्यक्त स्कोर डिस्टिलेशन सैंपलिंग लॉस को अनुकूलित करते हैं।

संबंधित लेख पढ़ें:

Disclaimer

साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।

के बारे में लेखक

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

और अधिक लेख
दामिर यालालोव
दामिर यालालोव

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

Hot Stories
हमारे समाचार पत्र शामिल हों।
नवीनतम समाचार

सजा का दिन आ गया: सीजेड का भाग्य अधर में लटक गया क्योंकि अमेरिकी अदालत ने डीओजे की याचिका पर विचार किया

चांगपेंग झाओ आज सिएटल की एक अमेरिकी अदालत में सजा का सामना करने के लिए तैयार हैं।

अधिक जानिए

समुराई वॉलेट संस्थापकों पर डार्कनेट डील में $2B की सुविधा देने का आरोप लगाया गया

समुराई वॉलेट के संस्थापकों की आशंका उद्योग के लिए एक उल्लेखनीय झटके का प्रतिनिधित्व करती है, जो लगातार जारी रहने को रेखांकित करती है ...

अधिक जानिए
हमारे इनोवेटिव टेक समुदाय से जुड़ें
विस्तार में पढ़ें
अधिक पढ़ें
पैन्टेरा कैपिटल ने टीओएन ब्लॉकचेन में निवेश किया, क्रिप्टो एक्सेसिबिलिटी को व्यापक बनाने के लिए टेलीग्राम की क्षमता में विश्वास व्यक्त किया
व्यवसाय समाचार रिपोर्ट टेक्नोलॉजी
पैन्टेरा कैपिटल ने टीओएन ब्लॉकचेन में निवेश किया, क्रिप्टो एक्सेसिबिलिटी को व्यापक बनाने के लिए टेलीग्राम की क्षमता में विश्वास व्यक्त किया
2 मई 2024
मिटोसिस ने अपने मॉड्यूलर लिक्विडिटी प्रोटोकॉल को आगे बढ़ाने के लिए एम्बर ग्रुप और फोरसाइट वेंचर्स से $7 मिलियन की फंडिंग जुटाई
व्यवसाय समाचार रिपोर्ट टेक्नोलॉजी
मिटोसिस ने अपने मॉड्यूलर लिक्विडिटी प्रोटोकॉल को आगे बढ़ाने के लिए एम्बर ग्रुप और फोरसाइट वेंचर्स से $7 मिलियन की फंडिंग जुटाई
2 मई 2024
वैश्विक पहुंच का विस्तार करने के लिए गैलक्स ने जैम्बो के साथ साझेदारी की Web3
व्यवसाय समाचार रिपोर्ट टेक्नोलॉजी
वैश्विक पहुंच का विस्तार करने के लिए गैलक्स ने जैम्बो के साथ साझेदारी की Web3
2 मई 2024
गूगल का मेड-जेमिनी एक अच्छी शुरुआत देने के लिए तैयार है GPT-4 स्वास्थ्य सेवा में अपने उत्कृष्ट प्रदर्शन के साथ
AI Wiki समाचार सॉफ्टवेयर टेक्नोलॉजी
गूगल का मेड-जेमिनी एक अच्छी शुरुआत देने के लिए तैयार है GPT-4 स्वास्थ्य सेवा में अपने उत्कृष्ट प्रदर्शन के साथ
2 मई 2024
क्रिप्टोमेरिया लैब्स पीटीई। लिमिटेड