StyleGAN-T: सबसे तेज़ टेक्स्ट-टू-इमेज जनरेशन जो 0.1 सेकंड से भी कम समय में परिणाम उत्पन्न करता है
संक्षेप में
StyleGAN-T tex2image पीढ़ी के लिए एक नया GAN है।
यह GAN अच्छे परिणाम देता है और काफी तेज़ भी है (0.1 × 512 छवि के लिए 512 सेकंड)।
नया आर्किटेक्चर StyleGAN-XL पर आधारित है, लेकिन यह जनरेटर और डिस्क्रिमिनेटर डिज़ाइन का पुनर्मूल्यांकन करता है।
आपने निश्चित रूप से देखा होगा कि जब छवि निर्माण का विषय आता है तो GAN पर चर्चा नहीं की जाती है। प्रसार मॉडल जैसे के बाद Stable Diffusion उभरे, GAN किसी तरह पृष्ठभूमि में चले गए। ऐसा इसलिए है क्योंकि उन्हें प्रशिक्षित करना और बार-बार यात्रा करना चुनौतीपूर्ण होता है। GAN का एकमात्र लाभ यह था कि, प्रसार मॉडल के विपरीत, वे कई रन के बजाय एक ही रन ("फ़ॉरवर्ड पास") में एक छवि उत्पन्न करते हैं।
लेकिन अब GANs के एक नए खिलाड़ी ने मैदान में प्रवेश किया है: शैलीगण-टी. टेक्स्ट-टू-इमेज जनरेशन के लिए यह GAN तेजी से अच्छे परिणाम देता है, क्योंकि यह 0.1 × 512 इमेज के लिए केवल 512 सेकंड लेता है। नया आर्किटेक्चर StyleGAN-XL पर आधारित है, लेकिन यह जनरेटर और डिस्क्रिमिनेटर डिज़ाइन का पुनर्मूल्यांकन करता है और टेक्स्ट प्रॉम्प्ट अलाइनमेंट और जेनरेट किए गए ग्राफ़िक्स के लिए CLIP को नियोजित करता है।
सामान्य तौर पर, StyleGAN-T अब अन्य GAN की तुलना में टेक्स्ट-टू-इमेज को तेज़ और अधिक सटीक बनाता है। हालाँकि, GAN अभी भी भयानक है और पूर्ण आकार के SD मॉडल की गुणवत्ता स्पष्ट रूप से प्रश्न से बाहर है। लेकिन यह सब एक वर्ष में एक सेकंड से भी कम समय में पाठ से अत्यधिक उच्च गुणवत्ता वाली छवियां बनाने की क्षमता पर निर्भर करेगा। इसके अतिरिक्त, यह GAN और के बीच कहीं गिरेगा प्रसार मॉडल.
एआई के बारे में और पढ़ें:
Disclaimer
साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।
के बारे में लेखक
दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है।
और अधिक लेखदामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है।