जनवरी ७,२०२१

StyleGAN-T: सबसे तेज़ टेक्स्ट-टू-इमेज जनरेशन जो 0.1 सेकंड से भी कम समय में परिणाम उत्पन्न करता है

प्रकाशित: जनवरी 24, 2023, दोपहर 1:00 बजे अद्यतन: जनवरी 24, 2023, सुबह 11:18 बजे

संक्षेप में

StyleGAN-T tex2image पीढ़ी के लिए एक नया GAN है।

यह GAN अच्छे परिणाम देता है और काफी तेज़ भी है (0.1 × 512 छवि के लिए 512 सेकंड)।

नया आर्किटेक्चर StyleGAN-XL पर आधारित है, लेकिन यह जनरेटर और डिस्क्रिमिनेटर डिज़ाइन का पुनर्मूल्यांकन करता है।

आपने निश्चित रूप से देखा होगा कि जब छवि निर्माण का विषय आता है तो GAN पर चर्चा नहीं की जाती है। प्रसार मॉडल जैसे के बाद Stable Diffusion उभरे, GAN किसी तरह पृष्ठभूमि में चले गए। ऐसा इसलिए है क्योंकि उन्हें प्रशिक्षित करना और बार-बार यात्रा करना चुनौतीपूर्ण होता है। GAN का एकमात्र लाभ यह था कि, प्रसार मॉडल के विपरीत, वे कई रन के बजाय एक ही रन ("फ़ॉरवर्ड पास") में एक छवि उत्पन्न करते हैं।

StyleGAN-T: 0.1 सेकंड से भी कम समय में सबसे तेज टेक्स्ट-टू-इमेज जेनरेशन

लेकिन अब GANs के एक नए खिलाड़ी ने मैदान में प्रवेश किया है: शैलीगण-टी. टेक्स्ट-टू-इमेज जनरेशन के लिए यह GAN तेजी से अच्छे परिणाम देता है, क्योंकि यह 0.1 × 512 इमेज के लिए केवल 512 सेकंड लेता है। नया आर्किटेक्चर StyleGAN-XL पर आधारित है, लेकिन यह जनरेटर और डिस्क्रिमिनेटर डिज़ाइन का पुनर्मूल्यांकन करता है और टेक्स्ट प्रॉम्प्ट अलाइनमेंट और जेनरेट किए गए ग्राफ़िक्स के लिए CLIP को नियोजित करता है।

संबंधित लेख: VToonify: कलात्मक पोर्ट्रेट वीडियो बनाने के लिए एक रीयल-टाइम AI मॉडल

सामान्य तौर पर, StyleGAN-T अब अन्य GAN की तुलना में टेक्स्ट-टू-इमेज को तेज़ और अधिक सटीक बनाता है। हालाँकि, GAN अभी भी भयानक है और पूर्ण आकार के SD मॉडल की गुणवत्ता स्पष्ट रूप से प्रश्न से बाहर है। लेकिन यह सब एक वर्ष में एक सेकंड से भी कम समय में पाठ से अत्यधिक उच्च गुणवत्ता वाली छवियां बनाने की क्षमता पर निर्भर करेगा। इसके अतिरिक्त, यह GAN और के बीच कहीं गिरेगा प्रसार मॉडल.

एआई के बारे में और पढ़ें:

टैग:

Disclaimer

साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।

के बारे में लेखक

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है।

और अधिक लेख

दामिर यालालोव