समाचार रिपोर्ट टेक्नोलॉजी
सितम्बर 19, 2023

वुर्स्टचेन V2 मॉडल की जीत Stable Diffusion उच्च-रिज़ॉल्यूशन छवियाँ उत्पन्न करने के लिए प्रभावशाली गति वाला XL

एक हालिया ट्वीट "वुर्स्टचेन" ("सॉसेज" के लिए जर्मन) शीर्षक वाले एक लेख के लेखक ने उत्साही और विशेषज्ञों का ध्यान समान रूप से आकर्षित किया है। ट्वीट में नए वुर्स्टचेन V2 मॉडल का उपयोग करके छवियां बनाने के दिलचस्प परिणाम साझा किए गए।

वुर्स्टचेन V2 मॉडल की जीत Stable Diffusion उच्च-रिज़ॉल्यूशन छवियाँ उत्पन्न करने के लिए प्रभावशाली गति वाला XL
सम्बंधित: Midjourney 5.2 और Stable Diffusion क्रिएटिव टेक्स्ट-टू-इमेज जनरेशन के लिए SDXL 0.9 अपडेट

वुर्स्टचेन तेज़ और कुशल है, जैसे मॉडलों की तुलना में तेज़ी से छवियां उत्पन्न करता है Stable Diffusion कम मेमोरी का उपयोग करते हुए XL. इसने प्रशिक्षण लागत को भी कम कर दिया है, वुर्स्टचेन v1 को 9,000×512 रिज़ॉल्यूशन पर केवल 512 GPU घंटे के प्रशिक्षण की आवश्यकता होती है, जबकि 150,000 GPU घंटे खर्च किए जाते हैं। Stable Diffusion 1.4. लागत में 16 गुना की कमी से न केवल नए प्रयोग करने वाले शोधकर्ताओं को लाभ होता है बल्कि ऐसे मॉडलों को प्रशिक्षित करने के लिए अधिक संगठनों के लिए द्वार भी खुलता है। वुर्स्टचेन v2 में 24,602 GPU घंटे का उपयोग किया गया, जिससे यह SD6 से 1.4 गुना सस्ता हो गया, जिसे केवल 512×512 पर प्रशिक्षित किया गया था।

एक असाधारण विशेषता जिसने तुरंत एआई समुदाय का ध्यान खींचा वह वुर्स्टचेन V2 की प्रभावशाली गति है। लेखक के अनुसार, इस मॉडल का उपयोग करके चार 1024×2048 छवियां बनाने में केवल 7 सेकंड लगते हैं। इसे परिप्रेक्ष्य में रखने के लिए, एसडीएक्सएल मॉडल को समान कार्य को प्राप्त करने के लिए तुलनात्मक रूप से सुस्त 40 सेकंड की आवश्यकता होगी।

वुर्स्टचेन V1, जिसे पहले पेश किया गया था, एक अव्यक्त के रूप में SDXL के साथ अपनी नींव साझा करता है प्रसार मॉडल लेकिन इसमें तेज़ यूनेट आर्किटेक्चर शामिल है। जैसा कि समुदाय उत्सुकता से वुर्स्टचेन वी2 की वास्तुकला के बारे में और अधिक जानकारी का इंतजार कर रहा है, बढ़ी हुई गति ही इसे एक उल्लेखनीय विकास के रूप में चिह्नित करती है।

वुर्स्टचेन V2 एक है प्रसार मॉडल जो छवियों के अत्यधिक संपीड़ित अव्यक्त स्थान में काम करता है, परिमाण के क्रम से प्रशिक्षण और अनुमान के लिए कम्प्यूटेशनल लागत को कम करता है। इसमें एक नवीन डिज़ाइन का उपयोग किया गया है जो 42x स्थानिक संपीड़न प्राप्त करता है, एक उपलब्धि जो पहले नहीं देखी गई थी। वुर्स्टचेन दो-चरण संपीड़न, स्टेज ए और स्टेज बी को नियोजित करता है, जो संपीड़ित छवियों को वापस पिक्सेल स्थान में डिकोड करता है। एक तीसरा मॉडल, स्टेज सी, अत्यधिक संपीड़ित अव्यक्त स्थान में सीखा जाता है, जिसमें सस्ते और तेज़ अनुमान की अनुमति देते हुए वर्तमान शीर्ष-प्रदर्शन वाले मॉडल के लिए उपयोग की जाने वाली गणना के अंशों की आवश्यकता होती है।

वुर्स्टचेन V2 में दो प्रसार चरण शामिल हैं:

  • स्टेज ए: इस चरण में पाठ-वातानुकूलित प्रसार शामिल है और इसमें चौंका देने वाले 1 बिलियन पैरामीटर शामिल हैं। यहां त्वरण अति-उच्च संपीड़न तकनीकों के माध्यम से प्राप्त किया जाता है। विशेष रूप से, 128x128x4 के छिपे हुए कोड आकार के बजाय, जैसा कि एसडीएक्सएल में देखा गया है, वुर्स्टचेन वी2 शुरू में 24x24x16 के रिज़ॉल्यूशन पर काम करता है। इसका मतलब है कम पिक्सेल लेकिन अधिक चैनल, जिसके परिणामस्वरूप महत्वपूर्ण गति में वृद्धि होती है।
  • स्टेज बी: यह 600 मिलियन मापदंडों से सुसज्जित एक प्रसार मॉडल है, जो छवि को 24×24 से 128×128 के रिज़ॉल्यूशन तक डीकंप्रेस करने के लिए जिम्मेदार है।

प्रक्रिया को पूरा करना 20 मिलियन मापदंडों वाला एक डिकोडर है जो छिपे हुए कोड को एक प्रदान की गई छवि में बदल देता है।

व्यावहारिक लाभ जो तुरंत सामने आता है वह वुर्स्टचेन V2 की उल्लेखनीय गति है। यह SDXL की तुलना में 2-2.5 गुना तेज गति से संचालित होता है, जो कि क्षेत्र में एक उल्लेखनीय प्रगति है। एआई छवि निर्माण.

किसी भी तकनीकी नवाचार की तरह, इसमें भी व्यापार-विरोध हो सकता है। छवि गुणवत्ता के संदर्भ में, कुछ विशेषज्ञ मामूली हानि का सुझाव देते हैं, हालांकि ठोस सबूत प्रदान करने के लिए एक व्यापक और ईमानदार तुलना की अभी भी प्रतीक्षा की जा रही है।

निर्मित टेक्स्ट-टू-इमेज उदाहरण नीचे हैं:

अधिक संबंधित विषय पढ़ें:

Disclaimer

साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।

के बारे में लेखक

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

और अधिक लेख
दामिर यालालोव
दामिर यालालोव

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

Hot Stories
हमारे समाचार पत्र शामिल हों।
नवीनतम समाचार

अस्थिरता के बीच बिटकॉइन ईटीएफ के प्रति संस्थागत रुचि बढ़ी

13एफ फाइलिंग के माध्यम से प्रकटीकरण से पता चलता है कि उल्लेखनीय संस्थागत निवेशक बिटकॉइन ईटीएफ में रुचि ले रहे हैं, जो इसकी बढ़ती स्वीकार्यता को रेखांकित करता है...

अधिक जानिए

सजा का दिन आ गया: सीजेड का भाग्य अधर में लटक गया क्योंकि अमेरिकी अदालत ने डीओजे की याचिका पर विचार किया

चांगपेंग झाओ आज सिएटल की एक अमेरिकी अदालत में सजा का सामना करने के लिए तैयार हैं।

अधिक जानिए
हमारे इनोवेटिव टेक समुदाय से जुड़ें
विस्तार में पढ़ें
अधिक पढ़ें
डोनाल्ड ट्रम्प का क्रिप्टो में बदलाव: प्रतिद्वंद्वी से वकील तक, और अमेरिकी क्रिप्टोकरेंसी बाजार के लिए इसका क्या मतलब है
व्यवसाय Markets कहानियाँ और समीक्षाएँ टेक्नोलॉजी
डोनाल्ड ट्रम्प का क्रिप्टो में बदलाव: प्रतिद्वंद्वी से वकील तक, और अमेरिकी क्रिप्टोकरेंसी बाजार के लिए इसका क्या मतलब है
10 मई 2024
लेयर3 इस गर्मी में एल3 टोकन लॉन्च करेगा, कुल आपूर्ति का 51% समुदाय को आवंटित करेगा
Markets समाचार रिपोर्ट टेक्नोलॉजी
लेयर3 इस गर्मी में एल3 टोकन लॉन्च करेगा, कुल आपूर्ति का 51% समुदाय को आवंटित करेगा
10 मई 2024
एडवर्ड स्नोडेन की बिटकॉइन डेवलपर्स को अंतिम चेतावनी: "गोपनीयता को प्रोटोकॉल-स्तर की प्राथमिकता बनाएं या इसे खोने का जोखिम उठाएं"
Markets सुरक्षा Wiki सॉफ्टवेयर कहानियाँ और समीक्षाएँ टेक्नोलॉजी
एडवर्ड स्नोडेन की बिटकॉइन डेवलपर्स को अंतिम चेतावनी: "गोपनीयता को प्रोटोकॉल-स्तर की प्राथमिकता बनाएं या इसे खोने का जोखिम उठाएं"
10 मई 2024
आशावाद-संचालित एथेरियम लेयर 2 नेटवर्क मिंट 15 मई को अपना मेननेट लॉन्च करेगा
समाचार रिपोर्ट टेक्नोलॉजी
आशावाद-संचालित एथेरियम लेयर 2 नेटवर्क मिंट 15 मई को अपना मेननेट लॉन्च करेगा
10 मई 2024
क्रिप्टोमेरिया लैब्स पीटीई। लिमिटेड