अप्रैल १, २०२४

Stability AI एसडीएक्सएल बीटा नामक एक नया मॉडल जारी किया

प्रकाशित: अप्रैल 10, 2023 सुबह 8:00 बजे अद्यतन: अप्रैल 10, 2023 सुबह 8:00 बजे

संक्षेप में

Stability AI SDXL बीटा नामक एक नया मॉडल जारी किया है (Stable Diffusion एक्सएल बीटा)। यह अधिक मापदंडों और कुछ अज्ञात संवर्द्धन वाला एक बड़ा मॉडल है। यह ड्रीमस्टूडियो पर उपलब्ध है, Stability AIका आधिकारिक छवि जनरेटर, और आश्चर्यजनक दृश्य बनाने के लिए उन्नत एल्गोरिदम और गहन शिक्षण तकनीकों का उपयोग करता है।

Stability AI ने SDXL बीटा नामक एक नए मॉडल के पूर्वावलोकन का अनावरण किया है, जिसका संक्षिप्त नाम SDXL बीटा है Stable Diffusion एक्सएल बीटा. अब तक, कंपनी ने मॉडल के बारे में बहुत अधिक जानकारी साझा नहीं की है, लेकिन यह उन लोगों के लिए परीक्षण के लिए उपलब्ध है जो ऐसा करना चाहते हैं। इस SDXL मॉडल के बारे में क्या नया है? stable diffusion? इसके फायदे और नुकसान क्या हैं? चलिए जांच करते हैं.

अधिक पढ़ें: Midjourney और डैल-ई कलाकार शैलियाँ उदाहरणों के साथ डंप: 130 प्रसिद्ध एआई पेंटिंग तकनीकें

SDXL मॉडल वास्तव में क्या है?

SDXL मॉडल एक नया मॉडल है जो वर्तमान में है प्रशिक्षित किया जा रहा है. यह समाप्त होने से बहुत दूर है, और जब तक इसे जारी किया जाता है, तब तक इसके बारे में बहुत सारी जानकारी बदल सकती है; हम सभी जानते हैं कि इसे SDXL मॉडल भी नहीं कहा जा सकता है। हम सभी जानते हैं कि यह अधिक मापदंडों और कुछ अज्ञात संवर्द्धन के साथ एक बड़ा मॉडल है। यह एक v2 मॉडल है, v3 मॉडल नहीं (जो भी इसका मतलब है)। यह संभव है कि v2 मॉडल में संवर्द्धन सिस्टम के प्रदर्शन में सुधार कर सकता है, लेकिन अधिक जानकारी के बिना, यह निर्धारित करना मुश्किल है कि ये सुधार कितने महत्वपूर्ण हो सकते हैं। इसके अतिरिक्त, यह जानना उपयोगी होगा कि इस संस्करण में कौन से विशिष्ट पैरामीटर जोड़े या समायोजित किए गए हैं।

SDXL मॉडल वर्तमान में ड्रीमस्टूडियो पर उपलब्ध है, Stability AIका आधिकारिक छवि जनरेटर। इसे जांचने के लिए मॉडल मेनू से SDXL बीटा चुनें। ऐसा लगता है कि यह उन्नत एल्गोरिदम का उपयोग करता है और गहरी सीखने की तकनीक आश्चर्यजनक दृश्य बनाने के लिए जो अनुप्रयोगों की एक विस्तृत श्रृंखला के लिए उपयुक्त हैं।

सुधार

सुपाठ्य पाठ। SDXL सुपाठ्य पाठ उत्पन्न करने में सक्षम है और यह संभवतः इसकी सबसे खास विशेषता है क्योंकि मौजूदा v1 और v2.1 मॉडल में यह संभव नहीं था। SDXL का जेनरेट किया गया टेक्स्ट हमेशा सटीक नहीं होता जैसा कि आप इसमें देख सकते हैं Stable Diffusion नीचे पाठ करें. हालाँकि, यह v2.1 से कहीं बेहतर है, v1 मॉडल की तो बात ही छोड़ दें। ऐसा इसलिए है क्योंकि SDXL अधिक उन्नत गहन शिक्षण एल्गोरिदम का उपयोग करता है जो इसे अधिक जटिल भाषा संरचनाओं को समझने और उत्पन्न करने की अनुमति देता है। आगे के विकास के साथ, इसमें और भी अधिक सटीक और विश्वसनीय बनने की क्षमता है।

संकेत: एक सज्जन की तस्वीर जिसके हाथ में एक सफ़ेद कागज़ है जिस पर लिखा है "नो फेक"

संकेत: एक लाल बालों वाली महिला की तस्वीर जिसमें सफेद फोंट के साथ एक काला चिन्ह है जिस पर लिखा है "नो जोक्स"

आदेश: एक सिनेमाघर में बैठी एक चीनी महिला की तस्वीर जिसमें "दर्द और विमान" शब्द लिखा था। — आदेश: एक सिनेमाघर में बैठी एक चीनी महिला की तस्वीर जिस पर "दर्द और विमान" शब्द लिखा हुआ है।

मानव शरीर रचना विज्ञान। शारीरिक रूप से सही मानव आकृतियों की सटीक पीढ़ी लंबे समय से एक चुनौती रही है stable diffusion. अतिरिक्त या लापता अंगों की उपस्थिति आम है। आमतौर पर उन्हें ठीक करने के लिए इनपेंटिंग का उपयोग किया जाता है, या, हाल ही में, आप एक संदर्भ छवि से मुद्रा को डुप्लिकेट करने के लिए कंट्रोलनेट की ओपन पोज़ सुविधा का उपयोग कर सकते हैं। हमें यह जानकर खुशी हो रही है कि यहीं पर SDXL बीटा मॉडल में सुधार हुआ है। SDXL बीटा मॉडल ने संदर्भ छवियों से सटीक रूप से डुप्लिकेटिंग पोज़ में महत्वपूर्ण सुधार दिखाया है। यह एनीमेशन और आभासी वास्तविकता जैसे विभिन्न अनुप्रयोगों के लिए एक मूल्यवान उपकरण हो सकता है।

खेल पोशाक में एक महिला का फोटो दाहिने हाथ में गेंद को घुमाती हुई — निर्देश: खेल पोशाक में एक महिला की तस्वीर जो दाहिने हाथ में गेंद को घुमा रही है

लाल चाँद के नीचे बैठे लड़के का फोटो — आदेश: लाल चाँद के नीचे बैठे एक लड़के की तस्वीर

आदेश: एक तस्वीर में एक बूढ़े आदमी को जंगल में दौड़ते हुए दिखाया गया है।

पोर्ट्रेट शैली। SDXL बीटा उत्कृष्ट पोर्ट्रेट बनाता है जो फ़ोटो की तरह दिखता है - यह संस्करण 1.5 की तुलना में एक अपग्रेड है। SDXL बीटा में बेहतर एल्गोरिथम पोर्ट्रेट के विवरण और रंग सटीकता को बढ़ाता है, जिसके परिणामस्वरूप अधिक प्राकृतिक और यथार्थवादी रूप दिखाई देता है। उपयोगकर्ता अपने वांछित प्रभाव को प्राप्त करने के लिए तीक्ष्णता और संतृप्ति के स्तरों को भी समायोजित कर सकते हैं।

डुओटोन। कीवर्ड डुओटोन हमेशा v1.5 मॉडल में श्वेत-श्याम तस्वीरें तैयार करता है। हालाँकि, अब, SDXL बीटा द्वारा निर्मित डुओटोन छवियां विभिन्न रंगों में आती हैं। यह स्पष्ट है कि v1 मॉडल की तुलना में, करने की क्षमता संकेत की व्याख्या करें सुधार हुआ है, जिसके परिणामस्वरूप v2 मॉडल से अधिक सटीक और प्रासंगिक प्रतिक्रियाएँ प्राप्त हुई हैं, जिससे वे प्राकृतिक भाषा प्रसंस्करण कार्यों के लिए अधिक विश्वसनीय उपकरण बन गए हैं।

डुओटोन शैली में एक कुत्ते का चित्र — संकेत: एक कुत्ते का डुओटोन शैली का चित्र

डुओटोन द्वीप के परिदृश्य — संकेत: द्वीप का डुओटोन परिदृश्य

संकेत: युवा अफ्रीकी महिला का डुओटोन चित्र

कलात्मक शैलियाँ। कुछ छोटे समायोजन हुए हैं, लेकिन यह निर्धारित करना मुश्किल है कि नया मॉडल बेहतर परिणाम प्रदान करता है या नहीं क्योंकि वे बिल्कुल अद्वितीय हैं। यह संभव है कि ये समायोजन व्यक्तिगत प्राथमिकता या व्यक्तिपरक राय का मामला हो सकता है, जिससे इसे बनाना मुश्किल हो जाता है defiउनकी गुणवत्ता पर सकारात्मक निर्णय. बहरहाल, समायोजन की विशिष्टता उल्लेखनीय और आगे की खोज के लायक हो सकती है।

न्यूयॉर्क इवान Aivazovsky द्वारा — v 1.5: इवान ऐवाज़ोव्स्की द्वारा न्यूयॉर्क

क्रिस्टोफर बालास्कास द्वारा पुराना वन — वी 1.5: क्रिस्टोफर बालास्कस द्वारा ओल्ड फ़ॉरेस्ट

निष्कर्ष

Stable Diffusion अंततः वह पाठ तैयार कर सकता है जो अर्थपूर्ण हो।
SDXL v2.1 और (कुछ हद तक) v1.5 मॉडल की तुलना में अधिक सौंदर्यपूर्ण रूप से मनभावन छवियां प्रदान करता है।
नया मॉडल ऐसी छवियां बनाता है जो अधिक सटीक होती हैं।
मानव शरीर रचना विज्ञान में सुधार हुआ है।
v2.1 की तरह नकारात्मक संकेत आवश्यक नहीं हैं।
यह यथार्थवादी चित्र बना सकता है।
रिलीज से पहले मॉडल में कुछ विषमताओं को ठीक किया जाएगा।

अधिक संबंधित लेख पढ़ें:

टैग:

Disclaimer

साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।

के बारे में लेखक

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है।

और अधिक लेख

दामिर यालालोव