समाचार रिपोर्ट टेक्नोलॉजी
अप्रैल १, २०२४

Stability AI एसडीएक्सएल बीटा नामक एक नया मॉडल जारी किया

संक्षेप में

Stability AI SDXL बीटा नामक एक नया मॉडल जारी किया है (Stable Diffusion एक्सएल बीटा)। यह अधिक मापदंडों और कुछ अज्ञात संवर्द्धन वाला एक बड़ा मॉडल है। यह ड्रीमस्टूडियो पर उपलब्ध है, Stability AIका आधिकारिक छवि जनरेटर, और आश्चर्यजनक दृश्य बनाने के लिए उन्नत एल्गोरिदम और गहन शिक्षण तकनीकों का उपयोग करता है।

Stability AI ने SDXL बीटा नामक एक नए मॉडल के पूर्वावलोकन का अनावरण किया है, जिसका संक्षिप्त नाम SDXL बीटा है Stable Diffusion एक्सएल बीटा. अब तक, कंपनी ने मॉडल के बारे में बहुत अधिक जानकारी साझा नहीं की है, लेकिन यह उन लोगों के लिए परीक्षण के लिए उपलब्ध है जो ऐसा करना चाहते हैं। इस SDXL मॉडल के बारे में क्या नया है? stable diffusion? इसके फायदे और नुकसान क्या हैं? चलिए जांच करते हैं.

अधिक पढ़ें: Midjourney और डैल-ई कलाकार शैलियाँ उदाहरणों के साथ डंप: 130 प्रसिद्ध एआई पेंटिंग तकनीकें

SDXL मॉडल वास्तव में क्या है?

SDXL मॉडल एक नया मॉडल है जो वर्तमान में है प्रशिक्षित किया जा रहा है. यह समाप्त होने से बहुत दूर है, और जब तक इसे जारी किया जाता है, तब तक इसके बारे में बहुत सारी जानकारी बदल सकती है; हम सभी जानते हैं कि इसे SDXL मॉडल भी नहीं कहा जा सकता है। हम सभी जानते हैं कि यह अधिक मापदंडों और कुछ अज्ञात संवर्द्धन के साथ एक बड़ा मॉडल है। यह एक v2 मॉडल है, v3 मॉडल नहीं (जो भी इसका मतलब है)। यह संभव है कि v2 मॉडल में संवर्द्धन सिस्टम के प्रदर्शन में सुधार कर सकता है, लेकिन अधिक जानकारी के बिना, यह निर्धारित करना मुश्किल है कि ये सुधार कितने महत्वपूर्ण हो सकते हैं। इसके अतिरिक्त, यह जानना उपयोगी होगा कि इस संस्करण में कौन से विशिष्ट पैरामीटर जोड़े या समायोजित किए गए हैं।

SDXL मॉडल वर्तमान में ड्रीमस्टूडियो पर उपलब्ध है, Stability AIका आधिकारिक छवि जनरेटर। इसे जांचने के लिए मॉडल मेनू से SDXL बीटा चुनें। ऐसा लगता है कि यह उन्नत एल्गोरिदम का उपयोग करता है और गहरी सीखने की तकनीक आश्चर्यजनक दृश्य बनाने के लिए जो अनुप्रयोगों की एक विस्तृत श्रृंखला के लिए उपयुक्त हैं।

SDXL मॉडल वास्तव में क्या है?

सुधार

सुपाठ्य पाठ। SDXL सुपाठ्य पाठ उत्पन्न करने में सक्षम है और यह संभवतः इसकी सबसे खास विशेषता है क्योंकि मौजूदा v1 और v2.1 मॉडल में यह संभव नहीं था। SDXL का जेनरेट किया गया टेक्स्ट हमेशा सटीक नहीं होता जैसा कि आप इसमें देख सकते हैं Stable Diffusion नीचे पाठ करें. हालाँकि, यह v2.1 से कहीं बेहतर है, v1 मॉडल की तो बात ही छोड़ दें। ऐसा इसलिए है क्योंकि SDXL अधिक उन्नत गहन शिक्षण एल्गोरिदम का उपयोग करता है जो इसे अधिक जटिल भाषा संरचनाओं को समझने और उत्पन्न करने की अनुमति देता है। आगे के विकास के साथ, इसमें और भी अधिक सटीक और विश्वसनीय बनने की क्षमता है।

संकेत: एक सज्जन की तस्वीर जिसके हाथ में एक सफ़ेद कागज़ है जिस पर लिखा है "नो फेक"
संकेत: एक सज्जन की तस्वीर जिसके हाथ में एक सफ़ेद कागज़ है जिस पर लिखा है "नो फेक"
एक लाल बालों वाली महिला की तस्वीर जिसमें सफेद फोंट के साथ एक काला चिन्ह है जिस पर लिखा है "नो जोक्स"
संकेत: एक लाल बालों वाली महिला की तस्वीर जिसमें सफेद फोंट के साथ एक काला चिन्ह है जिस पर लिखा है "नो जोक्स"
आदेश: एक सिनेमाघर में बैठी एक चीनी महिला की तस्वीर जिसमें "दर्द और विमान" शब्द लिखा था।
आदेश: एक सिनेमाघर में बैठी एक चीनी महिला की तस्वीर जिस पर "दर्द और विमान" शब्द लिखा हुआ है।

मानव शरीर रचना विज्ञान। शारीरिक रूप से सही मानव आकृतियों की सटीक पीढ़ी लंबे समय से एक चुनौती रही है stable diffusion. अतिरिक्त या लापता अंगों की उपस्थिति आम है। आमतौर पर उन्हें ठीक करने के लिए इनपेंटिंग का उपयोग किया जाता है, या, हाल ही में, आप एक संदर्भ छवि से मुद्रा को डुप्लिकेट करने के लिए कंट्रोलनेट की ओपन पोज़ सुविधा का उपयोग कर सकते हैं। हमें यह जानकर खुशी हो रही है कि यहीं पर SDXL बीटा मॉडल में सुधार हुआ है। SDXL बीटा मॉडल ने संदर्भ छवियों से सटीक रूप से डुप्लिकेटिंग पोज़ में महत्वपूर्ण सुधार दिखाया है। यह एनीमेशन और आभासी वास्तविकता जैसे विभिन्न अनुप्रयोगों के लिए एक मूल्यवान उपकरण हो सकता है।

खेल पोशाक में एक महिला का फोटो दाहिने हाथ में गेंद को घुमाती हुई
निर्देश: खेल पोशाक में एक महिला की तस्वीर जो दाहिने हाथ में गेंद को घुमा रही है
लाल चाँद के नीचे बैठे लड़के का फोटो
आदेश: लाल चाँद के नीचे बैठे एक लड़के की तस्वीर
आदेश: एक तस्वीर में एक बूढ़े आदमी को जंगल में दौड़ते हुए दिखाया गया है।

पोर्ट्रेट शैली। SDXL बीटा उत्कृष्ट पोर्ट्रेट बनाता है जो फ़ोटो की तरह दिखता है - यह संस्करण 1.5 की तुलना में एक अपग्रेड है। SDXL बीटा में बेहतर एल्गोरिथम पोर्ट्रेट के विवरण और रंग सटीकता को बढ़ाता है, जिसके परिणामस्वरूप अधिक प्राकृतिक और यथार्थवादी रूप दिखाई देता है। उपयोगकर्ता अपने वांछित प्रभाव को प्राप्त करने के लिए तीक्ष्णता और संतृप्ति के स्तरों को भी समायोजित कर सकते हैं।

आदेश: एक लड़के और लड़की की एक तस्वीर
आदेश: एक लड़के और लड़की की एक तस्वीर
आदेश: एक मोटे आदमी का पोर्ट्रेट फोटो
आदेश: एक मोटे आदमी का पोर्ट्रेट फोटो
आदेश: 80 के दशक की एक महिला का फोटो शॉट
आदेश: 80 के दशक की एक महिला का फोटो शॉट

डुओटोन। कीवर्ड डुओटोन हमेशा v1.5 मॉडल में श्वेत-श्याम तस्वीरें तैयार करता है। हालाँकि, अब, SDXL बीटा द्वारा निर्मित डुओटोन छवियां विभिन्न रंगों में आती हैं। यह स्पष्ट है कि v1 मॉडल की तुलना में, करने की क्षमता संकेत की व्याख्या करें सुधार हुआ है, जिसके परिणामस्वरूप v2 मॉडल से अधिक सटीक और प्रासंगिक प्रतिक्रियाएँ प्राप्त हुई हैं, जिससे वे प्राकृतिक भाषा प्रसंस्करण कार्यों के लिए अधिक विश्वसनीय उपकरण बन गए हैं।

डुओटोन शैली में एक कुत्ते का चित्र
संकेत: एक कुत्ते का डुओटोन शैली का चित्र
डुओटोन द्वीप के परिदृश्य
संकेत: द्वीप का डुओटोन परिदृश्य
युवा अफ्रीकी महिला का डुओटोन चित्र
संकेत: युवा अफ्रीकी महिला का डुओटोन चित्र

कलात्मक शैलियाँ। कुछ छोटे समायोजन हुए हैं, लेकिन यह निर्धारित करना मुश्किल है कि नया मॉडल बेहतर परिणाम प्रदान करता है या नहीं क्योंकि वे बिल्कुल अद्वितीय हैं। यह संभव है कि ये समायोजन व्यक्तिगत प्राथमिकता या व्यक्तिपरक राय का मामला हो सकता है, जिससे इसे बनाना मुश्किल हो जाता है defiउनकी गुणवत्ता पर सकारात्मक निर्णय. बहरहाल, समायोजन की विशिष्टता उल्लेखनीय और आगे की खोज के लायक हो सकती है।

न्यूयॉर्क इवान Aivazovsky द्वारा
v 1.5: इवान ऐवाज़ोव्स्की द्वारा न्यूयॉर्क
न्यूयॉर्क इवान Aivazovsky द्वारा
SDXL: इवान ऐवाज़ोव्स्की द्वारा न्यूयॉर्क
क्रिस्टोफर बालास्कास द्वारा पुराना वन
वी 1.5: क्रिस्टोफर बालास्कस द्वारा ओल्ड फ़ॉरेस्ट
क्रिस्टोफर बालास्कास द्वारा पुराना वन
SDXL: क्रिस्टोफर बालास्कास द्वारा पुराना वन

निष्कर्ष

  • Stable Diffusion अंततः वह पाठ तैयार कर सकता है जो अर्थपूर्ण हो।
  • SDXL v2.1 और (कुछ हद तक) v1.5 मॉडल की तुलना में अधिक सौंदर्यपूर्ण रूप से मनभावन छवियां प्रदान करता है।
  • नया मॉडल ऐसी छवियां बनाता है जो अधिक सटीक होती हैं।
  • मानव शरीर रचना विज्ञान में सुधार हुआ है।
  • v2.1 की तरह नकारात्मक संकेत आवश्यक नहीं हैं।
  • यह यथार्थवादी चित्र बना सकता है।
  • रिलीज से पहले मॉडल में कुछ विषमताओं को ठीक किया जाएगा।

अधिक संबंधित लेख पढ़ें:

Disclaimer

साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।

के बारे में लेखक

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

और अधिक लेख
दामिर यालालोव
दामिर यालालोव

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

Hot Stories
हमारे समाचार पत्र शामिल हों।
नवीनतम समाचार

सजा का दिन आ गया: सीजेड का भाग्य अधर में लटक गया क्योंकि अमेरिकी अदालत ने डीओजे की याचिका पर विचार किया

चांगपेंग झाओ आज सिएटल की एक अमेरिकी अदालत में सजा का सामना करने के लिए तैयार हैं।

अधिक जानिए

समुराई वॉलेट संस्थापकों पर डार्कनेट डील में $2B की सुविधा देने का आरोप लगाया गया

समुराई वॉलेट के संस्थापकों की आशंका उद्योग के लिए एक उल्लेखनीय झटके का प्रतिनिधित्व करती है, जो लगातार जारी रहने को रेखांकित करती है ...

अधिक जानिए
हमारे इनोवेटिव टेक समुदाय से जुड़ें
विस्तार में पढ़ें
अधिक पढ़ें
अंकर ने एआई के लिए बिटकॉइन तरलता को अनलॉक करने के लिए एआई ब्लॉकचेन प्लेटफॉर्म टैलस नेटवर्क के साथ सहयोग किया है
व्यवसाय समाचार रिपोर्ट टेक्नोलॉजी
अंकर ने एआई के लिए बिटकॉइन तरलता को अनलॉक करने के लिए एआई ब्लॉकचेन प्लेटफॉर्म टैलस नेटवर्क के साथ सहयोग किया है
1 मई 2024
बिनेंस लैब्स ब्लॉकचेन में फेसबुक के मूव इंटीग्रेशन को सुविधाजनक बनाने के लिए मूवमेंट लैब्स का समर्थन करती है
व्यवसाय समाचार रिपोर्ट टेक्नोलॉजी
बिनेंस लैब्स ब्लॉकचेन में फेसबुक के मूव इंटीग्रेशन को सुविधाजनक बनाने के लिए मूवमेंट लैब्स का समर्थन करती है
1 मई 2024
ब्रिक्स राष्ट्रों की नजर स्थिर मुद्रा व्यापार समाधान पर है
व्यवसाय Markets कहानियाँ और समीक्षाएँ टेक्नोलॉजी
ब्रिक्स राष्ट्रों की नजर स्थिर मुद्रा व्यापार समाधान पर है
1 मई 2024
बिटकॉइन एल2 नेटवर्क बीओबी उन्नत कार्यक्षमता के लिए लेयरजीरो के साथ एकीकृत होता है
व्यवसाय समाचार रिपोर्ट टेक्नोलॉजी
बिटकॉइन एल2 नेटवर्क बीओबी उन्नत कार्यक्षमता के लिए लेयरजीरो के साथ एकीकृत होता है
1 मई 2024
क्रिप्टोमेरिया लैब्स पीटीई। लिमिटेड