साक्षात्कार कला एसएमडब्ल्यू
01 मई 2023

डीपफ्लॉयड एंड बियॉन्ड: नाइट कैफे स्टूडियो के सीईओ के साथ एआई आर्ट में नवीनतम की खोज

संक्षेप में

एक विशेष साक्षात्कार के दौरान, नाइटकैफे स्टूडियो के सीईओ ने एआई-जनित कला पर मूल्यवान अंतर्दृष्टि और दृष्टिकोण प्रदान किया।

एंगस रसेल ने डीपफ्लोयड पेश किया - नाइटकैफे स्टूडियो के पार्टनर द्वारा विकसित एक नया एल्गोरिदम, Stability AI, जो पिक्सेल स्पेस में काम करता है और छवियां उत्पन्न करने के लिए एक बड़े भाषा मॉडल (एलएलएम) का उपयोग करता है।

नाइट कैफे स्टूडियो एक एआई आर्ट जेनरेटर है जो उपयोगकर्ताओं को आर्टिफिशियल इंटेलिजेंस की मदद से सेकेंडों में आश्चर्यजनक और भविष्य की कला बनाने की अनुमति देता है। द्वारा स्थापित एंगस रसेल चार साल पहले, नाइटकैफ़ स्टूडियो का जन्म एंगस की खुद की हताशा से हुआ था, जो उनके साथ प्रतिध्वनित होने वाली कला के टुकड़ों को खोजने में सक्षम नहीं था। स्टाइल ट्रांसफर एल्गोरिदम मौजूद होने के ज्ञान से प्रेरित होकर, उन्होंने एक ऐसी वेबसाइट की खोज की, जो उन्हें स्टाइल ट्रांसफर के माध्यम से वैयक्तिकृत कला बनाने और उसे प्रिंट करने में सक्षम बनाए। 

उनकी निराशा के लिए, उन्हें ऐसा कोई मंच नहीं मिला। हालाँकि, इस झटके ने उनमें एक नवीन विचार जगाया। उन्होंने एआई-जनित कला बनाने के लिए एक न्यूरल स्टाइल ट्रांसफर ऐप बनाने का फैसला किया और उन्होंने इसे रेडिट पर डाल दिया।

नाइटकैफ़ स्टूडियो की उत्पत्ति एक टेक्स्ट-टू-इमेज जेनरेशन प्लेटफॉर्म के रूप में हुई, जो इसे अपनी तरह का पहला बनाता है। इस अनूठी विशेषता ने राजस्व और उपयोगकर्ता आधार दोनों में महत्वपूर्ण वृद्धि की। तब से, मंच जनरेटिव एआई के मामले में सबसे आगे बना हुआ है, जो उत्साही लोगों के एक बड़े समुदाय को आकर्षित करता है जो आश्चर्यजनक कलाकृति बनाने के लिए जनरेटर का उपयोग करने में प्रसन्न होते हैं। आज, नाइटकैफ़ स्टूडियो को व्यापक रूप से उपलब्ध सबसे लोकप्रिय और अभिनव एआई छवि जनरेटरों में से एक माना जाता है।

एंगस रसेल के साथ एक साक्षात्कार के दौरान, हमने एआई-जनित कला के लाभों और सीमाओं, कला की दुनिया में कृत्रिम बुद्धिमत्ता के बढ़ते उपयोग और नवीनतम एआई इमेज जनरेशन एल्गोरिथम, डीपफ्लोयड का पता लगाया।

नाइट कैफे स्टूडियो
सिडनी ओपेरा हाउस: एंगस की पहली एआई-जनित छवियों में से एक

एआई-जनित कला का उद्भव

पिछले दशक में, कला उद्योग ने एआई और मशीन लर्निंग (एमएल) की क्रमिक घुसपैठ देखी है। इन अत्याधुनिक तकनीकों ने कुछ आकर्षक नई अवधारणाएं पेश की हैं, जैसे कि डीपफेक और DALL-E, जिसने दुनिया भर में महत्वपूर्ण ध्यान आकर्षित किया है। आज, कला उद्योग एआई के अत्यधिक प्रभाव को नजरअंदाज नहीं कर सकता है, जो अब इस क्षेत्र में एक लंबे समय से प्रतीक्षित क्रांति को ट्रिगर कर रहा है।

एंगस ने चर्चा की कि कैसे नाइटकैफ़ स्टूडियो ने रिलीज़ के दौरान विकास में स्पाइक्स का अनुभव किया Stable Diffusion, एक टेक्स्ट-टू-इमेज मॉडल जिसे लॉन्च के दिन उनकी कंपनी लाइव कर गई। तब से, एल्गोरिदम और नमूना कोड के ओपन-सोर्सिंग के कारण समान उपकरण बनाने के लिए प्रवेश की बाधा कम हो गई है।

नाइटकैफे स्टूडियो के संस्थापक का मानना ​​है कि एआई कला बनाना केवल अंतिम उत्पाद के बारे में नहीं है बल्कि इसे बनाने की प्रक्रिया के बारे में भी है। वह इसे चिकित्सा और विश्राम के रूप में देखता है, जिससे लोग अद्वितीय और रचनात्मक तरीके से स्वयं को अभिव्यक्त कर सकते हैं। बहुत से लोग जिन्होंने कभी खुद को रचनात्मक नहीं माना था, उन्होंने एआई-जनित छवियों के माध्यम से अपनी कलात्मक क्षमताओं का पता लगाया है। यह दर्शन प्लेटफॉर्म के यूजर इंटरफेस में परिलक्षित होता है, जिसे उपयोगकर्ता के अनुकूल और सभी कौशल स्तरों के कलाकारों के लिए सुलभ बनाया गया है। 

अकेले नाइटकैफे स्टूडियो पर, पहले से ही प्रति माह दो से तीन मिलियन उपयोगकर्ता हैं, जो प्रति दिन लगभग दस लाख छवियां उत्पन्न करते हैं। Stability AI, एक ओपन-सोर्स जेनरेटिव एआई कंपनी, वर्णित उनके 10 मिलियन से अधिक उपयोगकर्ता थे जो लॉन्च के तुरंत बाद प्रतिदिन सक्रिय थे Stable Diffusion.

अनुशंसित: 10 के 2023+ सर्वश्रेष्ठ एआई आर्ट जेनरेटर: Midjourney, DALL-E, नाइटकैफे, आर्टब्रीडर

DeepFloyd IF: द न्यू गेम-चेंजिंग AI इमेज जनरेशन एल्गोरिथम

नाइटकैफे स्टूडियो एक नया एल्गोरिदम लागू कर रहा है Stability AI बुलाया डीपफ्लोयड, जो आर्टिफिशियल इंटेलिजेंस के साथ छवियों को बनाने के तरीके में क्रांति लाने का वादा करता है।

DeepFloyd, जो वर्तमान में बीटा में है, एक नया टेक्स्ट-टू-इमेज मॉडल है जो प्राकृतिक भाषा विवरणों से प्रभावशाली चित्र उत्पन्न कर सकता है। यह एक उपन्यास वास्तुकला पर आधारित है जो एक बड़े भाषा मॉडल को तीन प्रसार मॉडल के साथ जोड़ती है। यह Imagen से प्रेरित है, Google रिसर्च द्वारा विकसित एक समान मॉडल लेकिन जनता के लिए कभी जारी नहीं किया गया।

मॉडल विभिन्न स्थानिक संबंधों में पाठ और वस्तुओं के साथ स्पष्ट और सुसंगत छवियां उत्पन्न कर सकता है, जो कि अधिकांश अन्य पाठ-से-छवि मॉडल के लिए एक चुनौतीपूर्ण कार्य है। यह टेक्स्ट एनकोडर के रूप में बड़े भाषा मॉडल T5-XXL-1.1 और टेक्स्ट-इमेज क्रॉस-अटेंशन लेयर्स की एक महत्वपूर्ण मात्रा का उपयोग करके प्राप्त किया जाता है जो बेहतर संकेत और छवि गठबंधन प्रदान करते हैं। 

डीपफ्लोयड एक गैर-मानक पहलू अनुपात के साथ छवियां भी बना सकता है और इसमें उच्च स्तर की फोटोरिअलिज्म है। इसके अलावा, यह ज़ीरो-शॉट इमेज-टू-इमेज ट्रांसलेशन की अनुमति देता है, जिसका अर्थ है कि फाइन-ट्यूनिंग की आवश्यकता के बिना स्रोत इमेज के मूल रूप को बनाए रखते हुए आउटपुट इमेज की शैली, पैटर्न और विवरण को संशोधित किया जा सकता है।

नया एल्गोरिदम इससे अलग तरीके से काम करता है Stable Diffusion. डीपफ्लोयड पिक्सेल स्पेस और एक बड़े भाषा मॉडल (एलएलएम) का उपयोग करता है, जबकि Stable Diffusion अव्यक्त स्थान और एक निश्चित CLIP मॉडल का उपयोग करता है। डीपफ्लोयड छवियां बनाने के लिए कई प्रसार प्रक्रियाओं का भी उपयोग करता है Stable Diffusion केवल एक का उपयोग करता है।

डीपफ्लोयड उस अनुसंधान समूह का नाम है जिसने एल्गोरिदम बनाया है, और एल्गोरिदम को ही IF कहा जाता है। अनुसंधान समूह में वही लोग शामिल हैं जिन्होंने इसे बनाया है GPT-3के पूर्ववर्ती, GPT-2, और एक पिछला अत्याधुनिक भाषा मॉडल जिसे आरयू कहा जाता हैGPT.

कुछ अटकलें बताती हैं कि IF नाम उसी नाम के एक पिंक फ़्लॉइड गीत से प्रेरित हो सकता है, जैसा कि एल्गोरिथम अनुसंधान समूह के सोशल मीडिया बायोस द्वारा संकेत दिया गया है।

एल्गोरिदम के बारे में और पढ़ें यहाँ उत्पन्न करें.

डीपफ्लोयड नाइटकैफे स्टूडियो
डीपफ्लोयड आईएफ के साथ उत्पन्न छवियाँ। स्रोत: Stability AI

एआई कला सीमाओं और डिजिटल कला की तुलना करना

एआई की प्रमुख सीमाओं में से एक टेक्स्ट है, हालांकि डीपफ्लॉयड इस मुद्दे से निपटता है। एक और सीमा बिल्कुल कल्पना के अनुरूप छवि प्राप्त करने में कठिनाई है, विशेष रूप से विशेषज्ञ के संकेत के बिना। एआई में समझने और व्याख्या करने की क्षमता का भी अभाव है सांस्कृतिक और सामाजिक संदर्भ जो मानव कला को आकार देते हैं. इसलिए, एआई-जनित कला कभी-कभी ऐसे काम कर सकती है जो जगह से बाहर या सांस्कृतिक रूप से असंवेदनशील लगते हैं।

हालांकि, एआई-जनरेटेड छवियां अभी भी सुंदर हो सकती हैं और कभी-कभी मूल विचार से भी बेहतर हो सकती हैं, जब तक कि उपयोगकर्ता आश्चर्यचकित होने के लिए तैयार है, एंगस ने कहा। इसके अलावा, संशोधित करने के तरीके भी हैं एआई एल्गोरिदम या फ़ोटोशॉप का उपयोग करके छवियां तैयार की गईं. हालाँकि सटीक छवि प्राप्त करना वर्तमान में सक्रिय अनुसंधान का क्षेत्र है, लेकिन इसमें महत्वपूर्ण प्रगति हो रही है। किसी छवि के हर पहलू पर पूर्ण नियंत्रण रखना जल्द ही संभव हो सकता है। 

एआई उन छवियों और कला पर निर्भर करता है जो वेब पर प्रेरणा के रूप में मौजूद हैं, लेकिन केवल उन्हीं पर जिन्हें इसे प्रशिक्षित किया गया था। विभिन्न एल्गोरिदम, जैसे Midjourney, DALL-ई, और Stable Diffusion, विभिन्न डेटा सेटों पर प्रशिक्षित होते हैं, जिसका अर्थ है कि वे विशिष्ट प्रकार की छवियों पर बेहतर प्रदर्शन कर सकते हैं। 

हाल ही में, शोधकर्ता एआई परिणामों को बेहतर बनाने के लिए प्रशिक्षण डेटा सेट से निम्न-गुणवत्ता वाली छवियों को हटाने के प्रभाव की जांच कर रहे हैं। इन निम्न-गुणवत्ता वाली छवियों को फ़िल्टर करके, परिणामी डेटा सेट छोटा लेकिन उच्च गुणवत्ता वाला हो सकता है, जिससे एआई मॉडल के आकार को बढ़ाए बिना या अधिक महंगे हार्डवेयर की आवश्यकता के बिना बेहतर परिणाम मिल सकते हैं। एंगस ने साझा किया कि यह दृष्टिकोण बड़े और अधिक संसाधन-गहन मॉडल पर भरोसा किए बिना एआई-जनित छवियों की गुणवत्ता में सुधार करने का एक आशाजनक तरीका दर्शाता है।

कला में एआई के साथ एक मुद्दा यह है कि यह मानव कलाकारों के काम का अवमूल्यन कर सकता है, जो कला बनाने में काफी समय लगाते हैं, जबकि एआई सेकंड के मामले में कला उत्पन्न करने में सक्षम है। हालांकि, मानव कला के लिए एक निश्चित अमूर्त गुण है जो एआई के लिए दोहराना मुश्किल हो सकता है, जैसे कि भावनात्मक गहराई और जटिलता अक्सर मानव-निर्मित कार्यों में मौजूद होती है। नाइटकैफे स्टूडियो का मानना ​​है कि एआई व्यावसायिक उद्देश्यों के लिए कला बनाने के बारे में कम है और रचनात्मक प्रक्रिया के आनंद के बारे में अधिक है।

"मानव-निर्मित कला में हमेशा मूल्य होगा क्योंकि यह कलाकार के प्रयास और कौशल का प्रतिनिधित्व करता है, जबकि एआई-जनित कला में समान आंतरिक मूल्य नहीं होता है,"

एंगस ने कहा।

कला में एआई से जुड़ा एक नैतिक मुद्दा एआई एल्गोरिदम को प्रशिक्षित करने के लिए सार्वजनिक छवि का उपयोग है जो एआई को प्रशिक्षित करने वाली कंपनी से संबंधित नहीं हो सकता है। हालाँकि वर्तमान में कोई कानून नहीं तोड़ा गया है, लेकिन यह सहमति और गोपनीयता के बारे में सवाल उठाता है। ओपन-सोर्स कंपनियां पसंद करती हैं OpenAI और DALL-E इस प्रक्रिया को और अधिक नैतिक बनाने पर काम कर रहे हैं, लेकिन यह एक खुला प्रश्न बना हुआ है। कला में एआई को प्रशिक्षित करने के लिए छवियों के उपयोग के संबंध में भविष्य में नियम हो सकते हैं।

इन चिंताओं के बावजूद, एंगस का मानना ​​है कि कला में एआई की प्रक्रिया अन्य कलाकारों के काम से प्रेरणा लेने वाले मानव कलाकारों से मौलिक रूप से अलग नहीं है। एआई जानता है कि चीजें कैसी दिखती हैं और छवियों के बारे में बिट्स को याद करती हैं, ठीक वैसे ही जैसे मनुष्य करते हैं। उन्हें स्क्रैच से फिर से बनाना बेहतर है।

अधिक पढ़ें:

Disclaimer

साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।

के बारे में लेखक

एग्ने एक पत्रकार हैं जो मेटावर्स, एआई और में नवीनतम रुझानों और विकास को कवर करते हैं Web3 उद्योगों के लिए Metaverse Post. कहानी कहने के प्रति उनके जुनून ने उन्हें इन क्षेत्रों के विशेषज्ञों के साथ कई साक्षात्कार आयोजित करने के लिए प्रेरित किया है, जो हमेशा रोमांचक और आकर्षक कहानियों को उजागर करने की कोशिश करते हैं। एग्ने के पास साहित्य में स्नातक की डिग्री है और यात्रा, कला और संस्कृति सहित विभिन्न विषयों पर लिखने की उनकी व्यापक पृष्ठभूमि है। उन्होंने पशु अधिकार संगठन के लिए एक संपादक के रूप में भी स्वेच्छा से काम किया है, जहां उन्होंने पशु कल्याण के मुद्दों के बारे में जागरूकता बढ़ाने में मदद की। उससे संपर्क करें [ईमेल संरक्षित].

और अधिक लेख
एग्ने सिमरमैन
एग्ने सिमरमैन

एग्ने एक पत्रकार हैं जो मेटावर्स, एआई और में नवीनतम रुझानों और विकास को कवर करते हैं Web3 उद्योगों के लिए Metaverse Post. कहानी कहने के प्रति उनके जुनून ने उन्हें इन क्षेत्रों के विशेषज्ञों के साथ कई साक्षात्कार आयोजित करने के लिए प्रेरित किया है, जो हमेशा रोमांचक और आकर्षक कहानियों को उजागर करने की कोशिश करते हैं। एग्ने के पास साहित्य में स्नातक की डिग्री है और यात्रा, कला और संस्कृति सहित विभिन्न विषयों पर लिखने की उनकी व्यापक पृष्ठभूमि है। उन्होंने पशु अधिकार संगठन के लिए एक संपादक के रूप में भी स्वेच्छा से काम किया है, जहां उन्होंने पशु कल्याण के मुद्दों के बारे में जागरूकता बढ़ाने में मदद की। उससे संपर्क करें [ईमेल संरक्षित].

Hot Stories
हमारे समाचार पत्र शामिल हों।
नवीनतम समाचार

अस्थिरता के बीच बिटकॉइन ईटीएफ के प्रति संस्थागत रुचि बढ़ी

13एफ फाइलिंग के माध्यम से प्रकटीकरण से पता चलता है कि उल्लेखनीय संस्थागत निवेशक बिटकॉइन ईटीएफ में रुचि ले रहे हैं, जो इसकी बढ़ती स्वीकार्यता को रेखांकित करता है...

अधिक जानिए

सजा का दिन आ गया: सीजेड का भाग्य अधर में लटक गया क्योंकि अमेरिकी अदालत ने डीओजे की याचिका पर विचार किया

चांगपेंग झाओ आज सिएटल की एक अमेरिकी अदालत में सजा का सामना करने के लिए तैयार हैं।

अधिक जानिए
हमारे इनोवेटिव टेक समुदाय से जुड़ें
विस्तार में पढ़ें
अधिक पढ़ें
InEVM में सुरक्षा बहाल करने के लिए Injective AltLayer के साथ जुड़ गया है
व्यवसाय समाचार रिपोर्ट टेक्नोलॉजी
InEVM में सुरक्षा बहाल करने के लिए Injective AltLayer के साथ जुड़ गया है
3 मई 2024
मासा ने टेलर के साथ मिलकर मासा लेंडिंग पूल की शुरुआत की, यूएसडीसी को आधार पर उधार लेने में सक्षम बनाया
Markets समाचार रिपोर्ट टेक्नोलॉजी
मासा ने टेलर के साथ मिलकर मासा लेंडिंग पूल की शुरुआत की, यूएसडीसी को आधार पर उधार लेने में सक्षम बनाया
3 मई 2024
वेलोड्रोम ने आने वाले हफ्तों में सुपरचेन बीटा संस्करण लॉन्च किया और ओपी स्टैक लेयर 2 ब्लॉकचेन में विस्तार किया
Markets समाचार रिपोर्ट टेक्नोलॉजी
वेलोड्रोम ने आने वाले हफ्तों में सुपरचेन बीटा संस्करण लॉन्च किया और ओपी स्टैक लेयर 2 ब्लॉकचेन में विस्तार किया
3 मई 2024
CARV ने अपने डेटा स्तर को विकेंद्रीकृत करने और पुरस्कार वितरित करने के लिए एथिर के साथ साझेदारी की घोषणा की
व्यवसाय समाचार रिपोर्ट टेक्नोलॉजी
CARV ने अपने डेटा स्तर को विकेंद्रीकृत करने और पुरस्कार वितरित करने के लिए एथिर के साथ साझेदारी की घोषणा की
3 मई 2024
क्रिप्टोमेरिया लैब्स पीटीई। लिमिटेड