समाचार रिपोर्ट टेक्नोलॉजी
19 जून 2023

SnapFusion: 1.9 सेकंड के भीतर मोबाइल उपकरणों के लिए तेज़ टेक्स्ट-टू-इमेज मॉडल

संक्षेप में

SnapFusion चलाकर सामग्री निर्माण को बदलता है पाठ से छवि प्रसार मॉडल सीधे मोबाइल उपकरणों पर, लागत कम करने और गोपनीयता संबंधी चिंताओं को दूर करने के लिए।

स्नैपफ़्यूज़न एक टेक्स्ट-टू-इमेज एआई मॉडल है जो उपयोगकर्ताओं को अपने मोबाइल उपकरणों पर केवल दो सेकंड के भीतर प्राकृतिक भाषा के विवरण से आश्चर्यजनक छवियां उत्पन्न करने में सक्षम बनाता है। इन जटिल मॉडलों को चलाने के लिए हाई-एंड जीपीयू या क्लाउड-आधारित सेवाओं पर भरोसा करने के दिन गए। SnapFusion उपयोगकर्ताओं के हाथों में टेक्स्ट-टू-इमेज प्रसार की शक्ति डालकर सामग्री निर्माण का लोकतंत्रीकरण करता है।

SnapFusion: 1.9 सेकंड के भीतर मोबाइल उपकरणों के लिए तेज और कुशल टेक्स्ट-टू-इमेज मॉडल
क्रेडिट: Midjourney / लिली10292#2100

पाठ्य विवरण से यथार्थवादी चित्र बनाना हमेशा एक चुनौतीपूर्ण कार्य रहा है। पिछले मॉडल बड़े नेटवर्क आर्किटेक्चर की आवश्यकता है और कई denoising पुनरावृत्तियों, उन्हें बना रही है कम्प्यूटेशनल रूप से महंगा और धीमा. इसके अलावा, इन मॉडलों को चलाने में अक्सर उपयोगकर्ता डेटा को तीसरे पक्ष की सेवाओं में भेजना, उठाना शामिल होता है सुरक्षा की सोच.

इन चुनौतियों का समाधान करने के लिए, SnapFusion के रचनाकारों ने एक कुशल नेटवर्क आर्किटेक्चर विकसित किया और स्टेप डिस्टिलेशन प्रक्रिया में सुधार किया। मूल मॉडल में अतिरेक की पहचान करके, उन्होंने एक कुशल यूनेट पेश किया और छवि डिकोडर की गणना को कम कर दिया डेटा आसवन. इसके अतिरिक्त, उन्होंने प्रशिक्षण रणनीतियों की खोज करके और नियमितीकरण तकनीकों को पेश करके स्टेप डिस्टिलेशन को बढ़ाया।

arxiv.org/pdf/2306.00980.pdf

पर व्यापक प्रयोग एमएस-कोको डेटासेट SnapFusion की श्रेष्ठता का प्रदर्शन किया। केवल आठ डीनोइजिंग चरणों के साथ, SnapFusion ने पिछले की तुलना में बेहतर FID और CLIP स्कोर हासिल किए अत्याधुनिक मॉडल, Stable Diffusion v1.5, जिसके लिए 50 चरणों की आवश्यकता थी। दक्षता और प्रदर्शन में यह उल्लेखनीय सुधार सामग्री निर्माण के लिए नई संभावनाओं को खोलता है।

SnapFusion का प्रभाव इसकी तकनीकी उपलब्धियों से परे है। चलाकर पाठ से छवि प्रसार मॉडल सीधे मोबाइल उपकरणों पर, यह महंगे जीपीयू और क्लाउड-आधारित सेवाओं की आवश्यकता को समाप्त करता है। यह न केवल लागत कम करता है बल्कि तीसरे पक्ष को उपयोगकर्ता डेटा भेजने से जुड़ी गोपनीयता संबंधी चिंताओं को भी दूर करता है। उपयोगकर्ता अब अपनी रचनात्मकता को उजागर कर सकते हैं और चलते-फिरते उच्च-गुणवत्ता वाली छवियां उत्पन्न कर सकते हैं।

विभिन्न बढ़त उपकरणों के साथ संगत बनाने के लिए मॉडल के पैरामीटर आकार को और कम किया जा सकता है। इसके अतिरिक्त, विभिन्न मोबाइल उपकरणों के लिए मॉडल का अनुकूलन करना तेजी से निष्कर्ष प्राप्त करें गति एक सतत शोध विषय है।

दुर्भावनापूर्ण एप्लिकेशन को रोकने के लिए जिम्मेदारी से SnapFusion और इसी तरह की तकनीकों का उपयोग करना आवश्यक है। उपाय किए जा सकते हैं, जैसे स्वचालित पहचान प्रणाली जो नियमों का उल्लंघन करने वाली छवि सामग्री की पहचान करती है और फ़्लैग करती है। नवाचार और नैतिक विचारों के बीच संतुलन बनाकर, SnapFusion एक सुरक्षित और जिम्मेदार उपयोगकर्ता अनुभव सुनिश्चित करते हुए सामग्री निर्माण को बदल सकता है।

एआई के बारे में और पढ़ें:

Disclaimer

साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।

के बारे में लेखक

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

और अधिक लेख
दामिर यालालोव
दामिर यालालोव

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

Hot Stories
हमारे समाचार पत्र शामिल हों।
नवीनतम समाचार

अस्थिरता के बीच बिटकॉइन ईटीएफ के प्रति संस्थागत रुचि बढ़ी

13एफ फाइलिंग के माध्यम से प्रकटीकरण से पता चलता है कि उल्लेखनीय संस्थागत निवेशक बिटकॉइन ईटीएफ में रुचि ले रहे हैं, जो इसकी बढ़ती स्वीकार्यता को रेखांकित करता है...

अधिक जानिए

सजा का दिन आ गया: सीजेड का भाग्य अधर में लटक गया क्योंकि अमेरिकी अदालत ने डीओजे की याचिका पर विचार किया

चांगपेंग झाओ आज सिएटल की एक अमेरिकी अदालत में सजा का सामना करने के लिए तैयार हैं।

अधिक जानिए
हमारे इनोवेटिव टेक समुदाय से जुड़ें
विस्तार में पढ़ें
अधिक पढ़ें
एलडी कैपिटल, एंटालफा वेंचर्स और हाईब्लॉक लिमिटेड $128M हांगकांग ईटीएफ लिक्विडिटी फंड लॉन्च करने के लिए एकजुट हुए
व्यवसाय Markets समाचार रिपोर्ट
एलडी कैपिटल, एंटालफा वेंचर्स और हाईब्लॉक लिमिटेड $128M हांगकांग ईटीएफ लिक्विडिटी फंड लॉन्च करने के लिए एकजुट हुए
8 मई 2024
इनसाइड वॉल स्ट्रीट मेम्स (डब्ल्यूएसएम): सुर्खियों का अनावरण
व्यवसाय Markets कहानियाँ और समीक्षाएँ टेक्नोलॉजी
इनसाइड वॉल स्ट्रीट मेम्स (डब्ल्यूएसएम): सुर्खियों का अनावरण
7 मई 2024
क्रिप्टो व्हेल की खोज करें: बाज़ार में कौन है
व्यवसाय Markets कहानियाँ और समीक्षाएँ टेक्नोलॉजी
क्रिप्टो व्हेल की खोज करें: बाज़ार में कौन है
7 मई 2024
ऑर्बिटर फाइनेंस ने बिटकॉइन लेयर 2 ज़ुलु नेटवर्क के साथ साझेदारी की है और इज़ लवाज़ी टेस्टनेट पर तैनाती की है
व्यवसाय समाचार रिपोर्ट टेक्नोलॉजी
ऑर्बिटर फाइनेंस ने बिटकॉइन लेयर 2 ज़ुलु नेटवर्क के साथ साझेदारी की है और इज़ लवाज़ी टेस्टनेट पर तैनाती की है 
7 मई 2024
क्रिप्टोमेरिया लैब्स पीटीई। लिमिटेड