ERNIE-ViLG 2.0: Baidu का नया टेक्स्ट-टू-इमेज मॉडल डैल-2 से बेहतर प्रदर्शन करता है और Stable Diffusion
संक्षेप में
दल्ले-2 और Stable Diffusion ERNIE-ViLG 2.0 द्वारा उल्लेखनीय रूप से बेहतर प्रदर्शन किया गया
एर्नी-विलग 2.0 एक टेक्स्ट-टू-इमेज मॉडल है जो डेल-2 से बेहतर प्रदर्शन प्रदान करता है Stable Diffusion, वर्तमान में उपलब्ध दो सबसे लोकप्रिय टेक्स्ट-टू-इमेज मॉडल। नए मॉडल को Baidu के शोधकर्ताओं की एक टीम द्वारा डिजाइन और प्रशिक्षित किया गया था, और परिणाम लुभावने हैं।
परिणामों से पता चला कि ERNIE-ViLG 2.0 ने डेल-2 से काफी बेहतर प्रदर्शन किया Stable Diffusion. यह एक महत्वपूर्ण उपलब्धि है और ERNIE ढांचे की शक्ति को प्रदर्शित करती है। Metaverse Post टीम ने ERNIE-ViLG 2.0 की तुलना की Stable Diffusion नीचे:
ये परिणाम इस परिकल्पना के लिए मजबूत समर्थन प्रदान करते हैं कि ERNIE-ViLG 2.0 अधिक प्रभावी है डेल-2 और दोनों की तुलना में टेक्स्ट-टू-इमेज प्रणाली Stable Diffusion.
यूनेट वास्तुकला से Stable Diffusion को आधार के रूप में लिया जाता है, लेकिन परिवर्तनों के साथ:
- डेनोइजिंग विशेषज्ञों का मिश्रण: केवल एक के बजाय 10 तंत्रिका नेटवर्क हैं, जिनमें से प्रत्येक केवल कुछ प्रसार चरणों के लिए जिम्मेदार है।
- पाठ्य ज्ञान: क्वेरी में स्वचालित रूप से शब्दों को फिर से वेट किया जाता है ताकि कीवर्ड्स को अधिक महत्व मिले।
- दृश्य ज्ञान: प्रशिक्षण के दौरान, मध्यवर्ती पीढ़ी के परिणामों पर वस्तुओं का पता लगाया गया था, और वस्तुओं वाले क्षेत्रों पर हानि कार्य का भार बढ़ गया था।
नतीजतन, दुनिया का सबसे बड़ा टेक्स्ट-टू-इमेज मॉडल मॉडल को प्रशिक्षित करने के लिए 24 बिलियन पैरामीटर (एसडी से 10 गुना बड़ा) के साथ सामने आए।
संकेतों का स्वचालित रूप से चीनी से अंग्रेजी में अनुवाद किया जाता है हगिंग फ़ेस एआई में भेजे जाने से पहले सार्वजनिक प्रदर्शन। इससे बहुत सारी विशेषताएं प्रवाहित होती हैं।
- ERNIE अंतर्राष्ट्रीय सार्वजनिक हस्तियों को नहीं जानता। उदाहरण के लिए, ERNIE अर्नोल्ड श्वार्जनेगर को नहीं जानता। यह निश्चित रूप से चीन में स्थानीय पसंदीदा है।
- नतीजतन, सेलिब्रिटी नामों का उपयोग करने की विधि नाटकीय रूप से गुणवत्ता को बढ़ावा देती है चेहरे के विफल रहता है।
- चीनी से अनुवाद के कारण आप कुछ विकृति की अपेक्षा कर सकते हैं, इसलिए यदि आप चीनी नहीं बोलते हैं तो आपके लिए कुछ आश्चर्य की स्थिति हो सकती है।
- यह ग्रेग रुतकोवस्की के बारे में कुछ भी नहीं जानता।
संबंधित लेख पढ़ें:
Disclaimer
साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।
के बारे में लेखक
दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है।
और अधिक लेखदामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है।