समाचार रिपोर्ट
नवम्बर 06/2022

ERNIE-ViLG 2.0: Baidu का नया टेक्स्ट-टू-इमेज मॉडल डैल-2 से बेहतर प्रदर्शन करता है और Stable Diffusion

संक्षेप में

दल्ले-2 और Stable Diffusion ERNIE-ViLG 2.0 द्वारा उल्लेखनीय रूप से बेहतर प्रदर्शन किया गया

एर्नी-विलग 2.0 एक टेक्स्ट-टू-इमेज मॉडल है जो डेल-2 से बेहतर प्रदर्शन प्रदान करता है Stable Diffusion, वर्तमान में उपलब्ध दो सबसे लोकप्रिय टेक्स्ट-टू-इमेज मॉडल। नए मॉडल को Baidu के शोधकर्ताओं की एक टीम द्वारा डिजाइन और प्रशिक्षित किया गया था, और परिणाम लुभावने हैं।

नया टेक्स्ट-टू-इमेज मॉडल ERNIE-ViLG 2.0, डैल-2 से बेहतर प्रदर्शन करता है और Stable Diffusion
ERNIE-ViLG 2.0 द्वारा बनाई गई छवि

परिणामों से पता चला कि ERNIE-ViLG 2.0 ने डेल-2 से काफी बेहतर प्रदर्शन किया Stable Diffusion. यह एक महत्वपूर्ण उपलब्धि है और ERNIE ढांचे की शक्ति को प्रदर्शित करती है। Metaverse Post टीम ने ERNIE-ViLG 2.0 की तुलना की Stable Diffusion नीचे:

एर्नी-विलग 2.0
Stable Diffusion
एर्नी-विलग 2.0
Stable Diffusion
एर्नी-विलग 2.0
Stable Diffusion
एर्नी-विलग 2.0
Stable Diffusion
एर्नी-विलग 2.0

ये परिणाम इस परिकल्पना के लिए मजबूत समर्थन प्रदान करते हैं कि ERNIE-ViLG 2.0 अधिक प्रभावी है डेल-2 और दोनों की तुलना में टेक्स्ट-टू-इमेज प्रणाली Stable Diffusion.

यूनेट वास्तुकला से Stable Diffusion को आधार के रूप में लिया जाता है, लेकिन परिवर्तनों के साथ:

  • डेनोइजिंग विशेषज्ञों का मिश्रण: केवल एक के बजाय 10 तंत्रिका नेटवर्क हैं, जिनमें से प्रत्येक केवल कुछ प्रसार चरणों के लिए जिम्मेदार है।
  • पाठ्य ज्ञान: क्वेरी में स्वचालित रूप से शब्दों को फिर से वेट किया जाता है ताकि कीवर्ड्स को अधिक महत्व मिले।
  • दृश्य ज्ञान: प्रशिक्षण के दौरान, मध्यवर्ती पीढ़ी के परिणामों पर वस्तुओं का पता लगाया गया था, और वस्तुओं वाले क्षेत्रों पर हानि कार्य का भार बढ़ गया था।

नतीजतन, दुनिया का सबसे बड़ा टेक्स्ट-टू-इमेज मॉडल मॉडल को प्रशिक्षित करने के लिए 24 बिलियन पैरामीटर (एसडी से 10 गुना बड़ा) के साथ सामने आए।

पहले के मॉडलों की तुलना में, जब ViLG-2.0 द्विभाषी पर एक साथ परीक्षण किया गया तो ERNIE-ViLG 300 छवि गुणवत्ता और छवि-से-पाठ मिलान के मामले में उनसे काफी आगे निकल गया। शीघ्र एक व्यक्ति द्वारा निर्धारित.

संकेतों का स्वचालित रूप से चीनी से अंग्रेजी में अनुवाद किया जाता है हगिंग फ़ेस एआई में भेजे जाने से पहले सार्वजनिक प्रदर्शन। इससे बहुत सारी विशेषताएं प्रवाहित होती हैं।

  • ERNIE अंतर्राष्ट्रीय सार्वजनिक हस्तियों को नहीं जानता। उदाहरण के लिए, ERNIE अर्नोल्ड श्वार्जनेगर को नहीं जानता। यह निश्चित रूप से चीन में स्थानीय पसंदीदा है।
  • नतीजतन, सेलिब्रिटी नामों का उपयोग करने की विधि नाटकीय रूप से गुणवत्ता को बढ़ावा देती है चेहरे के विफल रहता है।
  • चीनी से अनुवाद के कारण आप कुछ विकृति की अपेक्षा कर सकते हैं, इसलिए यदि आप चीनी नहीं बोलते हैं तो आपके लिए कुछ आश्चर्य की स्थिति हो सकती है।
  • यह ग्रेग रुतकोवस्की के बारे में कुछ भी नहीं जानता।

संबंधित लेख पढ़ें:

Disclaimer

साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।

के बारे में लेखक

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

और अधिक लेख
दामिर यालालोव
दामिर यालालोव

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

Hot Stories
हमारे समाचार पत्र शामिल हों।
नवीनतम समाचार

सजा का दिन आ गया: सीजेड का भाग्य अधर में लटक गया क्योंकि अमेरिकी अदालत ने डीओजे की याचिका पर विचार किया

चांगपेंग झाओ आज सिएटल की एक अमेरिकी अदालत में सजा का सामना करने के लिए तैयार हैं।

अधिक जानिए

समुराई वॉलेट संस्थापकों पर डार्कनेट डील में $2B की सुविधा देने का आरोप लगाया गया

समुराई वॉलेट के संस्थापकों की आशंका उद्योग के लिए एक उल्लेखनीय झटके का प्रतिनिधित्व करती है, जो लगातार जारी रहने को रेखांकित करती है ...

अधिक जानिए
हमारे इनोवेटिव टेक समुदाय से जुड़ें
विस्तार में पढ़ें
अधिक पढ़ें
अंकर ने एआई के लिए बिटकॉइन तरलता को अनलॉक करने के लिए एआई ब्लॉकचेन प्लेटफॉर्म टैलस नेटवर्क के साथ सहयोग किया है
व्यवसाय समाचार रिपोर्ट टेक्नोलॉजी
अंकर ने एआई के लिए बिटकॉइन तरलता को अनलॉक करने के लिए एआई ब्लॉकचेन प्लेटफॉर्म टैलस नेटवर्क के साथ सहयोग किया है
1 मई 2024
बिनेंस लैब्स ब्लॉकचेन में फेसबुक के मूव इंटीग्रेशन को सुविधाजनक बनाने के लिए मूवमेंट लैब्स का समर्थन करती है
व्यवसाय समाचार रिपोर्ट टेक्नोलॉजी
बिनेंस लैब्स ब्लॉकचेन में फेसबुक के मूव इंटीग्रेशन को सुविधाजनक बनाने के लिए मूवमेंट लैब्स का समर्थन करती है
1 मई 2024
ब्रिक्स राष्ट्रों की नजर स्थिर मुद्रा व्यापार समाधान पर है
व्यवसाय Markets कहानियाँ और समीक्षाएँ टेक्नोलॉजी
ब्रिक्स राष्ट्रों की नजर स्थिर मुद्रा व्यापार समाधान पर है
1 मई 2024
बिटकॉइन एल2 नेटवर्क बीओबी उन्नत कार्यक्षमता के लिए लेयरजीरो के साथ एकीकृत होता है
व्यवसाय समाचार रिपोर्ट टेक्नोलॉजी
बिटकॉइन एल2 नेटवर्क बीओबी उन्नत कार्यक्षमता के लिए लेयरजीरो के साथ एकीकृत होता है
1 मई 2024
क्रिप्टोमेरिया लैब्स पीटीई। लिमिटेड