समाचार रिपोर्ट
नवम्बर 06/2022

ERNIE-ViLG 2.0: Baidu का नया टेक्स्ट-टू-इमेज मॉडल डैल-2 से बेहतर प्रदर्शन करता है और Stable Diffusion

संक्षेप में

दल्ले-2 और Stable Diffusion ERNIE-ViLG 2.0 द्वारा उल्लेखनीय रूप से बेहतर प्रदर्शन किया गया

एर्नी-विलग 2.0 एक टेक्स्ट-टू-इमेज मॉडल है जो डेल-2 से बेहतर प्रदर्शन प्रदान करता है Stable Diffusion, वर्तमान में उपलब्ध दो सबसे लोकप्रिय टेक्स्ट-टू-इमेज मॉडल। नए मॉडल को Baidu के शोधकर्ताओं की एक टीम द्वारा डिजाइन और प्रशिक्षित किया गया था, और परिणाम लुभावने हैं।

नया टेक्स्ट-टू-इमेज मॉडल ERNIE-ViLG 2.0, डैल-2 से बेहतर प्रदर्शन करता है और Stable Diffusion
ERNIE-ViLG 2.0 द्वारा बनाई गई छवि

परिणामों से पता चला कि ERNIE-ViLG 2.0 ने डेल-2 से काफी बेहतर प्रदर्शन किया Stable Diffusion. यह एक महत्वपूर्ण उपलब्धि है और ERNIE ढांचे की शक्ति को प्रदर्शित करती है। Metaverse Post टीम ने ERNIE-ViLG 2.0 की तुलना की Stable Diffusion नीचे:

एर्नी-विलग 2.0
Stable Diffusion
एर्नी-विलग 2.0
Stable Diffusion
एर्नी-विलग 2.0
Stable Diffusion
एर्नी-विलग 2.0
Stable Diffusion
एर्नी-विलग 2.0

ये परिणाम इस परिकल्पना के लिए मजबूत समर्थन प्रदान करते हैं कि ERNIE-ViLG 2.0 अधिक प्रभावी है डेल-2 और दोनों की तुलना में टेक्स्ट-टू-इमेज प्रणाली Stable Diffusion.

यूनेट वास्तुकला से Stable Diffusion को आधार के रूप में लिया जाता है, लेकिन परिवर्तनों के साथ:

  • डेनोइजिंग विशेषज्ञों का मिश्रण: केवल एक के बजाय 10 तंत्रिका नेटवर्क हैं, जिनमें से प्रत्येक केवल कुछ प्रसार चरणों के लिए जिम्मेदार है।
  • पाठ्य ज्ञान: क्वेरी में स्वचालित रूप से शब्दों को फिर से वेट किया जाता है ताकि कीवर्ड्स को अधिक महत्व मिले।
  • दृश्य ज्ञान: प्रशिक्षण के दौरान, मध्यवर्ती पीढ़ी के परिणामों पर वस्तुओं का पता लगाया गया था, और वस्तुओं वाले क्षेत्रों पर हानि कार्य का भार बढ़ गया था।

नतीजतन, दुनिया का सबसे बड़ा टेक्स्ट-टू-इमेज मॉडल मॉडल को प्रशिक्षित करने के लिए 24 बिलियन पैरामीटर (एसडी से 10 गुना बड़ा) के साथ सामने आए।

पहले के मॉडलों की तुलना में, जब ViLG-2.0 द्विभाषी पर एक साथ परीक्षण किया गया तो ERNIE-ViLG 300 छवि गुणवत्ता और छवि-से-पाठ मिलान के मामले में उनसे काफी आगे निकल गया। शीघ्र एक व्यक्ति द्वारा निर्धारित.

संकेतों का स्वचालित रूप से चीनी से अंग्रेजी में अनुवाद किया जाता है हगिंग फ़ेस एआई में भेजे जाने से पहले सार्वजनिक प्रदर्शन। इससे बहुत सारी विशेषताएं प्रवाहित होती हैं।

  • ERNIE अंतर्राष्ट्रीय सार्वजनिक हस्तियों को नहीं जानता। उदाहरण के लिए, ERNIE अर्नोल्ड श्वार्जनेगर को नहीं जानता। यह निश्चित रूप से चीन में स्थानीय पसंदीदा है।
  • नतीजतन, सेलिब्रिटी नामों का उपयोग करने की विधि नाटकीय रूप से गुणवत्ता को बढ़ावा देती है चेहरे के विफल रहता है।
  • चीनी से अनुवाद के कारण आप कुछ विकृति की अपेक्षा कर सकते हैं, इसलिए यदि आप चीनी नहीं बोलते हैं तो आपके लिए कुछ आश्चर्य की स्थिति हो सकती है।
  • यह ग्रेग रुतकोवस्की के बारे में कुछ भी नहीं जानता।

संबंधित लेख पढ़ें:

Disclaimer

साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।

के बारे में लेखक

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

और अधिक लेख
दामिर यालालोव
दामिर यालालोव

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

Hot Stories
हमारे समाचार पत्र शामिल हों।
नवीनतम समाचार

अस्थिरता के बीच बिटकॉइन ईटीएफ के प्रति संस्थागत रुचि बढ़ी

13एफ फाइलिंग के माध्यम से प्रकटीकरण से पता चलता है कि उल्लेखनीय संस्थागत निवेशक बिटकॉइन ईटीएफ में रुचि ले रहे हैं, जो इसकी बढ़ती स्वीकार्यता को रेखांकित करता है...

अधिक जानिए

सजा का दिन आ गया: सीजेड का भाग्य अधर में लटक गया क्योंकि अमेरिकी अदालत ने डीओजे की याचिका पर विचार किया

चांगपेंग झाओ आज सिएटल की एक अमेरिकी अदालत में सजा का सामना करने के लिए तैयार हैं।

अधिक जानिए
हमारे इनोवेटिव टेक समुदाय से जुड़ें
विस्तार में पढ़ें
अधिक पढ़ें
InEVM में सुरक्षा बहाल करने के लिए Injective AltLayer के साथ जुड़ गया है
व्यवसाय समाचार रिपोर्ट टेक्नोलॉजी
InEVM में सुरक्षा बहाल करने के लिए Injective AltLayer के साथ जुड़ गया है
3 मई 2024
मासा ने टेलर के साथ मिलकर मासा लेंडिंग पूल की शुरुआत की, यूएसडीसी को आधार पर उधार लेने में सक्षम बनाया
Markets समाचार रिपोर्ट टेक्नोलॉजी
मासा ने टेलर के साथ मिलकर मासा लेंडिंग पूल की शुरुआत की, यूएसडीसी को आधार पर उधार लेने में सक्षम बनाया
3 मई 2024
वेलोड्रोम ने आने वाले हफ्तों में सुपरचेन बीटा संस्करण लॉन्च किया और ओपी स्टैक लेयर 2 ब्लॉकचेन में विस्तार किया
Markets समाचार रिपोर्ट टेक्नोलॉजी
वेलोड्रोम ने आने वाले हफ्तों में सुपरचेन बीटा संस्करण लॉन्च किया और ओपी स्टैक लेयर 2 ब्लॉकचेन में विस्तार किया
3 मई 2024
CARV ने अपने डेटा स्तर को विकेंद्रीकृत करने और पुरस्कार वितरित करने के लिए एथिर के साथ साझेदारी की घोषणा की
व्यवसाय समाचार रिपोर्ट टेक्नोलॉजी
CARV ने अपने डेटा स्तर को विकेंद्रीकृत करने और पुरस्कार वितरित करने के लिए एथिर के साथ साझेदारी की घोषणा की
3 मई 2024
क्रिप्टोमेरिया लैब्स पीटीई। लिमिटेड