Markets समाचार रिपोर्ट
अगस्त 08, 2023

अलीबाबा ने ओपन-सोर्स क्वेन-7बी भाषा मॉडल पेश किया

अलीबाबा ने अपने ओपन-सोर्स लार्ज लैंग्वेज मॉडल (एलएलएम) नाम का अनावरण किया है क्वेन-7बी, सार्वजनिक रूप से सुलभ एलएलएम के दायरे में उनके उद्घाटन प्रवेश को चिह्नित करते हुए। यह मॉडल 7 अरब मापदंडों पर बनाया गया है।

अलीबाबा ने ओपन-सोर्स क्वेन-7बी भाषा मॉडल पेश किया

संदर्भ के लिए, Qwen-7B ने 2.2 ट्रिलियन टोकन का उपयोग करके प्रशिक्षण लिया। इस प्रशिक्षण चरण के दौरान निर्धारित संदर्भ आकार 2048 था, जबकि उपयोगकर्ता परीक्षण के दौरान इसे अधिकतम 8192 तक बढ़ा सकते हैं। तुलना से, Llama-2, एक अन्य एलएलएम, 4096 का संदर्भ आकार प्रदान करता है।

ऐसे मॉडलों के प्रदर्शन को मापने के लिए बेंचमार्क आवश्यक हैं, और इस क्षेत्र में, चीनी डेवलपर्स का दावा है कि क्वेन-7बी ने इसे पीछे छोड़ दिया है Llama-2. एक मीट्रिक जो सबसे अलग है वह ह्यूमन-इवल कोडिंग बेंचमार्क है, जहां क्वेन-7बी का स्कोर 24.4 है। Llama-2 का 12.8. हालाँकि, इन नंबरों को कुछ हद तक सावधानी के साथ देखना समझदारी है। कुछ बेंचमार्क यह संकेत देते हैं कि Qwen-7B न केवल बेस मॉडल से बेहतर प्रदर्शन करता है LLama-2-7बी लेकिन यह भी LLaMA-2-13बी वैरिएंट। हालाँकि, जब के परिष्कृत संस्करणों के विरुद्ध खड़ा किया गया Llama-2, अंतर का अंतर कम हो जाता है। यह ध्यान दिया जाना चाहिए कि Qwen-7B की सटीक प्रशिक्षण पद्धति को इसके डेवलपर्स द्वारा स्पष्ट रूप से विस्तृत नहीं किया गया है।

के समानांतर कार्यक्षमता में LLaMa2-चैट, क्वेन ने क्वेन-7बी-चैट नाम से एक चैट-केंद्रित संस्करण प्रस्तुत किया है। यह मॉडल उपयोगकर्ताओं के साथ बातचीत करने के लिए अनुकूलित है और इसमें विभिन्न उपकरण शामिल हैं एपीआई इसकी प्रतिक्रियाशीलता को बढ़ाने के लिए.

तकनीकी विशिष्टताओं के प्रति रुझान रखने वालों को यह जानने में दिलचस्पी होगी कि क्वेन-7बी की वास्तुशिल्प नींव किससे मिलती जुलती है LLaMA. हालाँकि, ऐसी विशिष्ट विशेषताएं हैं जो Qwen-7B को अलग करती हैं:

  1. यह अनटाइड एम्बेडिंग का उपयोग करता है।
  2. रोटरी पोजिशनल एम्बेडिंग का उपयोग किया जाता है।
  3. ध्यान में QKV को छोड़कर पूर्वाग्रहों को बाहर रखा गया है।
  4. लेयरनॉर्म की तुलना में आरएमएसनॉर्म को प्राथमिकता दी जाती है।
  5. मानक ReLU के बजाय, SwiGLU को शामिल किया गया है।
  6. प्रशिक्षण प्रक्रिया में तेजी लाने के लिए फ्लैश अटेंशन की शुरुआत की गई है।
  7. मॉडल में 32 परतें शामिल हैं, इसका एम्बेडिंग आयाम 4096 है, और 32 ध्यान प्रमुखों को समायोजित करता है।

लाइसेंसिंग के संदर्भ में, Qwen-7B के अनुरूप है Llama-2. यह व्यावसायिक उपयोग की अनुमति देता है, लेकिन उपयोगकर्ता की मात्रा पर एक शर्त के साथ। जबकि Llama-2 ने इस सीमा को प्रति माह 700 मिलियन सक्रिय उपयोगकर्ताओं पर निर्धारित किया है, क्वेन-7बी की सीमा 100 मिलियन है।

गहन जांच के इच्छुक लोग GitHub पर उपलब्ध तकनीकी रिपोर्ट का संदर्भ ले सकते हैं। इसके अतिरिक्त, क्वेन-7बी का प्रदर्शनचीनी भाषा में प्रदान किया गया, मॉडल की क्षमताओं के व्यावहारिक अन्वेषण में रुचि रखने वालों के लिए सुलभ है।

एआई के बारे में और पढ़ें:

Disclaimer

साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।

के बारे में लेखक

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

और अधिक लेख
दामिर यालालोव
दामिर यालालोव

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

Hot Stories
हमारे समाचार पत्र शामिल हों।
नवीनतम समाचार

अस्थिरता के बीच बिटकॉइन ईटीएफ के प्रति संस्थागत रुचि बढ़ी

13एफ फाइलिंग के माध्यम से प्रकटीकरण से पता चलता है कि उल्लेखनीय संस्थागत निवेशक बिटकॉइन ईटीएफ में रुचि ले रहे हैं, जो इसकी बढ़ती स्वीकार्यता को रेखांकित करता है...

अधिक जानिए

सजा का दिन आ गया: सीजेड का भाग्य अधर में लटक गया क्योंकि अमेरिकी अदालत ने डीओजे की याचिका पर विचार किया

चांगपेंग झाओ आज सिएटल की एक अमेरिकी अदालत में सजा का सामना करने के लिए तैयार हैं।

अधिक जानिए
हमारे इनोवेटिव टेक समुदाय से जुड़ें
विस्तार में पढ़ें
अधिक पढ़ें
इनसाइड वॉल स्ट्रीट मेम्स (डब्ल्यूएसएम): सुर्खियों का अनावरण
व्यवसाय Markets कहानियाँ और समीक्षाएँ टेक्नोलॉजी
इनसाइड वॉल स्ट्रीट मेम्स (डब्ल्यूएसएम): सुर्खियों का अनावरण
7 मई 2024
क्रिप्टो व्हेल की खोज करें: बाज़ार में कौन है
व्यवसाय Markets कहानियाँ और समीक्षाएँ टेक्नोलॉजी
क्रिप्टो व्हेल की खोज करें: बाज़ार में कौन है
7 मई 2024
ऑर्बिटर फाइनेंस ने बिटकॉइन लेयर 2 ज़ुलु नेटवर्क के साथ साझेदारी की है और इज़ लवाज़ी टेस्टनेट पर तैनाती की है
व्यवसाय समाचार रिपोर्ट टेक्नोलॉजी
ऑर्बिटर फाइनेंस ने बिटकॉइन लेयर 2 ज़ुलु नेटवर्क के साथ साझेदारी की है और इज़ लवाज़ी टेस्टनेट पर तैनाती की है 
7 मई 2024
क्रिप्टो एक्सचेंज बायबिट एथेना लैब्स के यूएसडीई को संपार्श्विक संपत्ति के रूप में एकीकृत करता है, बीटीसी-यूएसडीई और ईटीएच-यूएसडीई ट्रेडिंग जोड़े को सक्षम बनाता है
Markets समाचार रिपोर्ट टेक्नोलॉजी
क्रिप्टो एक्सचेंज बायबिट एथेना लैब्स के यूएसडीई को संपार्श्विक संपत्ति के रूप में एकीकृत करता है, बीटीसी-यूएसडीई और ईटीएच-यूएसडीई ट्रेडिंग जोड़े को सक्षम बनाता है
7 मई 2024
क्रिप्टोमेरिया लैब्स पीटीई। लिमिटेड