राय टेक्नोलॉजी
अगस्त 23, 2023

शोधकर्ताओं ने बड़े भाषा मॉडल की 'उभरती क्षमताओं' की धारणा को चुनौती दी

संक्षेप में

अचानक बड़े भाषा मॉडल की घटना के कारण एजीआई सर्वनाश एक चिंता का विषय है क्षमताओं का प्रदर्शन ऐसा प्रतीत होता है कि छोटे मॉडलों में ऐसा नहीं है।

इस घटना को "बड़े भाषा मॉडल की उभरती क्षमताएं" कहा जाता है।

लेख के लेखक "क्या बड़े भाषा मॉडल की उभरती क्षमताएं एक मृगतृष्णा हैं?" तर्क देते हैं कि उभरती क्षमताओं का प्रभाव मृगतृष्णा नहीं है, बल्कि कार्य करने की क्षमता में अनुमानित वृद्धि है।

वे दिखाते हैं कि कम से कम 92% बिग बेंच समस्याओं में बड़े मॉडलों के लिए अचानक सफलता नहीं होती है, और जैसे-जैसे मॉडल का आकार बढ़ता है, उनके मॉडल की गुणवत्ता सुचारू रूप से और अनुमानित रूप से बढ़ती है।

बड़े भाषा मॉडलों की संभावित क्षमताओं की हालिया जांच में, शोधकर्ताओं ने "उभरती क्षमताओं" की धारणा को चुनौती दी और उनकी कार्यक्षमता के अधिक अनुमानित पहलू पर प्रकाश डाला। लेख का शीर्षक "बड़े भाषा मॉडलों की उभरती क्षमताओं की वास्तविकताओं का अनावरण” मेट्रिक्स की गलत व्याख्या की ओर ध्यान दिलाता है जिसके कारण यह गलत धारणा बन गई है कि ये मॉडल अनायास ही उन्नत कौशल हासिल कर लेते हैं।

शोधकर्ताओं ने बड़े भाषा मॉडल की 'उभरती क्षमताओं' की धारणा को चुनौती दी
क्रेडिट: Metaverse Post / Stable Diffusion

इसकी अवधारणा "उभरती क्षमताएँबड़े भाषा मॉडल के संदर्भ में, जैसे कि GPT श्रृंखला ने इन मॉडलों में मानव चेतना के समान अप्रत्याशित क्षमताओं को विकसित करने की क्षमता के बारे में चिंताएं बढ़ा दी हैं। यह पेपर दावा करता है कि ये धारणाएँ मॉडलों के वास्तविक व्यवहार और क्षमताओं की त्रुटिपूर्ण समझ पर आधारित हैं।

आम तौर पर देखी जाने वाली घटना, जहां बड़े मॉडल अमूर्त तर्क, समस्या-समाधान और यहां तक ​​​​कि हास्य जैसी नई क्षमताओं को प्राप्त करते हैं, को "बड़े भाषा मॉडल की उभरती क्षमताओं" के रूप में जाना जाता है। लेख के लेखकों का तर्क है कि ये क्षमताएं उतनी सहज नहीं हैं जितनी वे दिखाई देती हैं, बल्कि भ्रामक मूल्यांकन मेट्रिक्स का परिणाम हैं।

अपनी बात को स्पष्ट करने के लिए, शोधकर्ता "पहेली का अनुमान लगाएं" के कार्य पर विचार करते हैं, एक ऐसी समस्या जहां भाषा मॉडल को प्राकृतिक भाषा पहेली को समझने और प्राकृतिक भाषा में सही उत्तर देने की आवश्यकता होती है। परंपरागत रूप से, प्रतिक्रियाओं की गुणवत्ता का मूल्यांकन एक बाइनरी मीट्रिक का उपयोग करके किया गया है: एक प्रतिक्रिया को 1 का स्कोर दिया जाता है यदि यह सही उत्तर से बिल्कुल मेल खाता है, और अन्यथा 0 का स्कोर दिया जाता है।

मामले की जड़ कार्य की जटिलता और मॉडल मापदंडों की संख्या के प्रति मीट्रिक की संवेदनशीलता में निहित है। शोधकर्ता बताते हैं कि यह बाइनरी मीट्रिक एक की ओर ले जाता है भ्रामक धारणा "उभरती क्षमताओं" का। छोटे मॉडल अक्सर इस मीट्रिक पर नगण्य सटीकता (ईपीएस) प्रदर्शित करते हैं, जबकि बड़े मॉडल, विशेष रूप से उच्च पैरामीटर गणना वाले, उल्लेखनीय सटीकता स्तर (एसीसी> 0.5) प्राप्त करते प्रतीत होते हैं।

लेख में तर्क दिया गया है कि क्षमता में यह स्पष्ट बदलाव मॉडलों द्वारा अनायास जटिल कौशल प्राप्त करने का संकेत नहीं है। इसके बजाय, मॉडलों की अधिक सूक्ष्म प्रतिक्रियाओं को समझने और उत्पन्न करने की क्षमता उनके आउटपुट के अधिक सावधानीपूर्वक मूल्यांकन से उत्पन्न होती है। सटीक स्ट्रिंग मिलान के बजाय संभाव्य मिलान और अर्थ संबंधी सुसंगतता पर ध्यान केंद्रित करके, शोधकर्ता बताते हैं कि मॉडलों की प्रगति प्रदर्शन में, उनके आकार की परवाह किए बिना, अधिक तार्किक प्रक्षेपवक्र का अनुसरण किया जाता है।

सम्बंधित: T9-युग से चैटबॉट्स का विकास और GPT-1 सेवा मेरे ChatGPT

बदलते मापदंडों के साथ मॉडल प्रदर्शन विकास की जांच

बदलते मापदंडों के साथ मॉडल प्रदर्शन विकास की जांच
क्रेडिट: Metaverse Post / Stable Diffusion

एक विश्लेषणात्मक जांच में, शोधकर्ताओं ने कथित "उभरती क्षमताओं" के पीछे के सूक्ष्म यांत्रिकी को उजागर किया बड़े भाषा मॉडल. अध्ययन मॉडल प्रदर्शन के मूल्यांकन में सुपरडिस्क्रीट मेट्रिक्स के प्रभाव पर सवाल उठाता है और मॉडल मापदंडों के विस्तार के रूप में उनकी क्षमताओं की अधिक पूर्वानुमानित समझ को स्पष्ट करता है।

व्यापक भाषा मॉडल में "उभरती क्षमताओं" की प्रचलित धारणा ने चर्चाओं को आकर्षित किया है और संभावित सफलताओं के बारे में चिंताएं बढ़ा दी हैं। यह अध्ययन इस घटना के अंतर्निहित तंत्र को सुलझाने और यह समझने का प्रयास करता है कि क्या ये मॉडल वास्तव में अचानक, अभूतपूर्व क्षमताओं का प्रदर्शन करते हैं या क्या इन कथित प्रगति को किसी अलग कारण से जिम्मेदार ठहराया जा सकता है।

अध्ययन के केंद्र में मॉडल प्रदर्शन को मापने के लिए नियोजित मैट्रिक्स का सावधानीपूर्वक मूल्यांकन निहित है। शोधकर्ताओं का तर्क है कि सुपरडिस्क्रिट मेट्रिक्स का उपयोग, विशेष रूप से पारंपरिक बाइनरी मेट्रिक जो सटीक स्ट्रिंग मिलान निर्धारित करता है, बड़े की व्याख्या को विकृत कर सकता है भाषा मॉडल क्षमताएँ. अध्ययन सावधानीपूर्वक विश्लेषण करता है कि मॉडल-जनित उत्तरों की संभाव्यता वितरण मॉडल पैरामीटर पैमाने के रूप में कैसे विकसित होती है।

"उभरती क्षमताओं" की धारणा के विपरीत, अध्ययन एक अधिक व्यवस्थित प्रवृत्ति का खुलासा करता है। जैसे-जैसे मॉडल का आकार बढ़ता है, उचित उत्तरों के लिए उच्च संभावनाएँ और गलत उत्तरों के लिए कम संभावनाएँ निर्दिष्ट करने की इसकी क्षमता में सुधार होता है। यह विभिन्न आकारों में समस्याओं को कुशलता से हल करने की मॉडल की क्षमता में लगातार वृद्धि को दर्शाता है। संक्षेप में, शोध से पता चलता है कि मॉडल की सीखने की प्रक्रिया अच्छी तरह से चलती है-defiअचानक छलांग लगाने के बजाय सुधार के प्रक्षेप पथ की आवश्यकता है।

लेखक अलग-अलग मेट्रिक्स को निरंतर मेट्रिक्स से बदलने का प्रस्ताव देकर एक आदर्श बदलाव का परिचय देते हैं। यह परिवर्तन प्रदर्शन विकास की एक स्पष्ट तस्वीर प्रस्तुत करता है। अपने विश्लेषण के माध्यम से, शोधकर्ताओं ने यह पता लगाया कि लगभग 92% बड़ी बेंच की समस्याएँ जैसे-जैसे मॉडल का आकार बढ़ता है, गुणवत्ता में सहज और पूर्वानुमानित वृद्धि प्रदर्शित होती है। यह खोज इस धारणा को चुनौती देती है कि बड़े मॉडल अचानक सफलताओं का अनुभव करते हैं और इसके बजाय अधिक क्रमिक और प्रत्याशित प्रगति पर प्रकाश डालते हैं।

अध्ययन अपने दावों को मान्य करने के लिए अपनी अंतर्दृष्टि का विस्तार करता है। यह दर्शाता है कि समान "उभरती क्षमता" प्रभाव को पारंपरिक ऑटोएन्कोडर्स का उपयोग करके कृत्रिम रूप से अनुकरण किया जा सकता है, यह सुझाव देता है कि मेट्रिक्स की पसंद कथित परिणामों को महत्वपूर्ण रूप से प्रभावित करती है। यह रहस्योद्घाटन अध्ययन के निहितार्थ के दायरे को व्यापक बनाता है, केवल भाषा मॉडल से परे इसकी प्रासंगिकता को प्रदर्शित करता है।

शोधकर्ता इस बात पर जोर देते हैं कि उनके नतीजे ऐसे नहीं हैं defiबड़े भाषा मॉडलों में "उभरती क्षमताओं" या चेतना की क्षमता को सकारात्मक रूप से नकारें। हालाँकि, उनके निष्कर्ष शोधकर्ताओं को ऐसे दावों को सूक्ष्म दृष्टिकोण से देखने के लिए प्रोत्साहित करते हैं। जल्दबाजी में निष्कर्ष निकालने और अत्यधिक निष्कर्ष निकालने के बजाय, अध्ययन सावधानीपूर्वक जांच और व्यापक विश्लेषण के महत्व पर जोर देता है।

एआई के बारे में और पढ़ें:

Disclaimer

साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।

के बारे में लेखक

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

और अधिक लेख
दामिर यालालोव
दामिर यालालोव

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

Hot Stories
हमारे समाचार पत्र शामिल हों।
नवीनतम समाचार

अस्थिरता के बीच बिटकॉइन ईटीएफ के प्रति संस्थागत रुचि बढ़ी

13एफ फाइलिंग के माध्यम से प्रकटीकरण से पता चलता है कि उल्लेखनीय संस्थागत निवेशक बिटकॉइन ईटीएफ में रुचि ले रहे हैं, जो इसकी बढ़ती स्वीकार्यता को रेखांकित करता है...

अधिक जानिए

सजा का दिन आ गया: सीजेड का भाग्य अधर में लटक गया क्योंकि अमेरिकी अदालत ने डीओजे की याचिका पर विचार किया

चांगपेंग झाओ आज सिएटल की एक अमेरिकी अदालत में सजा का सामना करने के लिए तैयार हैं।

अधिक जानिए
हमारे इनोवेटिव टेक समुदाय से जुड़ें
विस्तार में पढ़ें
अधिक पढ़ें
नेक्सो ने अपने पारिस्थितिकी तंत्र से जुड़ने के लिए उपयोगकर्ताओं को नेक्सो टोकन में $12 मिलियन का इनाम देने के लिए 'द हंट' शुरू किया है
Markets समाचार रिपोर्ट टेक्नोलॉजी
नेक्सो ने अपने पारिस्थितिकी तंत्र से जुड़ने के लिए उपयोगकर्ताओं को नेक्सो टोकन में $12 मिलियन का इनाम देने के लिए 'द हंट' शुरू किया है
8 मई 2024
Revolut के Revolut X एक्सचेंज ने जीरो मेकर फीस और एडवांस्ड एनालिटिक्स के साथ क्रिप्टो ट्रेडर्स को लुभाया
Markets सॉफ्टवेयर कहानियाँ और समीक्षाएँ टेक्नोलॉजी
Revolut के Revolut X एक्सचेंज ने जीरो मेकर फीस और एडवांस्ड एनालिटिक्स के साथ क्रिप्टो ट्रेडर्स को लुभाया
8 मई 2024
लिस्क ने आधिकारिक तौर पर एथेरियम परत 2 में परिवर्तन किया और कोर v4.0.6 का अनावरण किया
समाचार रिपोर्ट टेक्नोलॉजी
लिस्क ने आधिकारिक तौर पर एथेरियम परत 2 में परिवर्तन किया और कोर v4.0.6 का अनावरण किया
8 मई 2024
मई 2024 के नए मेम सिक्के: क्रिप्टो प्रशंसकों के लिए 7 पसंद
संग्रह Markets टेक्नोलॉजी
मई 2024 के नए मेम सिक्के: क्रिप्टो प्रशंसकों के लिए 7 पसंद
8 मई 2024
क्रिप्टोमेरिया लैब्स पीटीई। लिमिटेड