एक शोधकर्ता के अनुसार, आज के बड़े भाषा मॉडल छोटे मॉडल होंगे OpenAI
ह्युंग वोन चुंग, एक कुशल एआई शोधकर्ता, जो पहले गूगल ब्रेन में कार्यरत थे और वर्तमान में इसके सदस्य हैं OpenAI टीम ने 45 मिनट का एक विचारोत्तेजक भाषण दिया जिसमें उन्होंने 2023 में बड़े भाषा मॉडल की दुनिया का पता लगाया। चुंग के पास इस क्षेत्र में अनुभव है; वह Google पेपर के पहले लेखक थे"स्केलिंग अनुदेश-सुसंबद्ध भाषा मॉडल,” जो जांच करता है कि निर्देशों का पालन करने के लिए बड़े भाषा मॉडल को कैसे प्रशिक्षित किया जा सकता है।
चुंग व्यापक भाषा मॉडल की दुनिया को गतिशील बताते हैं। एलएलएम की दुनिया में, मार्गदर्शक सिद्धांत लगातार विकसित हो रहा है, पारंपरिक क्षेत्रों के विपरीत जहां मौलिक धारणाएं आमतौर पर स्थिर रहती हैं। मॉडलों की आने वाली पीढ़ी के साथ, जिसे वर्तमान में असंभव या अव्यवहारिक माना जाता है वह संभव हो सकता है। वह एलएलएम क्षमताओं के बारे में अधिकांश दावों को "अभी के लिए" के साथ प्रस्तुत करने के महत्व पर जोर देते हैं। एक मॉडल कोई कार्य कर सकता है; इसने अभी तक ऐसा नहीं किया है।
आज के बड़े मॉडल कुछ ही वर्षों में छोटे मॉडल बन जायेंगे
ह्युंग वोन चुंग, OpenAI
सावधानीपूर्वक दस्तावेज़ीकरण और पुनरुत्पादन की आवश्यकता एआई अनुसंधान चुंग के भाषण से सीखे जाने वाले सबसे महत्वपूर्ण सबक में से एक है। जैसे-जैसे क्षेत्र विकसित होता है, चल रहे काम का पूरी तरह से दस्तावेजीकरण करना महत्वपूर्ण है। यह रणनीति गारंटी देती है कि प्रयोगों को जल्दी से दोहराया और दोबारा देखा जा सकता है, जिससे शोधकर्ताओं को पहले के काम पर काम करने में मदद मिलेगी। इस अभ्यास के माध्यम से, यह स्वीकार किया जाता है कि भविष्य में क्षमताएं विकसित हो सकती हैं जो प्रारंभिक शोध के दौरान व्यावहारिक नहीं थीं।
चुंग ने अपनी बातचीत का एक हिस्सा डेटा और मॉडल समानता की जटिलताओं को स्पष्ट करने के लिए समर्पित किया है। एआई के तकनीकी पहलुओं में गहराई से जानने में रुचि रखने वालों के लिए, यह खंड इन समानता तकनीकों की आंतरिक कार्यप्रणाली में मूल्यवान अंतर्दृष्टि प्रदान करता है। अनुकूलन के लिए इन तंत्रों को समझना महत्वपूर्ण है बड़े पैमाने पर मॉडल प्रशिक्षण.
चुंग का मानना है कि एलएलएम पूर्व-प्रशिक्षण के लिए उपयोग किया जाने वाला वर्तमान उद्देश्य फ़ंक्शन, अधिकतम संभावना, एक बाधा है जब यह वास्तव में बड़े पैमाने पर हासिल करने की बात आती है, जैसे कि क्षमता से 10,000 गुना GPT-4. जैसे-जैसे मशीन लर्निंग आगे बढ़ती है, मैन्युअल रूप से डिज़ाइन किए गए हानि फ़ंक्शन तेजी से सीमित होते जाते हैं।
चुंग का सुझाव है कि एआई विकास के अगले प्रतिमान में अलग-अलग एल्गोरिदम के माध्यम से सीखने के कार्य शामिल हैं। यह दृष्टिकोण, हालाँकि अपनी प्रारंभिक अवस्था में है, वर्तमान बाधाओं से परे स्केलेबिलिटी का वादा रखता है। उन्होंने इस दिशा में कदम के रूप में नियम मॉडलिंग के साथ मानव प्रतिक्रिया से सुदृढीकरण सीखने (आरएलएचएफ) जैसे चल रहे प्रयासों पर भी प्रकाश डाला, हालांकि चुनौतियों पर काबू पाना बाकी है।
Disclaimer
साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।
के बारे में लेखक
दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है।
और अधिक लेखदामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है।