माइक्रोसॉफ्ट ने एलएलएम को हैरी पॉटर के बारे में भूलने के लिए मजबूर किया
माइक्रोसॉफ्ट ने एक तरीका बताया है बड़े भाषा मॉडल (एलएलएम) को प्रशिक्षण डेटा के पूर्ण पुनर्निर्माण की आवश्यकता के बिना अपने डेटासेट के भीतर विशिष्ट जानकारी को भूलने का निर्देश देने के लिए। यह विधि एलएलएम में सुधार और कॉपीराइट सामग्री से जुड़े कानूनी मुद्दों को संभावित रूप से हल करने की नई संभावनाएं खोलती है।
माइक्रोसॉफ्ट की टीम ने हाल ही में प्रदर्शित किया कि वे इसे बनाने में कैसे सक्षम थे Llama-2 मॉडल मॉडल के प्रशिक्षण डेटा में अन्य डेटा या उनके अनुसंधान परियोजना पृष्ठ पर वर्णित अध्ययन में मॉडल के समग्र प्रदर्शन को प्रभावित किए बिना हैरी पॉटर पुस्तकों के विवरण को भूल जाते हैं।
यह प्रक्रिया मॉडल के डेटासेट के भीतर विशिष्ट जानकारी की पहचान के साथ शुरू होती है जिसे भूलने की आवश्यकता होती है। इस मामले में, यह जेके राउलिंग की प्रतिष्ठित श्रृंखला से संबंधित विवरण था, जिसमें कथानक की विशिष्टताएं, चरित्र के नाम और प्रसिद्ध उद्धरण शामिल थे। फिर इन्हें व्यवस्थित रूप से सामान्य, असंबंधित वाक्यांशों से बदल दिया गया।
शोधकर्ताओं ने इस सामान्य डेटा के आधार पर नई जानकारी उत्पन्न करने के लिए एक भाषा मॉडल का उपयोग किया। इस ताज़ा डेटा का उपयोग मूल को पुनः प्रशिक्षित करने के लिए किया गया था Llama-2 मॉडल क्रमिक रूप से. हर कदम के साथ, मॉडल ने खुद को हैरी पॉटर की किताबों से तब तक दूर कर लिया जब तक कि उनके बारे में पूछे जाने पर उसने भ्रामक प्रतिक्रियाएं देना शुरू नहीं कर दिया।
इस दृष्टिकोण की एक खास बात यह है कि यह मॉडल के सामान्य प्रदर्शन से समझौता नहीं करता है। इसका मतलब यह है कि जहां एलएलएम विशिष्ट डेटा के बारे में तेजी से भूलने लगता है, वहीं इसकी समग्र भाषा क्षमताएं बरकरार रहती हैं।
इस तथ्य के बावजूद कि इस दृष्टिकोण को अभी भी परिष्कृत किया जा रहा है, इसके निहितार्थ व्यापक हैं। विशेष रूप से कानूनी दावों और कॉपीराइट मुद्दों से जुड़ी स्थितियों में, यह एलएलएम और अन्य एआई मॉडल बनाने वालों को जीवन रेखा प्रदान कर सकता है।
यह नवाचार ऐसे समय में आया है जब एआई मॉडल में कॉपीराइट सामग्री के उपयोग पर कानूनी विवाद बढ़ रहे हैं। उदाहरण के लिए, न्यूयॉर्क टाइम्स ने हाल ही में हटाने की मांग की थी से इसके प्रकाशनों की GPT-4 डेटासेट सफल होने की स्थिति में कानूनी चुनौती, डेवलपर्स को आम तौर पर अपने मॉडल डेटासेट, एक समय लेने वाली और संसाधन-गहन प्रक्रिया का पुनर्निर्माण करने की आवश्यकता होगी। यदि Microsoft की पद्धति को और अधिक परिष्कृत और अपनाया जाए, तो ऐसी चुनौतियों का एक कुशल समाधान प्रदान किया जा सकता है।
बड़े भाषा मॉडल के भीतर विशिष्ट जानकारी को चुनिंदा रूप से भूलने की Microsoft की विधि (एलएलएम) एआई विकास में एक महत्वपूर्ण सफलता है, जो संभावित रूप से कॉपीराइट सामग्री के मुद्दों को संबोधित करती है और शोधन को सुव्यवस्थित करती है। यह दृष्टिकोण जिम्मेदार एआई विकास और अनुप्रयोग को प्रदर्शित करते हुए विभिन्न डोमेन पर लागू किया जा सकता है।
Disclaimer
साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।
के बारे में लेखक
दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है।
और अधिक लेखदामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है।