समाचार रिपोर्ट टेक्नोलॉजी
अक्टूबर 10

माइक्रोसॉफ्ट ने एलएलएम को हैरी पॉटर के बारे में भूलने के लिए मजबूर किया

माइक्रोसॉफ्ट ने एलएलएम को हैरी पॉटर के बारे में भूलने के लिए मजबूर किया
स्रोत: डैल-ई 3

माइक्रोसॉफ्ट ने एक तरीका बताया है बड़े भाषा मॉडल (एलएलएम) को प्रशिक्षण डेटा के पूर्ण पुनर्निर्माण की आवश्यकता के बिना अपने डेटासेट के भीतर विशिष्ट जानकारी को भूलने का निर्देश देने के लिए। यह विधि एलएलएम में सुधार और कॉपीराइट सामग्री से जुड़े कानूनी मुद्दों को संभावित रूप से हल करने की नई संभावनाएं खोलती है।

माइक्रोसॉफ्ट की टीम ने हाल ही में प्रदर्शित किया कि वे इसे बनाने में कैसे सक्षम थे Llama-2 मॉडल मॉडल के प्रशिक्षण डेटा में अन्य डेटा या उनके अनुसंधान परियोजना पृष्ठ पर वर्णित अध्ययन में मॉडल के समग्र प्रदर्शन को प्रभावित किए बिना हैरी पॉटर पुस्तकों के विवरण को भूल जाते हैं।

यह प्रक्रिया मॉडल के डेटासेट के भीतर विशिष्ट जानकारी की पहचान के साथ शुरू होती है जिसे भूलने की आवश्यकता होती है। इस मामले में, यह जेके राउलिंग की प्रतिष्ठित श्रृंखला से संबंधित विवरण था, जिसमें कथानक की विशिष्टताएं, चरित्र के नाम और प्रसिद्ध उद्धरण शामिल थे। फिर इन्हें व्यवस्थित रूप से सामान्य, असंबंधित वाक्यांशों से बदल दिया गया।

शोधकर्ताओं ने इस सामान्य डेटा के आधार पर नई जानकारी उत्पन्न करने के लिए एक भाषा मॉडल का उपयोग किया। इस ताज़ा डेटा का उपयोग मूल को पुनः प्रशिक्षित करने के लिए किया गया था Llama-2 मॉडल क्रमिक रूप से. हर कदम के साथ, मॉडल ने खुद को हैरी पॉटर की किताबों से तब तक दूर कर लिया जब तक कि उनके बारे में पूछे जाने पर उसने भ्रामक प्रतिक्रियाएं देना शुरू नहीं कर दिया।

इस दृष्टिकोण की एक खास बात यह है कि यह मॉडल के सामान्य प्रदर्शन से समझौता नहीं करता है। इसका मतलब यह है कि जहां एलएलएम विशिष्ट डेटा के बारे में तेजी से भूलने लगता है, वहीं इसकी समग्र भाषा क्षमताएं बरकरार रहती हैं।

इस तथ्य के बावजूद कि इस दृष्टिकोण को अभी भी परिष्कृत किया जा रहा है, इसके निहितार्थ व्यापक हैं। विशेष रूप से कानूनी दावों और कॉपीराइट मुद्दों से जुड़ी स्थितियों में, यह एलएलएम और अन्य एआई मॉडल बनाने वालों को जीवन रेखा प्रदान कर सकता है।

यह नवाचार ऐसे समय में आया है जब एआई मॉडल में कॉपीराइट सामग्री के उपयोग पर कानूनी विवाद बढ़ रहे हैं। उदाहरण के लिए, न्यूयॉर्क टाइम्स ने हाल ही में हटाने की मांग की थी से इसके प्रकाशनों की GPT-4 डेटासेट सफल होने की स्थिति में कानूनी चुनौती, डेवलपर्स को आम तौर पर अपने मॉडल डेटासेट, एक समय लेने वाली और संसाधन-गहन प्रक्रिया का पुनर्निर्माण करने की आवश्यकता होगी। यदि Microsoft की पद्धति को और अधिक परिष्कृत और अपनाया जाए, तो ऐसी चुनौतियों का एक कुशल समाधान प्रदान किया जा सकता है।

बड़े भाषा मॉडल के भीतर विशिष्ट जानकारी को चुनिंदा रूप से भूलने की Microsoft की विधि (एलएलएम) एआई विकास में एक महत्वपूर्ण सफलता है, जो संभावित रूप से कॉपीराइट सामग्री के मुद्दों को संबोधित करती है और शोधन को सुव्यवस्थित करती है। यह दृष्टिकोण जिम्मेदार एआई विकास और अनुप्रयोग को प्रदर्शित करते हुए विभिन्न डोमेन पर लागू किया जा सकता है।

Disclaimer

साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।

के बारे में लेखक

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

और अधिक लेख
दामिर यालालोव
दामिर यालालोव

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

Hot Stories
हमारे समाचार पत्र शामिल हों।
नवीनतम समाचार

अस्थिरता के बीच बिटकॉइन ईटीएफ के प्रति संस्थागत रुचि बढ़ी

13एफ फाइलिंग के माध्यम से प्रकटीकरण से पता चलता है कि उल्लेखनीय संस्थागत निवेशक बिटकॉइन ईटीएफ में रुचि ले रहे हैं, जो इसकी बढ़ती स्वीकार्यता को रेखांकित करता है...

अधिक जानिए

सजा का दिन आ गया: सीजेड का भाग्य अधर में लटक गया क्योंकि अमेरिकी अदालत ने डीओजे की याचिका पर विचार किया

चांगपेंग झाओ आज सिएटल की एक अमेरिकी अदालत में सजा का सामना करने के लिए तैयार हैं।

अधिक जानिए
हमारे इनोवेटिव टेक समुदाय से जुड़ें
विस्तार में पढ़ें
अधिक पढ़ें
एस्प्रेसो सिस्टम्स ने रोलअप इंटरऑपरेबिलिटी को बढ़ाने के लिए एग्गलेयर विकसित करने के लिए पॉलीगॉन लैब्स के साथ सहयोग किया है
व्यवसाय समाचार रिपोर्ट टेक्नोलॉजी
एस्प्रेसो सिस्टम्स ने रोलअप इंटरऑपरेबिलिटी को बढ़ाने के लिए एग्गलेयर विकसित करने के लिए पॉलीगॉन लैब्स के साथ सहयोग किया है
9 मई 2024
ZKP-संचालित इन्फ्रास्ट्रक्चर प्रोटोकॉल ZKBase ने रोडमैप का अनावरण किया, मई में टेस्टनेट लॉन्च की योजना बनाई
समाचार रिपोर्ट टेक्नोलॉजी
ZKP-संचालित इन्फ्रास्ट्रक्चर प्रोटोकॉल ZKBase ने रोडमैप का अनावरण किया, मई में टेस्टनेट लॉन्च की योजना बनाई
9 मई 2024
जर्मनी के सबसे बड़े के लिए ब्लॉकचांस और कॉन्फ3रेंस एकजुट Web3 डॉर्टमुंड में सम्मेलन
व्यवसाय Markets सॉफ्टवेयर कहानियाँ और समीक्षाएँ टेक्नोलॉजी
जर्मनी के सबसे बड़े के लिए ब्लॉकचांस और कॉन्फ3रेंस एकजुट Web3 डॉर्टमुंड में सम्मेलन
9 मई 2024
न्यूलिंक बायबिट पर लॉन्च हुआ Web3 आईडीओ प्लेटफार्म. सदस्यता चरण 13 मई तक बढ़ा दिया गया है
Markets समाचार रिपोर्ट टेक्नोलॉजी
न्यूलिंक बायबिट पर लॉन्च हुआ Web3 आईडीओ प्लेटफार्म. सदस्यता चरण 13 मई तक बढ़ा दिया गया है
9 मई 2024
क्रिप्टोमेरिया लैब्स पीटीई। लिमिटेड