10 मई 2023

विशेषज्ञ एआई डेटासेट में 'दुर्भावनापूर्ण निवेश' के प्रति सावधान करते हैं ChatGPT

by दामिर यालालोव

प्रकाशित: 10 मई, 2023 प्रातः 5:09 बजे अद्यतन: 10 मई, 2023 प्रातः 5:09 बजे

by करोलिना गास्ज़्ज़

संपादित और तथ्य-जांचा गया: 10 मई, 2023 सुबह 5:09 बजे

संक्षेप में

ChatGPT संभावित है कमजोर प्रशिक्षण डेटा के कारण

शोधकर्ताओं के अनुसार, यूएस में केवल $60 के लिए, हम 0.01 में LAION-400 या COYO-700 डेटा सेट का 2022% जहरीला बना सकते हैं।

ChatGPT प्रौद्योगिकी तेजी से लोकप्रिय हो रही है, लेकिन हाल ही में अनुसंधान सुझाव देता है कि यह तकनीक उपयोग किए जाने वाले प्रशिक्षण डेटा के कारण कमजोर हो सकती है। जैसे-जैसे मॉडल अधिक जटिल होते जाते हैं और डेटा सेट बड़े और अधिक जटिल होते जाते हैं, दुर्भावनापूर्ण अभिनेता डेटा सेट में हेरफेर करने के लिए इस भेद्यता का फायदा उठा सकते हैं और मशीन लर्निंग मॉडल को गलत परिणाम देने का कारण बन सकते हैं।

विशेषज्ञ एआई डेटासेट में 'दुर्भावनापूर्ण निवेश' के प्रति सावधान करते हैं ChatGPT — @Midjourney / TataMatalata#9861

अनुशंसित: शीर्ष 10 सबसे आशाजनक स्टॉक की भविष्यवाणी ChatGPT (एआई) 2023 में अग्रणी विश्व फंडों से बेहतर प्रदर्शन करेगा

प्राथमिक चिंता यह है कि चैटबॉट डेटाबेस अक्सर "सशर्त रूप से सत्यापित" डेटा सेट होते हैं, जिसका अर्थ है कि व्यापक सत्यापन के बिना डेटा में एक निश्चित स्तर का विश्वास है। दूसरे शब्दों में, इन डेटासेट में अक्सर अंतर्निहित मुद्दे हो सकते हैं जिन पर विचार नहीं किया गया है। हालाँकि डेटासेट का सत्यापन अक्सर उनके बड़े आकार के कारण नहीं किया जाता है, लेकिन दुर्भावनापूर्ण अभिनेताओं द्वारा इस डेटा में हेरफेर करने की संभावना मौजूद होती है।

वास्तव में, शोधकर्ताओं ने सुझाव दिया है कि 2022 तक, हमलावर LAION-60 या COYO-0.01 डेटा सेट के 400% जहर के लिए अनुमानित $700 खर्च कर सकते हैं। हालांकि यह बहुत ज्यादा नहीं लगता है, अगर अनियंत्रित छोड़ दिया जाए तो दुर्भावनापूर्ण अभिनेता अपने स्वयं के लाभ के लिए इस जहरीले डेटा का उपयोग कर सकते हैं। दुर्भावनापूर्ण डेटा अंततः कर सकते हैं रिसाव बड़े डेटासेट में, डेटा गुणवत्ता को दूषित करना और अविश्वसनीय मशीन-लर्निंग मॉडल के लिए अग्रणी।

दुर्भावनापूर्ण डेटा के विरुद्ध डेटाबेस की सुरक्षा के लिए कदम उठाना आवश्यक है। चैटबॉट के लिए कई डेटा स्रोतों को एकत्र करना मानक होना चाहिए प्रशिक्षण डेटासेट यह सुनिश्चित करने के लिए कि डेटा विश्वसनीय और सटीक है। इसके अतिरिक्त, कंपनियों को यह सुनिश्चित करने के लिए डेटासेट के साथ प्रयोग करना चाहिए कि वे दुर्भावनापूर्ण अभिनेताओं के प्रति संवेदनशील नहीं हैं।

दुर्भावनापूर्ण कोड वाले AI चैटबॉट्स हैकिंग के प्रति संवेदनशील हो सकते हैं

चैटबॉट्स में दुर्भावनापूर्ण कोड का खतरा काफी गंभीर हो सकता है; दुर्भावनापूर्ण कोड का उपयोग उपयोगकर्ता डेटा चोरी करने, सर्वरों तक दुर्भावनापूर्ण पहुंच को सक्षम करने और दुर्भावनापूर्ण गतिविधियों को सक्षम करने के लिए किया जा सकता है काले धन को वैध बनाना या डेटा एक्सफिल्ट्रेशन। यदि एआई चैटबॉट को दुर्भावनापूर्ण आवेषण वाले डेटा पर प्रशिक्षित किया जाता है, तो यह अनजाने में दुर्भावनापूर्ण कोड को अपनी प्रतिक्रियाओं में इंजेक्ट कर सकता है और अनजाने में दुर्भावनापूर्ण लाभ के लिए एक उपकरण के रूप में उपयोग किया जा सकता है।

दुर्भावनापूर्ण अभिनेताओं के लिए जानबूझकर या अनजाने में दुर्भावनापूर्ण कोड पेश करके इस भेद्यता का लाभ उठाना संभव है प्रशिक्षण जानकारी. इसके अलावा, चूंकि एआई चैटबॉट्स प्रस्तुत किए गए डेटा से सीखते हैं, इससे संभावित रूप से उन्हें गलत प्रतिक्रियाएं या यहां तक कि दुर्भावनापूर्ण व्यवहार भी सीखने को मिल सकता है।

एक और खतरा जो एआई चैटबॉट्स का सामना कर सकता है वह है "ओवरफिटिंग"। यह तब होता है जब भविष्यवाणी मॉडल को उनके द्वारा दिए गए डेटा पर बहुत बारीकी से प्रशिक्षित किया जाता है, इस प्रकार नए डेटा के साथ प्रस्तुत किए जाने पर खराब भविष्यवाणियां होती हैं। यह एक विशेष समस्या हो सकती है एआई चैटबॉट्स दुर्भावनापूर्ण कोड पर प्रशिक्षित संभावित रूप से दुर्भावनापूर्ण कोड को उनकी प्रतिक्रियाओं में इंजेक्ट करने में अधिक प्रभावी हो सकता है क्योंकि वे डेटा से अधिक परिचित हो जाते हैं।

सिखाने के लिए उपयोग किए जाने वाले प्रशिक्षण डेटा की गारंटी के लिए जोखिमों से अवगत होना और सावधानी बरतना आवश्यक है ChatGPT इन संभावित कमजोरियों को रोकने के लिए सुरक्षित और विश्वसनीय है। प्रशिक्षण के लिए उपयोग किए जाने वाले प्रारंभिक डेटा को भी अलग और अद्वितीय रखा जाना चाहिए; "दुर्भावनापूर्ण आवेषण" का प्रचार अन्य स्रोतों के साथ विरोध या ओवरलैप नहीं होना चाहिए। इसकी जांच की जानी चाहिए और अन्य डोमेन की तुलना में यदि डेटा को मान्य करने के लिए कई पुष्ट डोमेन "कैप्चर" करना संभव है।

चैटबॉट तकनीक यह बदलने का वादा करती है कि लोग मानवीय चर्चा कैसे करते हैं। लेकिन इससे पहले कि यह अपनी पूरी क्षमता का एहसास कर सके, इसमें सुधार और सुरक्षा की जरूरत है। दुर्भावनापूर्ण अभिनेताओं को रोकने के लिए चैटबॉट्स के डेटासेट को अच्छी तरह से जांचने और पढ़ने की आवश्यकता है। ऐसा करके, हम यह सुनिश्चित कर सकते हैं कि हम प्रौद्योगिकी की क्षमता का पूरी तरह से उपयोग करें और इसे आगे बढ़ाते रहें सीमाएं कृत्रिम बुद्धि का.

एआई के बारे में और पढ़ें:

टैग:

Disclaimer

साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।

के बारे में लेखक

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है।

और अधिक लेख

दामिर यालालोव