समाचार रिपोर्ट टेक्नोलॉजी
10 मई 2023

विशेषज्ञ एआई डेटासेट में 'दुर्भावनापूर्ण निवेश' के प्रति सावधान करते हैं ChatGPT

संक्षेप में

ChatGPT संभावित है कमजोर प्रशिक्षण डेटा के कारण

शोधकर्ताओं के अनुसार, यूएस में केवल $60 के लिए, हम 0.01 में LAION-400 या COYO-700 डेटा सेट का 2022% जहरीला बना सकते हैं।

ChatGPT प्रौद्योगिकी तेजी से लोकप्रिय हो रही है, लेकिन हाल ही में अनुसंधान सुझाव देता है कि यह तकनीक उपयोग किए जाने वाले प्रशिक्षण डेटा के कारण कमजोर हो सकती है। जैसे-जैसे मॉडल अधिक जटिल होते जाते हैं और डेटा सेट बड़े और अधिक जटिल होते जाते हैं, दुर्भावनापूर्ण अभिनेता डेटा सेट में हेरफेर करने के लिए इस भेद्यता का फायदा उठा सकते हैं और मशीन लर्निंग मॉडल को गलत परिणाम देने का कारण बन सकते हैं।

विशेषज्ञ एआई डेटासेट में 'दुर्भावनापूर्ण निवेश' के प्रति सावधान करते हैं ChatGPT
@Midjourney / TataMatalata#9861
अनुशंसित: शीर्ष 10 सबसे आशाजनक स्टॉक की भविष्यवाणी ChatGPT (एआई) 2023 में अग्रणी विश्व फंडों से बेहतर प्रदर्शन करेगा

प्राथमिक चिंता यह है कि चैटबॉट डेटाबेस अक्सर "सशर्त रूप से सत्यापित" डेटा सेट होते हैं, जिसका अर्थ है कि व्यापक सत्यापन के बिना डेटा में एक निश्चित स्तर का विश्वास है। दूसरे शब्दों में, इन डेटासेट में अक्सर अंतर्निहित मुद्दे हो सकते हैं जिन पर विचार नहीं किया गया है। हालाँकि डेटासेट का सत्यापन अक्सर उनके बड़े आकार के कारण नहीं किया जाता है, लेकिन दुर्भावनापूर्ण अभिनेताओं द्वारा इस डेटा में हेरफेर करने की संभावना मौजूद होती है।

वास्तव में, शोधकर्ताओं ने सुझाव दिया है कि 2022 तक, हमलावर LAION-60 या COYO-0.01 डेटा सेट के 400% जहर के लिए अनुमानित $700 खर्च कर सकते हैं। हालांकि यह बहुत ज्यादा नहीं लगता है, अगर अनियंत्रित छोड़ दिया जाए तो दुर्भावनापूर्ण अभिनेता अपने स्वयं के लाभ के लिए इस जहरीले डेटा का उपयोग कर सकते हैं। दुर्भावनापूर्ण डेटा अंततः कर सकते हैं रिसाव बड़े डेटासेट में, डेटा गुणवत्ता को दूषित करना और अविश्वसनीय मशीन-लर्निंग मॉडल के लिए अग्रणी।

दुर्भावनापूर्ण डेटा के विरुद्ध डेटाबेस की सुरक्षा के लिए कदम उठाना आवश्यक है। चैटबॉट के लिए कई डेटा स्रोतों को एकत्र करना मानक होना चाहिए प्रशिक्षण डेटासेट यह सुनिश्चित करने के लिए कि डेटा विश्वसनीय और सटीक है। इसके अतिरिक्त, कंपनियों को यह सुनिश्चित करने के लिए डेटासेट के साथ प्रयोग करना चाहिए कि वे दुर्भावनापूर्ण अभिनेताओं के प्रति संवेदनशील नहीं हैं।

दुर्भावनापूर्ण कोड वाले AI चैटबॉट्स हैकिंग के प्रति संवेदनशील हो सकते हैं

चैटबॉट्स में दुर्भावनापूर्ण कोड का खतरा काफी गंभीर हो सकता है; दुर्भावनापूर्ण कोड का उपयोग उपयोगकर्ता डेटा चोरी करने, सर्वरों तक दुर्भावनापूर्ण पहुंच को सक्षम करने और दुर्भावनापूर्ण गतिविधियों को सक्षम करने के लिए किया जा सकता है काले धन को वैध बनाना या डेटा एक्सफिल्ट्रेशन। यदि एआई चैटबॉट को दुर्भावनापूर्ण आवेषण वाले डेटा पर प्रशिक्षित किया जाता है, तो यह अनजाने में दुर्भावनापूर्ण कोड को अपनी प्रतिक्रियाओं में इंजेक्ट कर सकता है और अनजाने में दुर्भावनापूर्ण लाभ के लिए एक उपकरण के रूप में उपयोग किया जा सकता है।

दुर्भावनापूर्ण अभिनेताओं के लिए जानबूझकर या अनजाने में दुर्भावनापूर्ण कोड पेश करके इस भेद्यता का लाभ उठाना संभव है प्रशिक्षण जानकारी. इसके अलावा, चूंकि एआई चैटबॉट्स प्रस्तुत किए गए डेटा से सीखते हैं, इससे संभावित रूप से उन्हें गलत प्रतिक्रियाएं या यहां तक ​​कि दुर्भावनापूर्ण व्यवहार भी सीखने को मिल सकता है।

@Midjourney / TataMatalata#9861

एक और खतरा जो एआई चैटबॉट्स का सामना कर सकता है वह है "ओवरफिटिंग"। यह तब होता है जब भविष्यवाणी मॉडल को उनके द्वारा दिए गए डेटा पर बहुत बारीकी से प्रशिक्षित किया जाता है, इस प्रकार नए डेटा के साथ प्रस्तुत किए जाने पर खराब भविष्यवाणियां होती हैं। यह एक विशेष समस्या हो सकती है एआई चैटबॉट्स दुर्भावनापूर्ण कोड पर प्रशिक्षित संभावित रूप से दुर्भावनापूर्ण कोड को उनकी प्रतिक्रियाओं में इंजेक्ट करने में अधिक प्रभावी हो सकता है क्योंकि वे डेटा से अधिक परिचित हो जाते हैं।

सिखाने के लिए उपयोग किए जाने वाले प्रशिक्षण डेटा की गारंटी के लिए जोखिमों से अवगत होना और सावधानी बरतना आवश्यक है ChatGPT इन संभावित कमजोरियों को रोकने के लिए सुरक्षित और विश्वसनीय है। प्रशिक्षण के लिए उपयोग किए जाने वाले प्रारंभिक डेटा को भी अलग और अद्वितीय रखा जाना चाहिए; "दुर्भावनापूर्ण आवेषण" का प्रचार अन्य स्रोतों के साथ विरोध या ओवरलैप नहीं होना चाहिए। इसकी जांच की जानी चाहिए और अन्य डोमेन की तुलना में यदि डेटा को मान्य करने के लिए कई पुष्ट डोमेन "कैप्चर" करना संभव है।

चैटबॉट तकनीक यह बदलने का वादा करती है कि लोग मानवीय चर्चा कैसे करते हैं। लेकिन इससे पहले कि यह अपनी पूरी क्षमता का एहसास कर सके, इसमें सुधार और सुरक्षा की जरूरत है। दुर्भावनापूर्ण अभिनेताओं को रोकने के लिए चैटबॉट्स के डेटासेट को अच्छी तरह से जांचने और पढ़ने की आवश्यकता है। ऐसा करके, हम यह सुनिश्चित कर सकते हैं कि हम प्रौद्योगिकी की क्षमता का पूरी तरह से उपयोग करें और इसे आगे बढ़ाते रहें सीमाएं कृत्रिम बुद्धि का.

एआई के बारे में और पढ़ें:

Disclaimer

साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।

के बारे में लेखक

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

और अधिक लेख
दामिर यालालोव
दामिर यालालोव

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

Hot Stories
हमारे समाचार पत्र शामिल हों।
नवीनतम समाचार

समुराई वॉलेट संस्थापकों पर डार्कनेट डील में $2B की सुविधा देने का आरोप लगाया गया

समुराई वॉलेट के संस्थापकों की आशंका उद्योग के लिए एक उल्लेखनीय झटके का प्रतिनिधित्व करती है, जो लगातार जारी रहने को रेखांकित करती है ...

अधिक जानिए

DOGE उन्माद: डॉगकोइन (DOGE) के मूल्य में हालिया वृद्धि का विश्लेषण

क्रिप्टोक्यूरेंसी उद्योग तेजी से विस्तार कर रहा है, और मेम सिक्के एक महत्वपूर्ण उछाल की तैयारी कर रहे हैं। डॉगकॉइन (DOGE), ...

अधिक जानिए
हमारे इनोवेटिव टेक समुदाय से जुड़ें
विस्तार में पढ़ें
अधिक पढ़ें
मेटावर्स फैशन वीक 2024: वर्चुअल फैशन में विकेंद्रीकृत शासन और निवेश के अवसर
कला लाइफस्टाइल कहानियाँ और समीक्षाएँ टेक्नोलॉजी
मेटावर्स फैशन वीक 2024: वर्चुअल फैशन में विकेंद्रीकृत शासन और निवेश के अवसर
अप्रैल १, २०२४
संकल्पना से वास्तविकता तक: कैसे रोबॉक्स का अवतार ऑटो सेटअप और टेक्सचर जेनरेटर रचनात्मकता और नवीनता को तेज करता है
सॉफ्टवेयर कहानियाँ और समीक्षाएँ टेक्नोलॉजी
संकल्पना से वास्तविकता तक: कैसे रोबॉक्स का अवतार ऑटो सेटअप और टेक्सचर जेनरेटर रचनात्मकता और नवीनता को तेज करता है
अप्रैल १, २०२४
जैक डोर्सी के ब्लॉक ने उन्नत तीन-नैनोमीटर चिप के साथ अभूतपूर्व बिटकॉइन माइनिंग सिस्टम का अनावरण किया
सॉफ्टवेयर कहानियाँ और समीक्षाएँ टेक्नोलॉजी
जैक डोर्सी के ब्लॉक ने उन्नत तीन-नैनोमीटर चिप के साथ अभूतपूर्व बिटकॉइन माइनिंग सिस्टम का अनावरण किया
अप्रैल १, २०२४
फ्रेंड.टेक ने फ्रेंड टोकन लागू करने के लिए V2 रिलीज़ को 3 मई तक के लिए स्थगित कर दिया Airdrop 'कुंजी' धारकों के लिए साझा करना
Markets समाचार रिपोर्ट टेक्नोलॉजी
फ्रेंड.टेक ने फ्रेंड टोकन लागू करने के लिए V2 रिलीज़ को 3 मई तक के लिए स्थगित कर दिया Airdrop 'कुंजी' धारकों के लिए साझा करना
अप्रैल १, २०२४
क्रिप्टोमेरिया लैब्स पीटीई। लिमिटेड