समाचार रिपोर्ट टेक्नोलॉजी
21 जून 2023

एआई-जेनरेट किए गए टेक्स्ट का पता लगाने के लिए शोधकर्ताओं ने एक नया तरीका खोजा

संक्षेप में

शोधकर्ताओं ने रोबर्टा मॉडल का उपयोग करके एआई-जनित पाठ का पता लगाने के लिए एक विधि विकसित की है, जो पाठ टोकन के एम्बेडिंग को निकालता है और उन्हें एक बहुआयामी स्थान में बिंदुओं के रूप में देखता है।

उन्होंने उस पाठ की खोज की जिसके द्वारा उत्पन्न किया गया था GPT-3.5 मॉडल, जैसे ChatGPT और डेविंसी का औसत आयाम मानव-लिखित पाठ की तुलना में काफी कम था।

शोधकर्ताओं ने एक मजबूत आयाम-आधारित डिटेक्टर बनाया जो सामान्य चोरी तकनीकों के लिए प्रतिरोधी था।

डोमेन और मॉडल बदलने पर डिटेक्टर की सटीकता लगातार उच्च बनी रही, एक निश्चित सीमा के साथ और DIPPER तकनीक से चुनौती देने पर 40% सटीकता कम हो गई।

शोधकर्ताओं ने एआई-जनित टेक्स्ट और के क्षेत्र की जांच की है एआई द्वारा उत्पन्न सामग्री का पता लगाने के लिए एक विधि विकसित की जैसे मॉडल GPT और Llama. उन्होंने भिन्नात्मक आयाम की अवधारणा का उपयोग करके उत्पन्न पाठ की प्रकृति के बारे में दिलचस्प अंतर्दृष्टि खोजी। उनके निष्कर्ष मनुष्यों द्वारा लिखे गए पाठ और एआई मॉडल द्वारा उत्पन्न पाठ के बीच निहित अंतरों पर प्रकाश डालते हैं।

एआई-जेनरेट किए गए टेक्स्ट का पता लगाने के लिए शोधकर्ताओं ने एक नया तरीका खोजा
क्रेडिट: Metaverse Post (mpost.io)
पढ़ें: एआई डिटेक्टरों द्वारा पता लगाने योग्य शीर्ष 100+ शब्द

क्या प्राकृतिक भाषा के पाठ से प्राप्त बिंदु बादल का आयाम इसकी उत्पत्ति के बारे में उपयोगी जानकारी प्रदान कर सकता है? शोधकर्ताओं ने टेक्स्ट टोकन के एम्बेडिंग को निकालने के लिए रोबर्टा मॉडल का उपयोग किया और इसकी जांच करने के लिए उन्हें एक बहुआयामी स्थान में बिंदुओं के रूप में देखा। उन्होंने पिछले कार्यों से प्रेरित परिष्कृत तकनीकों का उपयोग करके इन बिंदु बादलों के भिन्नात्मक आयाम का अनुमान लगाया।

शोधकर्ता उस पाठ को खोजकर आश्चर्यचकित रह गए जिसके द्वारा उत्पन्न किया गया था GPT-3.5 मॉडल, जैसे ChatGPT और डेविंसी का औसत आयाम मानव-लिखित पाठ की तुलना में काफी कम था। यह दिलचस्प पैटर्न सभी डोमेन में और वैकल्पिक मॉडल जैसे तब भी बना रहा GPT-2 या OPT का उपयोग किया गया। विशेष रूप से, DIPPER पैराफ़्रेज़ का उपयोग करते समय भी, जिसे विशेष रूप से पता लगाने से बचने के लिए डिज़ाइन किया गया है, आयाम केवल लगभग 3% बदल गया। इन खोजों ने शोधकर्ताओं को एक मजबूत आयाम-आधारित डिटेक्टर बनाने में सक्षम बनाया जो सामान्य चोरी तकनीकों के प्रति प्रतिरोधी है।

विशेष रूप से, जब डोमेन और मॉडल बदले गए तो डिटेक्टर की सटीकता लगातार उच्च बनी रही। एक निश्चित सीमा के साथ, पता लगाने की सटीकता (सच्ची सकारात्मक दर) 75% से ऊपर रही जबकि झूठी सकारात्मक दर (FPR) 1% से कम रही। यहां तक ​​कि जब पता लगाने वाली प्रणाली को DIPPER तकनीक से चुनौती दी गई थी, तब भी सटीकता 40% तक गिर गई थी, जो मौजूदा डिटेक्टरों से बेहतर प्रदर्शन कर रही थी। OpenAI.

इसके अलावा, शोधकर्ताओं ने बहुभाषी RoBERTa जैसे बहुभाषी मॉडल के अनुप्रयोग की खोज की। इसने उन्हें अंग्रेजी के अलावा अन्य भाषाओं के लिए समान डिटेक्टर विकसित करने की अनुमति दी। जबकि एम्बेडिंग का औसत आंतरिक आयाम विभिन्न भाषाओं में भिन्न होता है, उत्पन्न पाठ का आयाम प्रत्येक विशिष्ट भाषा के लिए मानव-लिखित पाठ की तुलना में लगातार कम रहता है।

हालांकि, डिटेक्टर ने कुछ कमजोरियों का प्रदर्शन किया, खासकर उच्च पीढ़ी के तापमान और आदिम तापमान का सामना करते समय जनरेटर मॉडल. उच्च तापमान पर, उत्पन्न ग्रंथों का आंतरिक आयाम मानव-लिखित पाठ से अधिक हो सकता है, जिससे डिटेक्टर अप्रभावी हो जाता है। सौभाग्य से, वैकल्पिक तरीकों का उपयोग करके ऐसे जनरेटर मॉडल पहले से ही पहचाने जा सकते हैं। इसके अतिरिक्त, शोधकर्ताओं ने स्वीकार किया कि रोबर्टा से परे टेक्स्ट एम्बेडिंग निकालने के लिए वैकल्पिक मॉडल तलाशने की गुंजाइश है।

मानव और एआई-लिखित पाठ के बीच अंतर करना

जनवरी में, OpenAI की घोषणा मनुष्यों द्वारा लिखे गए पाठ और एआई सिस्टम द्वारा उत्पन्न पाठ के बीच अंतर करने के लिए डिज़ाइन किए गए एक नए क्लासिफायरियर का शुभारंभ। इस क्लासिफायर का उद्देश्य एआई-जनित सामग्री के बढ़ते प्रसार, जैसे कि गलत सूचना अभियान और अकादमिक बेईमानी से उत्पन्न चुनौतियों का समाधान करना है।

जबकि सभी एआई-लिखित पाठ का पता लगाना एक जटिल कार्य है, यह क्लासिफायरियर झूठे दावों को कम करने के लिए एक मूल्यवान उपकरण के रूप में कार्य करता है एआई-जनित पाठ में मानव लेखकत्व. अंग्रेजी पाठों के एक सेट पर कठोर मूल्यांकन के माध्यम से, डेवलपर्स ने पाया है कि वह क्लासिफायर 26% एआई-लिखित पाठ को "संभावित एआई-लिखित" (सच्ची सकारात्मक) के रूप में सटीक रूप से पहचानता है, जबकि कभी-कभी मानव-लिखित पाठ को एआई-जनरेटेड (झूठा) के रूप में गलत लेबल करता है। सकारात्मक) 9% तक। यह ध्यान रखना महत्वपूर्ण है कि जैसे-जैसे इनपुट टेक्स्ट की लंबाई बढ़ती है, क्लासिफायरियर की विश्वसनीयता में सुधार होता है। पिछले क्लासिफायर की तुलना में, यह नया संस्करण हाल के एआई सिस्टम द्वारा उत्पन्न पाठ पर काफी अधिक विश्वसनीयता प्रदर्शित करता है।

डेवलपर्स ने इस क्लासिफायर जैसे अपूर्ण उपकरणों की उपयोगिता पर मूल्यवान प्रतिक्रिया एकत्र करने के लिए इसे बनाया है सार्वजनिक रूप से उपलब्ध. आप हमारे वर्क-इन-प्रोग्रेस क्लासिफायर को मुफ्त में आजमा सकते हैं। हालाँकि, इसकी सीमाओं को समझना आवश्यक है। पाठ के स्रोत का निर्धारण करने के लिए प्राथमिक निर्णय लेने वाले संसाधन के बजाय क्लासिफायर का उपयोग पूरक उपकरण के रूप में किया जाना चाहिए। यह छोटे पाठों पर उच्च अविश्वसनीयता प्रदर्शित करता है, और ऐसे उदाहरण हैं जहां मानव-लिखित पाठ को एआई-जनित के रूप में गलत तरीके से लेबल किया जा सकता है।

यह ध्यान देने योग्य है कि अत्यधिक पूर्वानुमानित पाठों को लगातार पहचाना नहीं जा सकता है, जैसे कि पहले 1,000 अभाज्य संख्याओं की सूची। एआई-जनरेटेड टेक्स्ट को संपादित करने से क्लासिफायर से बचने में भी मदद मिल सकती है, और जब हम सफल हमलों के आधार पर क्लासिफायर को अपडेट और पुनः प्रशिक्षित कर सकते हैं, तो पता लगाने का दीर्घकालिक लाभ अनिश्चित रहता है। इसके अलावा, क्लासिफायर पर आधारित है तंत्रिका जाल अक्सर उनके प्रशिक्षण डेटा के बाहर खराब तरीके से कैलिब्रेट किया जाता है, जिससे प्रशिक्षण सेट से काफी भिन्न इनपुट के लिए गलत भविष्यवाणियों पर अत्यधिक विश्वास हो जाता है।

Disclaimer

साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।

के बारे में लेखक

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

और अधिक लेख
दामिर यालालोव
दामिर यालालोव

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना ​​है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है। 

Hot Stories
हमारे समाचार पत्र शामिल हों।
नवीनतम समाचार

अस्थिरता के बीच बिटकॉइन ईटीएफ के प्रति संस्थागत रुचि बढ़ी

13एफ फाइलिंग के माध्यम से प्रकटीकरण से पता चलता है कि उल्लेखनीय संस्थागत निवेशक बिटकॉइन ईटीएफ में रुचि ले रहे हैं, जो इसकी बढ़ती स्वीकार्यता को रेखांकित करता है...

अधिक जानिए

सजा का दिन आ गया: सीजेड का भाग्य अधर में लटक गया क्योंकि अमेरिकी अदालत ने डीओजे की याचिका पर विचार किया

चांगपेंग झाओ आज सिएटल की एक अमेरिकी अदालत में सजा का सामना करने के लिए तैयार हैं।

अधिक जानिए
हमारे इनोवेटिव टेक समुदाय से जुड़ें
विस्तार में पढ़ें
अधिक पढ़ें
ऑर्बिटर फाइनेंस ने बिटकॉइन लेयर 2 ज़ुलु नेटवर्क के साथ साझेदारी की है और इज़ लवाज़ी टेस्टनेट पर तैनाती की है
व्यवसाय समाचार रिपोर्ट टेक्नोलॉजी
ऑर्बिटर फाइनेंस ने बिटकॉइन लेयर 2 ज़ुलु नेटवर्क के साथ साझेदारी की है और इज़ लवाज़ी टेस्टनेट पर तैनाती की है 
7 मई 2024
क्रिप्टो एक्सचेंज बायबिट एथेना लैब्स के यूएसडीई को संपार्श्विक संपत्ति के रूप में एकीकृत करता है, बीटीसी-यूएसडीई और ईटीएच-यूएसडीई ट्रेडिंग जोड़े को सक्षम बनाता है
Markets समाचार रिपोर्ट टेक्नोलॉजी
क्रिप्टो एक्सचेंज बायबिट एथेना लैब्स के यूएसडीई को संपार्श्विक संपत्ति के रूप में एकीकृत करता है, बीटीसी-यूएसडीई और ईटीएच-यूएसडीई ट्रेडिंग जोड़े को सक्षम बनाता है
7 मई 2024
बिटगेट वॉलेट ने गेटड्रॉप पेश किया Airdrop प्लेटफ़ॉर्म और $130,000 पुरस्कार पूल के साथ पहला मेम कॉइन इवेंट लॉन्च किया
Markets समाचार रिपोर्ट टेक्नोलॉजी
बिटगेट वॉलेट ने गेटड्रॉप पेश किया Airdrop प्लेटफ़ॉर्म और $130,000 पुरस्कार पूल के साथ पहला मेम कॉइन इवेंट लॉन्च किया
7 मई 2024
सिंपल रिफ्लेक्स से लेकर लर्निंग एजेंट्स तक: विभिन्न प्रकार के एआई एजेंटों और आधुनिक ऐप्स में उनकी भूमिकाएं देखें
लाइफस्टाइल सॉफ्टवेयर कहानियाँ और समीक्षाएँ टेक्नोलॉजी
सिंपल रिफ्लेक्स से लेकर लर्निंग एजेंट्स तक: विभिन्न प्रकार के एआई एजेंटों और आधुनिक ऐप्स में उनकी भूमिकाएं देखें
7 मई 2024
क्रिप्टोमेरिया लैब्स पीटीई। लिमिटेड