19 मई 2023

टेक्सास के शोधकर्ताओं ने ब्रेन एमआरआई सिग्नल और एआई के आधार पर पाठ के पुनर्निर्माण के लिए नई विधि का प्रस्ताव दिया

प्रकाशित: 19 मई, 2023 प्रातः 7:30 बजे अद्यतन: 19 मई, 2023 प्रातः 7:26 बजे

संपादित और तथ्य-जांचा गया: 19 मई, 2023 सुबह 7:30 बजे

संक्षेप में

टेक्सास विश्वविद्यालय ने एमआरआई मस्तिष्क संकेत के आधार पर एक व्यक्ति द्वारा सुने जाने वाले पाठ के पुनर्निर्माण के लिए एक नई विधि प्रस्तावित की है।

विधि में पाठ के अनुरूप मस्तिष्क की एमआरआई छवि को पुनर्स्थापित करने के लिए एक एनकोडर नेटवर्क को प्रशिक्षित करना और पाठ को जारी रखने के लिए विकल्प उत्पन्न करने के लिए पूर्व-प्रशिक्षित भाषा मॉडल का उपयोग करना शामिल है।

सांख्यिकीय उत्पन्न ग्रंथ यादृच्छिक लोगों की तुलना में मूल के करीब हैं और मस्तिष्क के विभिन्न भागों के कार्यों का पता लगाने के लिए इसका उपयोग किया जा सकता है।

टेक्सास विश्वविद्यालय के शोधकर्ताओं ने एमआरआई ब्रेन सिग्नल से पाठ को फिर से बनाने के लिए एक नई विधि प्रस्तावित की है। इसके अलावा, डिकोडिंग एक सुसंगत पाठ में होता है जो वास्तविक रूप से शब्दार्थ के समान होता है।

टेक्सास के शोधकर्ताओं ने ब्रेन एमआरआई सिग्नल और एआई के आधार पर पाठ के पुनर्निर्माण के लिए नई विधि का प्रस्ताव दिया — @Midjourney

किसी व्यक्ति द्वारा सुने जाने वाले पाठ को डिकोड करने का प्रयास किया गया है (या उनके सिर में कहा गया है)। मस्तिष्क से सिग्नल कैसे निकाला जाता है, इस पर निर्भर करते हुए दो अलग-अलग दृष्टिकोण हैं। आक्रमण-शैली संकेत निष्कर्षण पहला है: एक चिप जो आवेगों को सीधे मस्तिष्क से पढ़ता है एक व्यक्ति के कपाल में न्यूरॉन्स रखे जाते हैं। विधि आक्रामक, चुस्त और जटिल है। एमआरआई और एम/ईईजी सहित गैर-इनवेसिव सिग्नल निष्कर्षण तकनीक दूसरा विकल्प है; उन्हें किसी ड्रिलिंग की आवश्यकता नहीं होती है और वे कम खर्चीले होते हैं।

हालांकि, मस्तिष्क के संकेतों को इकट्ठा करने के लिए गैर-इनवेसिव तकनीकों में एक गंभीर दोष है: किसी उत्तेजना (जैसे एक शब्द सुनना) के संपर्क में आने के बाद लगभग 10 सेकंड के लिए उस उत्तेजना से एक व्यक्ति की एमआरआई रीडिंग प्रभावित होती है। एक अंग्रेजी मूल निवासी औसतन दो शब्द प्रति सेकंड बोल सकता है। यह पता चला है कि यदि आप अंग्रेजी बोलने वालों को सुनते समय एमआरआई सिग्नल रिकॉर्ड करते हैं तो प्रत्येक एमआरआई छवि में लगभग बीस शब्दों के मस्तिष्क प्रसंस्करण के बारे में डेटा होता है।

नतीजतन, एमआरआई का उपयोग करके, उस पाठ को ईमानदारी से पुन: बनाना असंभव है जो एक व्यक्ति सुनता है। इसके अतिरिक्त, गैर-इनवेसिव तकनीकों का उपयोग करके एकत्र किए गए मस्तिष्क संकेतों से टेक्स्ट रिकवरी के विषय पर पहले के बहुत से अध्ययन केवल विशिष्ट शब्दों और वाक्यांशों को पुनः प्राप्त करने में सफल रहे।

और टेक्सास के शोधकर्ताओं ने (लगभग) समझदार पाठ के पुनर्निर्माण के लिए एक एमआरआई तकनीक विकसित की। इस पाठ और उस व्यक्ति ने वास्तव में जो सुना उसके बीच कुछ भिन्नता होगी। हालांकि, यह शब्दार्थ के समतुल्य होगा, जिसका अर्थ है कि यह उस व्याख्या का प्रतिनिधित्व करेगा जिसे आमतौर पर स्वीकार किया जाता है।

पाठ के इस अंश से जुड़े मस्तिष्क के एमआरआई को पुनर्प्राप्त करने के लिए, शोधकर्ता एनकोडर नेटवर्क को प्रशिक्षित करते हैं, जो पाठ के एक टुकड़े से सीखता है। फिर, पूर्व-प्रशिक्षित भाषा मॉडल का उपयोग करना (जैसे GPT), शोधकर्ता निम्नलिखित कदम उठाते हैं:

शोधकर्ता पूछते हैं GPT पाठ को हर दो सेकंड में आगे बढ़ाने के लिए कई संभावनाएं बनाने के लिए। एन्कोडर नेटवर्क इन कई विकल्पों को प्राप्त करता है और वर्तमान एमआरआई छवि को पुनर्प्राप्त करने के लिए उनका उपयोग करने का प्रयास करता है। हमें लगता है कि वास्तविक एमआरआई सिग्नल के सबसे सटीक प्रतिनिधित्व के लिए अनुमति देने वाला पाठ संस्करण सटीक है।

यहाँ एक उदाहरण है:

मूल इनपुट

जनरेशन आउटपुट

मुझे नहीं पता था कि चिल्लाऊं, रोऊं या भाग जाऊं। इसके बजाय, मैंने कहा, “मुझे अकेला छोड़ दो; मुझे आपकी मदद की जरूरत नहीं है। एडम गायब हो गया, और मैं रोते हुए अकेले ही सफाई कर रहा था।

मैं चीखने और रोने लगा, और फिर उसने बस इतना कहा, मैंने तुमसे कहा था कि मुझे अकेला छोड़ दो; तुम मुझे अब और चोट नहीं पहुँचा सकते। आई एम सॉरी,’’ और फिर वह वहां से चला गया। हालाँकि मुझे लगा कि वह चला गया है, मैं रोने लगी।

यदि आप अन्य लोगों की रिकॉर्डिंग सुनने के बजाय भाषण बनाने के लिए इसका उपयोग करते हैं तो इस तकनीक के कई उपयोग होंगे। यहां तक कि काल्पनिक भाषण का पुनर्निर्माण भी लेख के लेखकों द्वारा एक प्रयोग का विषय था। एक बार फिर, अंतिम पाठ यादृच्छिक पाठों की तुलना में मूल पाठों के अधिक समान साबित हुए। दृष्टिकोण काम करने लगता है।

और ऐसे मॉडलों की सहायता से, आप विभिन्न मस्तिष्क क्षेत्रों के संचालन की जांच कर सकते हैं। इस अध्ययन में, एमआरआई संकेत उत्पन्न करने के लिए मस्तिष्क के तीन अलग-अलग क्षेत्रों का उपयोग किया गया था जो श्रव्य भाषण को संभालते थे। मॉडल के इनपुट से मस्तिष्क के विभिन्न हिस्सों से संकेतों को जोड़कर और हटाकर कोई सीख सकता है कि जानकारी का कौन सा हिस्सा मस्तिष्क के किस क्षेत्र द्वारा संसाधित किया जाता है। इसके अतिरिक्त, आप अन्य घटकों से संकेतों का उपयोग करके बनाए गए एन्कोडर मॉडल के पुनर्निर्माण की तुलना कर सकते हैं।

एआई के बारे में और पढ़ें:

टैग:

Disclaimer

साथ लाइन में ट्रस्ट परियोजना दिशानिर्देश, कृपया ध्यान दें कि इस पृष्ठ पर दी गई जानकारी का कानूनी, कर, निवेश, वित्तीय या किसी अन्य प्रकार की सलाह के रूप में व्याख्या करने का इरादा नहीं है और न ही इसकी व्याख्या की जानी चाहिए। यह महत्वपूर्ण है कि केवल उतना ही निवेश करें जितना आप खो सकते हैं और यदि आपको कोई संदेह हो तो स्वतंत्र वित्तीय सलाह लें। अधिक जानकारी के लिए, हम नियम और शर्तों के साथ-साथ जारीकर्ता या विज्ञापनदाता द्वारा प्रदान किए गए सहायता और समर्थन पृष्ठों का संदर्भ लेने का सुझाव देते हैं। MetaversePost सटीक, निष्पक्ष रिपोर्टिंग के लिए प्रतिबद्ध है, लेकिन बाज़ार की स्थितियाँ बिना सूचना के परिवर्तन के अधीन हैं।

के बारे में लेखक

दामिर टीम लीडर, उत्पाद प्रबंधक और संपादक हैं Metaverse Postएआई/एमएल, एजीआई, एलएलएम, मेटावर्स और जैसे विषयों को कवर करता है Web3-संबंधित क्षेत्रों। उनके लेख हर महीने दस लाख से अधिक उपयोगकर्ताओं को आकर्षित करते हैं। ऐसा प्रतीत होता है कि वह SEO और डिजिटल मार्केटिंग में 10 वर्षों के अनुभव वाला एक विशेषज्ञ है। दामिर का उल्लेख मैशबल, वायर्ड, में किया गया है Cointelegraph, द न्यू यॉर्कर, Inside.com, एंटरप्रेन्योर, BeInCrypto, और अन्य प्रकाशन। वह एक डिजिटल खानाबदोश के रूप में संयुक्त अरब अमीरात, तुर्की, रूस और सीआईएस के बीच यात्रा करता है। दामिर ने भौतिकी में स्नातक की डिग्री हासिल की, उनका मानना है कि इससे उन्हें इंटरनेट के लगातार बदलते परिदृश्य में सफल होने के लिए आवश्यक महत्वपूर्ण सोच कौशल प्राप्त हुआ है।

और अधिक लेख

दामिर यालालोव