يقترح باحثو تكساس طريقة جديدة لإعادة بناء النص بناءً على إشارات التصوير بالرنين المغناطيسي للدماغ والذكاء الاصطناعي
في سطور
اقترحت جامعة تكساس طريقة جديدة لإعادة بناء النص الذي يسمعه الشخص بناءً على إشارة الدماغ بالرنين المغناطيسي.
تتضمن الطريقة تدريب شبكة تشفير لاستعادة صورة التصوير بالرنين المغناطيسي للدماغ المطابقة للنص ، واستخدام نماذج لغوية مدربة مسبقًا لإنشاء خيارات لاستمرار النص.
احصائيا ولدت النصوص هي أقرب إلى الأصل من الأجزاء العشوائية ويمكن استخدامها لاستكشاف وظائف أجزاء مختلفة من الدماغ.
اقترح باحثون من جامعة تكساس طريقة جديدة لإعادة إنشاء نص من إشارة التصوير بالرنين المغناطيسي للدماغ. علاوة على ذلك ، يحدث فك التشفير في نص متماسك مشابه لغويًا للنص الحقيقي.
لقد تمت محاولة ذلك من قبل لفك تشفير النص الذي يسمعه الشخص (أو يقوله في رأسه). اعتمادًا على كيفية إخراج الإشارة من الدماغ ، هناك طريقتان مختلفتان. استخراج إشارة بأسلوب الغزو هو أول واحد: شريحة يقرأ النبضات مباشرة من الدماغ يتم وضع الخلايا العصبية في قحف الشخص. هذه الطريقة جائرة ، ثمينة ، ومعقدة. تقنيات استخراج الإشارات غير الغازية ، بما في ذلك التصوير بالرنين المغناطيسي و M / EEG ، هي الخيار الثاني ؛ لا تتطلب أي حفر وهي أقل تكلفة.
ومع ذلك ، فإن التقنيات غير الغازية لجمع إشارات الدماغ بها عيب خطير واحد: قراءات التصوير بالرنين المغناطيسي للشخص تتأثر بهذا المنبه لمدة 10 ثوانٍ تقريبًا بعد التعرض لمحفز (مثل سماع كلمة). يمكن للغة الإنجليزية أن تقول كلمتين في الثانية في المتوسط. اتضح أن كل صورة بالرنين المغناطيسي تحتوي على بيانات حول معالجة الدماغ لما يقرب من عشرين كلمة إذا قمت بتسجيل إشارة التصوير بالرنين المغناطيسي أثناء الاستماع إلى المتحدثين باللغة الإنجليزية.
نتيجة لذلك ، باستخدام التصوير بالرنين المغناطيسي ، من المستحيل إعادة إنشاء النص الذي يسمعه الشخص بأمانة. بالإضافة إلى ذلك ، نجحت الكثير من الدراسات السابقة حول موضوع استعادة النص من إشارات الدماغ التي تم جمعها باستخدام تقنيات غير جراحية في استرجاع كلمات وعبارات محددة فقط.
وقد طور باحثو تكساس تقنية التصوير بالرنين المغناطيسي لإعادة بناء نص واضح (تقريبًا). سيكون هناك بعض الاختلاف بين هذا النص وما سمعه الشخص بالفعل. ومع ذلك ، سيكون مكافئًا لغويًا ، مما يعني أنه سيمثل التفسير الذي يتم قبوله عادةً.
لاستعادة التصوير بالرنين المغناطيسي للدماغ المرتبط بهذا المقطع من النص، يقوم الباحثون بتدريب شبكة التشفير، التي تتعلم من جزء من النص. ثم، باستخدام نموذج لغة مدرب مسبقًا (مثل GPT) يقوم الباحثون بالخطوات التالية:
- يسأل الباحثون GPT لإنشاء إمكانيات عديدة لتقديم النص كل ثانيتين. تتلقى شبكة التشفير هذه الخيارات العديدة وتحاول استخدامها لاستعادة صورة التصوير بالرنين المغناطيسي الحالية. نعتقد أن النسخة النصية التي سمحت بالتمثيل الأكثر دقة لإشارة التصوير بالرنين المغناطيسي الأصلية هي النسخة الدقيقة.
هنا مثال:
المدخلات الأصلية | إخراج الجيل |
لم أكن أعرف هل أصرخ أم أبكي أم أهرب. وبدلاً من ذلك ، قلت: "اتركوني وشأني ؛ لا أحتاج إلى مساعدتك ". اختفى آدم وتنظيفت نفسي وحدي أبكي. | بدأت في الصراخ والبكاء ، ثم قالت للتو ، قلت لك أن تتركني وشأني ؛ لا يمكنك أن تؤذيني بعد الآن. أنا آسف "، ثم غادر. على الرغم من أنني اعتقدت أنه غادر ، بدأت في البكاء. |
سيكون لهذه التقنية العديد من الاستخدامات إذا كنت تستخدمها لتكوين الكلام بدلاً من الاستماع إلى تسجيلات الآخرين. حتى إعادة بناء الخطاب الوهمي كانت موضوع تجربة قام بها مؤلفو المقال. مرة أخرى ، أثبتت النصوص النهائية أنها تشبه النصوص الأصلية أكثر من النصوص العشوائية. يبدو أن النهج يعمل.
وبمساعدة مثل هذه النماذج ، يمكنك التحقيق في عمليات مناطق الدماغ المختلفة. في هذه الدراسة ، تم استخدام ثلاث مناطق منفصلة من الدماغ تتعامل مع الكلام المسموع لتوليد إشارة التصوير بالرنين المغناطيسي. يمكن للمرء أن يتعلم أي جزء من المعلومات تتم معالجته من خلال أي منطقة من الدماغ عن طريق إضافة وإزالة إشارات من أجزاء مختلفة من الدماغ من مدخلات النموذج. بالإضافة إلى ذلك ، يمكنك تباين عمليات إعادة بناء نموذج التشفير باستخدام إشارات من مكونات أخرى.
اقرأ المزيد عن الذكاء الاصطناعي:
إخلاء المسئولية
تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.
نبذة عن الكاتب
دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.
المزيد من المقالاتدامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.