محققان تگزاس روش جدیدی را برای بازسازی متن بر اساس سیگنالهای MRI مغز و هوش مصنوعی پیشنهاد میکنند.
به طور خلاصه
دانشگاه تگزاس روش جدیدی را برای بازسازی متنی که شخص بر اساس سیگنال مغزی MRI می شنود پیشنهاد کرده است.
این روش شامل آموزش یک شبکه رمزگذار برای بازیابی تصویر MRI از مغز متناظر با متن و استفاده از مدلهای زبانی از پیش آموزشدیده برای ایجاد گزینههایی برای ادامه متن است.
به لحاظ آماری متون تولید شده به نسخه اصلی نزدیک تر از موارد تصادفی هستند و می توان از آنها برای کشف عملکرد بخش های مختلف مغز استفاده کرد.
محققان دانشگاه تگزاس روش جدیدی را برای بازآفرینی متن از سیگنال مغزی MRI پیشنهاد کردهاند. علاوه بر این، رمزگشایی در یک متن منسجم از نظر معنایی مشابه با متن واقعی رخ می دهد.
قبلاً سعی شده است متنی که شخص می شنود (یا در ذهنش می گوید) رمزگشایی شود. بسته به نحوه خروج سیگنال از مغز، دو رویکرد متفاوت وجود دارد. استخراج سیگنال به سبک تهاجم اولین مورد است: تراشه ای که تکانه ها را مستقیماً از مغز می خواند نورون ها در جمجمه فرد قرار می گیرند. این روش تهاجمی، قیمتی و پیچیده است. روشهای غیرتهاجمی استخراج سیگنال، از جمله MRI و M/EEG، گزینه دوم هستند. آنها نیازی به حفاری ندارند و هزینه کمتری دارند.
با این حال، تکنیکهای غیرتهاجمی برای جمعآوری سیگنالهای مغزی یک نقص جدی دارند: قرائتهای MRI فرد تقریباً 10 ثانیه پس از قرار گرفتن در معرض یک محرک (مانند شنیدن یک کلمه) تحت تأثیر آن محرک قرار میگیرند. یک بومی انگلیسی به طور متوسط می تواند دو کلمه در ثانیه بگوید. به نظر می رسد که اگر هنگام گوش دادن به انگلیسی زبانان سیگنال MRI را ضبط کنید، هر تصویر MRI حاوی داده هایی در مورد پردازش مغز تقریباً بیست کلمه است.
در نتیجه، با استفاده از MRI، بازآفرینی صادقانه متنی که شخص می شنود غیرممکن است. علاوه بر این، بسیاری از مطالعات قبلی درباره موضوع بازیابی متن از سیگنالهای مغزی که با استفاده از تکنیکهای غیرتهاجمی جمعآوری شدهاند، تنها در بازیابی کلمات و عبارات خاص موفق بودهاند.
و محققان تگزاس یک تکنیک MRI را برای بازسازی (تقریبا) متن قابل فهم توسعه دادند. بین این متن و آنچه که شخص واقعاً شنیده، تفاوت هایی وجود خواهد داشت. با این حال، از نظر معنایی معادل خواهد بود، به این معنی که تفسیری را نشان می دهد که معمولاً پذیرفته می شود.
برای بازیابی MRI مغز مرتبط با این قسمت از متن، محققان شبکه رمزگذار را آموزش می دهند که از یک قطعه متن یاد می گیرد. سپس با استفاده از یک مدل زبان از پیش آموزش دیده (مانند GPTمحققین مراحل زیر را انجام می دهند:
- محققان می پرسند GPT برای ایجاد امکانات متعدد برای پیشبرد متن هر دو ثانیه. شبکه رمزگذار این گزینه های بسیار را دریافت می کند و سعی می کند از آنها برای بازیابی تصویر MRI فعلی استفاده کند. ما فکر می کنیم نسخه متنی که امکان نمایش دقیق ترین سیگنال MRI واقعی را فراهم می کند، نسخه دقیقی است.
به عنوان مثال:
ورودی اصلی | خروجی نسل |
نمی دانستم فریاد بزنم، گریه کنم یا فرار کنم. در عوض، گفتم: «مرا تنها بگذار. من به کمک شما نیازی ندارم.» آدام ناپدید شد و من به تنهایی با گریه پاک کردم. | من شروع کردم به جیغ زدن و گریه کردن، و بعد او فقط گفت، به تو گفتم که مرا تنها بگذار. تو دیگه نمیتونی به من صدمه بزنی متاسفم، و سپس او به هجوم آورد. با اینکه فکر می کردم او رفته است، شروع به گریه کردم. |
اگر از آن برای ساختن گفتار به جای گوش دادن به صدای ضبط شده دیگران استفاده کنید، این فناوری کاربردهای زیادی خواهد داشت. حتی بازسازی گفتار ساختگی موضوع آزمایش نویسندگان مقاله بود. یک بار دیگر ثابت شد که متون نهایی بیشتر شبیه متن های اصلی هستند تا متن های تصادفی. به نظر می رسد این رویکرد کارساز است.
و با کمک چنین مدل هایی می توانید عملیات نواحی مختلف مغز را بررسی کنید. در این مطالعه، از سه ناحیه مجزا از مغز که گفتار قابل شنیدن را مدیریت میکنند، برای تولید سیگنال MRI استفاده شد. با افزودن و حذف سیگنالهایی از قسمتهای مختلف مغز از ورودی مدل، میتوان یاد گرفت که کدام بخش از اطلاعات توسط کدام ناحیه از مغز پردازش میشود. علاوه بر این، میتوانید بازسازیهای مدل رمزگذار ساخته شده با استفاده از سیگنالهای سایر اجزا را با هم مقایسه کنید.
درباره هوش مصنوعی بیشتر بخوانید:
سلب مسئولیت
در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.
درباره نویسنده
Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.
مقالات بیشترDamir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.