مایکروسافت LLM ها را مجبور کرد هری پاتر را فراموش کنند
مایکروسافت روشی را معرفی کرده است برای دستور دادن به مدل های زبان بزرگ (LLM) برای فراموش کردن اطلاعات خاص در مجموعه داده های خود بدون نیاز به بازسازی کامل داده های آموزشی. این روش فرصتهای جدیدی را برای بهبود LLM و به طور بالقوه حل مشکلات حقوقی مربوط به محتوای دارای حق چاپ باز میکند.
تیم مایکروسافت اخیرا نشان داده است که چگونه توانسته اند این را بسازند Llamaمدل -2 جزئیات کتاب های هری پاتر را بدون تأثیر بر سایر داده های موجود در داده های آموزشی مدل یا عملکرد کلی مدل در مطالعه ای که در صفحه پروژه تحقیقاتی آنها توضیح داده شده است، فراموش می کند.
این فرآیند با شناسایی اطلاعات خاصی در مجموعه داده مدل شروع می شود که باید فراموش شوند. در این مورد، جزئیات مربوط به سریال نمادین جی کی رولینگ، از جمله مشخصات داستان، نام شخصیت ها و نقل قول های معروف بود. اینها سپس به طور سیستماتیک با عبارات عمومی و نامرتبط جایگزین شدند.
سپس محققان از یک مدل زبان برای تولید اطلاعات جدید بر اساس این داده های عمومی استفاده کردند. سپس از این داده های تازه برای آموزش مجدد نسخه اصلی استفاده شد Llama-2 مدل به صورت تدریجی با هر قدم، این مدل از کتابهای هری پاتر فاصله میگرفت تا اینکه وقتی درباره آنها سؤال میشد، شروع به تولید پاسخهای توهمآمیز کرد.
یکی از ویژگی های قابل توجه این رویکرد این است که عملکرد کلی مدل را به خطر نمی اندازد. این بدان معنی است که در حالی که LLM به طور فزاینده ای در مورد داده های خاص فراموش می شود، قابلیت های زبان کلی آن دست نخورده باقی می ماند.
با وجود این واقعیت که این رویکرد هنوز در حال اصلاح است، پیامدهای آن گسترده است. در شرایطی که شامل ادعاهای حقوقی و مسائل مربوط به حق چاپ است، به ویژه، ممکن است راه نجاتی برای کسانی باشد که LLM و سایر مدلهای هوش مصنوعی ایجاد میکنند.
این نوآوری در زمانی رخ می دهد که اختلافات حقوقی بر سر استفاده از محتوای دارای حق چاپ در مدل های هوش مصنوعی در حال افزایش است. برای مثال، نیویورک تایمز اخیراً خواستار حذف آن شده است از انتشارات آن از GPT-4 مجموعه داده در صورت موفقیت آمیز بودن چالش حقوقی، توسعه دهندگان به طور معمول نیاز به بازسازی مجموعه داده های مدل خود دارند، فرآیندی زمان بر و منابع فشرده. روش مایکروسافت، در صورت اصلاح و استفاده بیشتر، می تواند راه حلی کارآمد برای چنین چالش هایی ارائه دهد.
روش مایکروسافت برای فراموشی انتخابی اطلاعات خاص در مدل های زبان بزرگ (LLMs) یک پیشرفت مهم در توسعه هوش مصنوعی است که به طور بالقوه به مسائل مربوط به محتوای دارای حق چاپ و ساده سازی اصلاح می پردازد. این رویکرد می تواند در حوزه های مختلف اعمال شود و توسعه و کاربرد هوش مصنوعی مسئول را نشان دهد.
رفع مسئولیت
در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.
درباره نویسنده
Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.
مقالات بیشترDamir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.