گزارش خبری پیشرفته
اکتبر 10، 2023

مایکروسافت LLM ها را مجبور کرد هری پاتر را فراموش کنند

مایکروسافت LLM ها را مجبور کرد هری پاتر را فراموش کنند
منبع: Dall-E 3

مایکروسافت روشی را معرفی کرده است برای دستور دادن به مدل های زبان بزرگ (LLM) برای فراموش کردن اطلاعات خاص در مجموعه داده های خود بدون نیاز به بازسازی کامل داده های آموزشی. این روش فرصت‌های جدیدی را برای بهبود LLM و به طور بالقوه حل مشکلات حقوقی مربوط به محتوای دارای حق چاپ باز می‌کند.

تیم مایکروسافت اخیرا نشان داده است که چگونه توانسته اند این را بسازند Llamaمدل -2 جزئیات کتاب های هری پاتر را بدون تأثیر بر سایر داده های موجود در داده های آموزشی مدل یا عملکرد کلی مدل در مطالعه ای که در صفحه پروژه تحقیقاتی آنها توضیح داده شده است، فراموش می کند.

این فرآیند با شناسایی اطلاعات خاصی در مجموعه داده مدل شروع می شود که باید فراموش شوند. در این مورد، جزئیات مربوط به سریال نمادین جی کی رولینگ، از جمله مشخصات داستان، نام شخصیت ها و نقل قول های معروف بود. اینها سپس به طور سیستماتیک با عبارات عمومی و نامرتبط جایگزین شدند.

سپس محققان از یک مدل زبان برای تولید اطلاعات جدید بر اساس این داده های عمومی استفاده کردند. سپس از این داده های تازه برای آموزش مجدد نسخه اصلی استفاده شد Llama-2 مدل به صورت تدریجی با هر قدم، این مدل از کتاب‌های هری پاتر فاصله می‌گرفت تا اینکه وقتی درباره آنها سؤال می‌شد، شروع به تولید پاسخ‌های توهم‌آمیز کرد.

یکی از ویژگی های قابل توجه این رویکرد این است که عملکرد کلی مدل را به خطر نمی اندازد. این بدان معنی است که در حالی که LLM به طور فزاینده ای در مورد داده های خاص فراموش می شود، قابلیت های زبان کلی آن دست نخورده باقی می ماند.

با وجود این واقعیت که این رویکرد هنوز در حال اصلاح است، پیامدهای آن گسترده است. در شرایطی که شامل ادعاهای حقوقی و مسائل مربوط به حق چاپ است، به ویژه، ممکن است راه نجاتی برای کسانی باشد که LLM و سایر مدل‌های هوش مصنوعی ایجاد می‌کنند.

این نوآوری در زمانی رخ می دهد که اختلافات حقوقی بر سر استفاده از محتوای دارای حق چاپ در مدل های هوش مصنوعی در حال افزایش است. برای مثال، نیویورک تایمز اخیراً خواستار حذف آن شده است از انتشارات آن از GPT-4 مجموعه داده در صورت موفقیت آمیز بودن چالش حقوقی، توسعه دهندگان به طور معمول نیاز به بازسازی مجموعه داده های مدل خود دارند، فرآیندی زمان بر و منابع فشرده. روش مایکروسافت، در صورت اصلاح و استفاده بیشتر، می تواند راه حلی کارآمد برای چنین چالش هایی ارائه دهد.

روش مایکروسافت برای فراموشی انتخابی اطلاعات خاص در مدل های زبان بزرگ (LLMs) یک پیشرفت مهم در توسعه هوش مصنوعی است که به طور بالقوه به مسائل مربوط به محتوای دارای حق چاپ و ساده سازی اصلاح می پردازد. این رویکرد می تواند در حوزه های مختلف اعمال شود و توسعه و کاربرد هوش مصنوعی مسئول را نشان دهد.

سلب مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

مقالات بیشتر
دامیر یالالوف
دامیر یالالوف

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

Hot Stories
به خبرنامه ما بپیوندید.
آخرین اخبار

در میان نوسانات، اشتهای سازمانی به سمت ETF های بیت کوین رشد می کند

افشاگری از طریق پرونده های 13F نشان می دهد که سرمایه گذاران نهادی قابل توجهی در ETF های بیت کوین مشغول هستند و بر پذیرش فزاینده ...

بیشتر بدانید

روز صدور حکم فرا می رسد: با بررسی دادگاه ایالات متحده به درخواست وزارت دادگستری، سرنوشت CZ در تعادل است

چانگ پنگ ژائو امروز در دادگاهی در سیاتل آمریکا محکوم خواهد شد.

بیشتر بدانید
به انجمن فناوری نوآورانه ما بپیوندید
ادامه مطلب
ادامه مطلب
Espresso Systems با Polygon Labs برای توسعه AggLayer برای افزایش قابلیت همکاری Rollup همکاری می کند.
کسب و کار گزارش خبری پیشرفته
Espresso Systems با Polygon Labs برای توسعه AggLayer برای افزایش قابلیت همکاری Rollup همکاری می کند.
ممکن است 9، 2024
پروتکل زیرساختی مبتنی بر ZKP ZKBase نقشه راه را رونمایی کرد، برنامه تست نت را در ماه مه راه اندازی کرد
گزارش خبری پیشرفته
پروتکل زیرساختی مبتنی بر ZKP ZKBase نقشه راه را رونمایی کرد، برنامه تست نت را در ماه مه راه اندازی کرد
ممکن است 9، 2024
BLOCKCHANCE و CONF3RENCE برای بزرگترین آلمان متحد می شوند Web3 کنفرانس دورتموند
کسب و کار بازارها نرم افزار داستان ها و نقدها پیشرفته
BLOCKCHANCE و CONF3RENCE برای بزرگترین آلمان متحد می شوند Web3 کنفرانس دورتموند
ممکن است 9، 2024
NuLink در Bybit راه اندازی می شود Web3 پلتفرم IDO. مرحله اشتراک تا 13 اردیبهشت تمدید شد
بازارها گزارش خبری پیشرفته
NuLink در Bybit راه اندازی می شود Web3 پلتفرم IDO. مرحله اشتراک تا 13 اردیبهشت تمدید شد
ممکن است 9، 2024
CRYPTOMERIA LABS PTE. محدود