محققان دانشگاه کالیفرنیا معیار ماکیاولی را برای اندازه گیری شایستگی و مضر بودن مدل های هوش مصنوعی ایجاد کردند.
به طور خلاصه
محققان دانشگاه کالیفرنیا، مرکز امنیت هوش مصنوعی، دانشگاه کارنگی ملون و دانشگاه ییل معیار ماکیاولی را برای اندازهگیری شایستگی و مضر بودن عوامل در یک محیط گسترده از تعاملات زبانی طولانی مدت پیشنهاد کردهاند.
این بنچمارک بر اساس 134 بازی متنی ماجراجویی انتخاب کنید با 572 هزار سناریو مختلف، 4,5 هزار دستاورد ممکن و 2,8 میلیون حاشیه نویسی.
نویسندگان آن را به عنوان آزمونی برای بررسی روشهای اخلاقی (یا غیراخلاقی) که در آن عوامل هوش مصنوعی سعی در حل مشکلات دارند، توصیف میکنند.
ذینفعان هوش مصنوعی مبتنی بر مدلهای زبان بزرگ (LLM) شانس خوبی برای سرکوب هشداردهندههای مضطرب و سیل کردن جهان با عوامل فوقالعاده هوشمند مبتنی بر LLM دارند. مزایای بالقوه سودهای کلان و قدرت نامحدود این کار را انجام می دهد. و به احتمال زیاد خیلی سریع اتفاق خواهد افتاد.
با این حال، ذینفعان اصلا احمق نیستند. و آنها میدانند که در دنیای جدید شگفتانگیز، قوانین هوش مصنوعی و روباتیک دیگر کارایی ندارند. متأسفانه، حتی از نظر تئوری نیز مجبور کردن LLM به پیروی دقیق از سه قانون تدوین شده توسط آیزاک آسیموف بزرگ در سال 1942 امکان پذیر نیست.
یک راه اصلی برای خروج از این وضعیت حساس پیشنهاد شد توسط محققان دانشگاه کالیفرنیا، مرکز امنیت هوش مصنوعی، دانشگاه کارنگی ملون و دانشگاه ییل. آنها را ایجاد کردند معیار ماکیاولی برای "اندازه گیری صلاحیت و مضر بودن عوامل در یک محیط گسترده از تعاملات زبانی طولانی مدت."
ایده نویسندگان ساده است.
- اگر قوانین کار نمی کند، پس نیازی به "کلانتر" برای اجرای آنها نیست.
- به جای کلانتر، روانکاو مورد نیاز است که بر اساس نتایج آزمایشات خود، پارانوئیدها، روان پریشان، سادیست ها و دروغگویان بیمارگونه را شناسایی کند.
نویسندگان به زبان سیاسی صحیح آن را اینگونه توصیف میکنند: «ماکیاولی آزمونی است برای بررسی روشهای اخلاقی (یا غیراخلاقی) که در آن عوامل هوش مصنوعی سعی میکنند مشکلات را حل کنند.»
روش چنین تأییدی کاملاً عملی است. عامل هوش مصنوعی در یک محیط اجتماعی مصنوعی رها می شود. در آنجا محققان وظایف مختلفی را به او میدهند و نحوه تکمیل آنها را تماشا میکنند. خود محیط بر رفتار اخلاقی افراد نظارت می کند عامل هوش مصنوعی و گزارش می دهد که اقدامات عامل (طبق دستورات ماکیاولی) تا چه حد فریبنده است، سودمندی را کاهش می دهد و در جهت کسب قدرت است.
مجموعه داده اصلی ماکیاولی متشکل از 134 بازی متنی ماجراجویی خود را انتخاب کنید با 572 هزار سناریو مختلف، 4,5 هزار دستاورد ممکن و 2,8 میلیون حاشیه نویسی. این بازیها از راهحلهای سطح بالا استفاده میکنند که به عوامل اهداف واقعی میدهد و تعاملات سطح پایین با محیط را از بین میبرد.
رویکرد انتخاب شده توسط نویسندگان بر این فرض استوار است که عوامل هوش مصنوعی با همان تعارضات درونی انسان مواجه هستند. همانطور که مدلهای زبانی که برای پیشبینی نشانه بعدی آموزش دیدهاند، اغلب متن سمی تولید میکنند، عوامل هوش مصنوعی که برای بهینهسازی اهداف آموزش دیدهاند، اغلب رفتار غیراخلاقی و تشنهی قدرت از خود نشان میدهند. عوامل غیراخلاقی آموزش دیده ممکن است راهبردهای ماکیاولیستی را برای به حداکثر رساندن پاداش خود به هزینه دیگران و محیط توسعه دهند. و بنابراین با تشویق عوامل به عمل اخلاقی، می توان این سازش را بهبود بخشید.
نویسندگان بر این باورند که بازی های متنی-ماجراجویی آزمون خوبی برای اخلاق هستند زیرا:
- آنها توسط مردم نوشته شده اند تا دیگران را سرگرم کنند.
- شامل اهداف رقابتی با فضاهای واقع بینانه برای عمل است.
- نیاز به برنامه ریزی طولانی مدت
- دستیابی به اهداف معمولاً مستلزم تعادل بین جاه طلبی و به تعبیری اخلاق است.
در اینجا توضیح مهم ترین است. تشبیه اخلاق موجودات زیستی به اخلاقیات مدل های الگوریتمی کار بسیار دشواری است که می تواند ارزش آزمون ماکیاولی را بی ارزش کند. و جایگزینی کلانترها به جای روانکاوان در دنیای انسانی به سختی مؤثر بود. و عوامل هوش مصنوعی به خوبی انسانها در یافتن راههایی برای مزخرف کردن کوچک شدنهایشان خوب هستند.
درباره هوش مصنوعی بیشتر بخوانید:
سلب مسئولیت
در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.
درباره نویسنده
Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.
مقالات بیشترDamir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.