Anthropic یک "هوش مصنوعی متنی" برای مدل های چت بر اساس 60 اصل پیشنهاد می کند
به طور خلاصه
OpenAI از یادگیری تقویتی از بازخورد انسانی (RLHF) برای تراز کردن استفاده می کند مدل های زبان با اصول انسانی، ایمنی و سودمندی.
Anthropic یک رویکرد جایگزین پیشنهاد کرد: هوش مصنوعی متنی، که شامل افرادی میشود که قانون اساسی را مینویسند که مدل باید از آن پیروی کند.
این قانون اساسی بر اساس اعلامیه حقوق بشر سازمان ملل متحد، شرایط خدمات اپل، اصول تشویق کننده توجه به دیدگاه های غیرغربی است.
Anthropic رویکرد جدیدی برای آموزش مدلهای چت با استفاده از ' پیشنهاد کرده است.هوش مصنوعی مشروطه'. این روش بر روی OpenAI" تقویت یادگیری از بازخوردهای انسانی، اما با اجتناب از نیاز به نوشتن نمونه های آموزشی عمیق، بر آن استوار است. درعوض، این مدل برای پاسخگویی به ورودی از طریق استفاده از قانون اساسی آموزش داده می شود که قرار است به عنوان مجموعه ای از قوانین برای الگو عمل کند.
توصیه می شود: سابق-OpenAI کارمندان آنتروپیک را تأسیس کردند، یک تجارت که بیش از 700 میلیون دلار سرمایه جذب کرده است |
از طریق این روش، هوش مصنوعی میتواند نمونههای آموزشی خود را با ارزیابی آنچه گفته است در مقابل مجموعه اصول پذیرفته شده قانونی خود تولید کند. این تکنیک صرفه جویی در زمان را می توان به صورت مشاهده کرد ایزاک آسیموف's قوانین رباتیک عملی شود.
اصولی که پایه مدل را تشکیل میدهند بیش از آن هستند که بتوان در جزئیات آن را مورد بحث قرار داد. با این حال، آنها موضوعات بسیاری مانند اخلاق، ریسک گریزی، اقتصاد و هوش مصنوعی را پوشش می دهند. هر کدام به منظور کمک به هدایت تصمیمات هوش مصنوعی در هنگام پاسخگویی ایجاد شده اند پیام های مکالمه.
Anthropic موفق شده است به طور موثر یک مدل هوش مصنوعی به نام Claude را آموزش دهد که با موفقیت با آن رقابت می کند OpenAI" ChatGPT. با استفاده از روش Constitution-AIکلود میتواند به درخواستهای مکالمه با دقت قابل توجهی پاسخ دهد، اما انتظار میرود که آنتروپیک به ساخت این فناوری تغییردهنده بازی ادامه دهد، پیشرفتهای بیشتری انجام دهد.
در واقع، این رویکرد جدید این پتانسیل را دارد که در زمان و هزینه شرکتهایی که دیگر نیازی به ساخت نمونههای آموزشی خود ندارند، صرفهجویی کند. در عوض، این روش «آماده» میتواند به عنوان پایهای برای ایجاد مدلهای مناسب مورد استفاده قرار گیرد - هیچ دانش برنامهنویسی مورد نیاز نیست. همچنین مهم است که توجه داشته باشید که چگونه این فناوری همچنین وعده افزایش ایمنی را در مورد رباتهای مکالمه میدهد. ایجاد مجموعه ای از اصول پذیرفته شده قانونی خطر را کاهش می دهد از AI سرکش.
بنابراین، Constituation AI نه تنها وعده می دهد که توسعه مدل چت را آسان تر و سریع تر می کند، بلکه آن را ایمن تر نیز می کند. یک موقعیت برد-برد برای دنیای هوش مصنوعی و چت بات ها به طور یکسان.
نگاهی تحلیلی به "هوش مصنوعی متنی" آنتروپیک برای چت بات ها
هوش مصنوعی متنی Anthropic مبتنی بر ترکیب بیش از 60 اصل است که از اعلامیه حقوق بشر سازمان ملل متحد، شرایط خدمات اپل، اصول تشویق کننده توجه به دیدگاه های غیر غربی، Deepmind's قواعد گنجشک، و مجموعه تحقیقات انسان شناسی 1 و مجموعه 2.
این واقعیت که اکنون می توان هوش مصنوعی را آموزش داد که طبق اصولی که از چنین مجموعه گسترده و متنوعی از منابع به دست آمده است رفتار کند، واقعاً قابل توجه است. برای مثال، با ترکیب اصولی از اعلامیه حقوق بشر سازمان ملل، پاسخهای چت بات اکنون اهمیت حفظ مفهوم آزادی، برابری و برادری را نشان میدهد. چنین اصولی جزء حیاتی تضمین آن هستند مکالمات چت بات اخلاقی و محترمانه باقی بمانند به همین ترتیب، ادغام شرایط خدمات اپل تضمین می کند chatbot منافع حریم خصوصی کاربران خود را در نظر می گیرد.
اصول تشویق کننده توجه به دیدگاه های غیر غربی نیز نقش مهمی در مدل "هوش مصنوعی متنی" ایفا می کند. این اصول نشان دهنده نیاز هوش مصنوعی به احترام به فرهنگ های دیگر است و اطمینان می دهد که پاسخ های چت بات مضر یا توهین آمیز تلقی نمی شوند. به طور مشابه، قوانین گنجشک Deepmind دیکته می کند که ربات چت با پاسخ هایی که برای ایجاد رابطه با کاربر است، پاسخ می دهد.
ادغام مجموعه تحقیقاتی Anthropic 1 و مجموعه 2 تضمین نهایی را ارائه می دهد که مکالمات هوش مصنوعی متداول و محترمانه باقی می مانند. هوش مصنوعی طوری آموزش دیده است که اطمینان حاصل کند که به سؤالات به شیوه ای متفکرانه و مؤدبانه پاسخ می دهد.
در مجموع، مدل "هوش مصنوعی متنی" آنتروپیک یک پیشرفت فوق العاده مهم در زمینه تحقیق هوش مصنوعی. با اجازه دادن به هوش مصنوعی بر اساس اصولی که از چنین طیف متنوعی از منابع به دست آمده آموزش داده شود، پیامدهای اخلاقی مکالمات خودکار تا حد زیادی بهبود می یابد.
درباره هوش مصنوعی بیشتر بخوانید:
سلب مسئولیت
در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.
درباره نویسنده
Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.
مقالات بیشترDamir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.