گزارش خبری SMW پیشرفته
ممکن است 10، 2023

Anthropic یک "هوش مصنوعی متنی" برای مدل های چت بر اساس 60 اصل پیشنهاد می کند

به طور خلاصه

OpenAI از یادگیری تقویتی از بازخورد انسانی (RLHF) برای تراز کردن استفاده می کند مدل های زبان با اصول انسانی، ایمنی و سودمندی.

Anthropic یک رویکرد جایگزین پیشنهاد کرد: هوش مصنوعی متنی، که شامل افرادی می‌شود که قانون اساسی را می‌نویسند که مدل باید از آن پیروی کند.

این قانون اساسی بر اساس اعلامیه حقوق بشر سازمان ملل متحد، شرایط خدمات اپل، اصول تشویق کننده توجه به دیدگاه های غیرغربی است.

Anthropic رویکرد جدیدی برای آموزش مدل‌های چت با استفاده از ' پیشنهاد کرده است.هوش مصنوعی مشروطه'. این روش بر روی OpenAI" تقویت یادگیری از بازخوردهای انسانی، اما با اجتناب از نیاز به نوشتن نمونه های آموزشی عمیق، بر آن استوار است. درعوض، این مدل برای پاسخگویی به ورودی از طریق استفاده از قانون اساسی آموزش داده می شود که قرار است به عنوان مجموعه ای از قوانین برای الگو عمل کند.

Anthropic یک "هوش مصنوعی متنی" برای مدل های چت بر اساس 60 اصل پیشنهاد می کند
anthropic.com
توصیه می شود: سابق-OpenAI کارمندان آنتروپیک را تأسیس کردند، یک تجارت که بیش از 700 میلیون دلار سرمایه جذب کرده است

از طریق این روش، هوش مصنوعی می‌تواند نمونه‌های آموزشی خود را با ارزیابی آنچه گفته است در مقابل مجموعه اصول پذیرفته شده قانونی خود تولید کند. این تکنیک صرفه جویی در زمان را می توان به صورت مشاهده کرد ایزاک آسیموف's قوانین رباتیک عملی شود.

اصولی که پایه مدل را تشکیل می‌دهند بیش از آن هستند که بتوان در جزئیات آن را مورد بحث قرار داد. با این حال، آنها موضوعات بسیاری مانند اخلاق، ریسک گریزی، اقتصاد و هوش مصنوعی را پوشش می دهند. هر کدام به منظور کمک به هدایت تصمیمات هوش مصنوعی در هنگام پاسخگویی ایجاد شده اند پیام های مکالمه.

Anthropic موفق شده است به طور موثر یک مدل هوش مصنوعی به نام Claude را آموزش دهد که با موفقیت با آن رقابت می کند OpenAI" ChatGPT. با استفاده از روش Constitution-AIکلود می‌تواند به درخواست‌های مکالمه با دقت قابل توجهی پاسخ دهد، اما انتظار می‌رود که آنتروپیک به ساخت این فناوری تغییردهنده بازی ادامه دهد، پیشرفت‌های بیشتری انجام دهد.

با استفاده از مجموعه ای از اصول و چند مثال فرآیند، مدل آموزش داده می شود که چگونه پاسخ های خود را در مرحله اول ارزیابی و اصلاح کند. مرحله دوم شامل آموزش مدلی با استفاده از یادگیری تقویتی است، اما به جای استفاده از ورودی از انسان، از بازخورد تولید شده توسط هوش مصنوعی بر اساس مجموعه‌ای از اصول برای انتخاب خروجی خوش‌خیم‌تر استفاده می‌کند.

در واقع، این رویکرد جدید این پتانسیل را دارد که در زمان و هزینه شرکت‌هایی که دیگر نیازی به ساخت نمونه‌های آموزشی خود ندارند، صرفه‌جویی کند. در عوض، این روش «آماده» می‌تواند به عنوان پایه‌ای برای ایجاد مدل‌های مناسب مورد استفاده قرار گیرد - هیچ دانش برنامه‌نویسی مورد نیاز نیست. همچنین مهم است که توجه داشته باشید که چگونه این فناوری همچنین وعده افزایش ایمنی را در مورد ربات‌های مکالمه می‌دهد. ایجاد مجموعه ای از اصول پذیرفته شده قانونی خطر را کاهش می دهد از AI سرکش.

بنابراین، Constituation AI نه تنها وعده می دهد که توسعه مدل چت را آسان تر و سریع تر می کند، بلکه آن را ایمن تر نیز می کند. یک موقعیت برد-برد برای دنیای هوش مصنوعی و چت بات ها به طور یکسان.

نگاهی تحلیلی به "هوش مصنوعی متنی" آنتروپیک برای چت بات ها

هوش مصنوعی متنی Anthropic مبتنی بر ترکیب بیش از 60 اصل است که از اعلامیه حقوق بشر سازمان ملل متحد، شرایط خدمات اپل، اصول تشویق کننده توجه به دیدگاه های غیر غربی، Deepmind's قواعد گنجشک، و مجموعه تحقیقات انسان شناسی 1 و مجموعه 2.

این واقعیت که اکنون می توان هوش مصنوعی را آموزش داد که طبق اصولی که از چنین مجموعه گسترده و متنوعی از منابع به دست آمده است رفتار کند، واقعاً قابل توجه است. برای مثال، با ترکیب اصولی از اعلامیه حقوق بشر سازمان ملل، پاسخ‌های چت بات اکنون اهمیت حفظ مفهوم آزادی، برابری و برادری را نشان می‌دهد. چنین اصولی جزء حیاتی تضمین آن هستند مکالمات چت بات اخلاقی و محترمانه باقی بمانند به همین ترتیب، ادغام شرایط خدمات اپل تضمین می کند chatbot منافع حریم خصوصی کاربران خود را در نظر می گیرد.

اصول تشویق کننده توجه به دیدگاه های غیر غربی نیز نقش مهمی در مدل "هوش مصنوعی متنی" ایفا می کند. این اصول نشان دهنده نیاز هوش مصنوعی به احترام به فرهنگ های دیگر است و اطمینان می دهد که پاسخ های چت بات مضر یا توهین آمیز تلقی نمی شوند. به طور مشابه، قوانین گنجشک Deepmind دیکته می کند که ربات چت با پاسخ هایی که برای ایجاد رابطه با کاربر است، پاسخ می دهد.

ادغام مجموعه تحقیقاتی Anthropic 1 و مجموعه 2 تضمین نهایی را ارائه می دهد که مکالمات هوش مصنوعی متداول و محترمانه باقی می مانند. هوش مصنوعی طوری آموزش دیده است که اطمینان حاصل کند که به سؤالات به شیوه ای متفکرانه و مؤدبانه پاسخ می دهد.

در مجموع، مدل "هوش مصنوعی متنی" آنتروپیک یک پیشرفت فوق العاده مهم در زمینه تحقیق هوش مصنوعی. با اجازه دادن به هوش مصنوعی بر اساس اصولی که از چنین طیف متنوعی از منابع به دست آمده آموزش داده شود، پیامدهای اخلاقی مکالمات خودکار تا حد زیادی بهبود می یابد.

درباره هوش مصنوعی بیشتر بخوانید:

سلب مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

مقالات بیشتر
دامیر یالالوف
دامیر یالالوف

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

Hot Stories
به خبرنامه ما بپیوندید.
آخرین اخبار

در میان نوسانات، اشتهای سازمانی به سمت ETF های بیت کوین رشد می کند

افشاگری از طریق پرونده های 13F نشان می دهد که سرمایه گذاران نهادی قابل توجهی در ETF های بیت کوین مشغول هستند و بر پذیرش فزاینده ...

بیشتر بدانید

روز صدور حکم فرا می رسد: با بررسی دادگاه ایالات متحده به درخواست وزارت دادگستری، سرنوشت CZ در تعادل است

چانگ پنگ ژائو امروز در دادگاهی در سیاتل آمریکا محکوم خواهد شد.

بیشتر بدانید
به انجمن فناوری نوآورانه ما بپیوندید
ادامه مطلب
ادامه مطلب
Injective با AltLayer نیروها را به هم می پیوندد تا امنیت مجدد را به inEVM بیاورد
کسب و کار گزارش خبری پیشرفته
Injective با AltLayer نیروها را به هم می پیوندد تا امنیت مجدد را به inEVM بیاورد
ممکن است 3، 2024
Masa با Teller همکاری می کند تا استخر وام MASA را معرفی کند، وام USDC را بر اساس امکان پذیر می کند
بازارها گزارش خبری پیشرفته
Masa با Teller همکاری می کند تا استخر وام MASA را معرفی کند، وام USDC را بر اساس امکان پذیر می کند
ممکن است 3، 2024
Velodrome نسخه بتا سوپرچین را در هفته‌های آینده عرضه می‌کند و در سراسر بلاک‌چین‌های OP Stack Layer 2 گسترش می‌یابد
بازارها گزارش خبری پیشرفته
Velodrome نسخه بتا سوپرچین را در هفته‌های آینده عرضه می‌کند و در سراسر بلاک‌چین‌های OP Stack Layer 2 گسترش می‌یابد
ممکن است 3، 2024
CARV شراکت با Aethir را برای تمرکززدایی لایه داده خود و توزیع جوایز اعلام می کند.
کسب و کار گزارش خبری پیشرفته
CARV شراکت با Aethir را برای تمرکززدایی لایه داده خود و توزیع جوایز اعلام می کند.
ممکن است 3، 2024
CRYPTOMERIA LABS PTE. محدود