Звіт про новини ТПВ Технологія
Травень 10, 2023

Anthropic пропонує «контекстний ШІ» для моделей чату на основі 60 принципів

Коротко

OpenAI використовує навчання з підкріпленням із зворотного зв’язку людини (RLHF) для узгодження мовні моделі з людськими принципами, безпекою та корисністю.

Anthropic запропонував альтернативний підхід: контекстний штучний інтелект, який залучає людей, які пишуть конституцію, якої має наслідувати модель.

Ця конституція базується на Декларації прав людини Організації Об’єднаних Націй, Умовах обслуговування Apple, Принципах, що заохочують до розгляду незахідних поглядів.

Anthropic запропонував новий підхід до навчання моделей чату за допомогою 'Конституційний ШІ'. Цей метод спирається на OpenAIАвтора навчання на основі відгуків людей, але будується на них, уникаючи необхідності писати зразки глибокого навчання. Натомість модель навчена реагувати на вхідні дані за допомогою конституції, яка має діяти як набір законів, яких модель повинна дотримуватися.

Anthropic пропонує «контекстний ШІ» для моделей чату на основі 60 принципів
anthropic.com
Рекомендується: Екс-OpenAI Співробітники заснували компанію Anthropic, яка залучила понад 700 мільйонів доларів фінансування

За допомогою цього методу штучний інтелект може генерувати власні навчальні зразки, порівнюючи те, що він сказав, із набором законодавчо прийнятих принципів. Цю техніку економії часу можна розглядати як Айзек Азімовс Закони робототехніки втілити в життя.

Принципів, які складають основу моделі, занадто багато, щоб обговорювати їх докладно. Однак вони охоплюють багато тем, таких як мораль, уникнення ризику, економіка та штучний інтелект. Кожне було розроблено, щоб допомогти ШІ приймати рішення, коли справа доходить до реагування розмовні підказки.

Anthropic вдалося ефективно натренувати модель штучного інтелекту на ім'я Клод, яка успішно конкурує з нею OpenAIАвтора ChatGPT. Використання Метод конституції-АІ, Клод міг відповідати на розмовні підказки з вражаючою точністю, але очікуються додаткові вдосконалення, оскільки Anthropic продовжує розвивати цю революційну технологію.

Використовуючи набір принципів і кілька прикладів процесів, модель навчають, як оцінювати та переглядати власні відповіді протягом першої фази. Другий етап передбачає навчання моделі за допомогою навчання з підкріпленням, але замість того, щоб використовувати вхідні дані від людей, він використовує зворотній зв’язок, згенерований штучним інтелектом, на основі набору принципів для вибору більш доброго результату.

Дійсно, цей новий підхід може заощадити час і гроші для компаній, яким більше не потрібно буде створювати власні навчальні зразки. Швидше, цей «готовий» метод можна використовувати як основу для створення індивідуальних моделей – знання програмування не потрібні. Важливо також відзначити, що ця технологія також обіцяє підвищити безпеку, коли мова йде про розмовних ботів. Створення набору законодавчо визнаних принципів зменшує ризик ШІ стає шахраєм.

Таким чином, Constitution AI не тільки обіцяє зробити розробку моделі чату легшою та швидшою, але й зробить її безпечнішою. Безпрограшна ситуація як для світу штучного інтелекту, так і для чат-ботів.

Аналітичний погляд на «контекстний ШІ» Anthropic для чат-ботів

Контекстний штучний інтелект від Anthropic базується на об’єднанні понад 60 принципів, виведених із Декларації прав людини Організації Об’єднаних Націй, Умов обслуговування Apple, Принципів, що заохочують розгляд незахідних поглядів, Deepmind's Правила Горобця та Антропічні дослідження, набір 1 і набір 2.

Той факт, що ШІ тепер можна навчити поводитися відповідно до принципів, отриманих із такого широкого та різноманітного масиву джерел, справді чудовий. Включаючи, наприклад, принципи Декларації прав людини ООН, відповіді чат-ботів тепер відображають важливість збереження поняття свободи, рівності та братерства. Такі принципи є життєво важливим компонентом забезпечення цього розмови чат-бота залишайтеся етичними та шанобливими. Подібним чином включення Умов обслуговування Apple забезпечує Chatbot враховує інтереси конфіденційності своїх користувачів.

Принципи, що заохочують до розгляду незахідних перспектив, також відіграють важливу роль у моделі «контекстного ШІ». Ці принципи відображають потребу ШІ поважати інші культури та гарантувати, що відповіді чат-бота не сприйматимуться як шкідливі чи образливі. Подібним чином правила Sparrow від Deepmind передбачають, що чат-бот відповідає відповідями, спрямованими на побудову стосунків із користувачем.

Включення Anthropic Research Set 1 і Set 2 забезпечує остаточну гарантію того, що розмови ШІ залишатимуться ввічливими та шанобливими. ШІ навчений відповідати на запитання вдумливо та ввічливо.

Загалом, модель «контекстного штучного інтелекту» Anthropic є неймовірно важливим проривом у галузі Дослідження ШІ. Дозволяючи навчати штучному інтелекту відповідно до принципів, отриманих із такого різноманітного діапазону джерел, етичні наслідки автоматизованих розмов значно покращуються.

Докладніше про ШІ:

відмова

Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.

про автора

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

інші статті
Дамір Ялалов
Дамір Ялалов

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

Hot Stories
Приєднуйтеся до нашої розсилки.
Останні новини

Інституційний апетит зростає до біткойн ETF на тлі волатильності

Розкриття інформації через документи 13F свідчить про те, що відомі інституційні інвестори займаються біткойн ETF, підкреслюючи зростаюче визнання ...

Дізнайтеся більше

Настав день винесення вироку: суд США розглядає прохання Міністерства юстиції щодо долі CZ.

Changpeng Zhao готовий зіткнутися з вироком у американському суді в Сіетлі сьогодні.

Дізнайтеся більше
Приєднуйтесь до нашої спільноти інноваційних технологій
Детальніше
Читати далі
Injective об’єднує зусилля з AltLayer, щоб перенести безпеку в inEVM
Business Звіт про новини Технологія
Injective об’єднує зусилля з AltLayer, щоб перенести безпеку в inEVM
Травень 3, 2024
Masa об’єднується з Teller, щоб представити MASA Lending Pool, що дає можливість USDC запозичувати на базі
ринки Звіт про новини Технологія
Masa об’єднується з Teller, щоб представити MASA Lending Pool, що дає можливість USDC запозичувати на базі
Травень 3, 2024
Найближчими тижнями Velodrome запускає бета-версію Superchain і розповсюджується на блокчейни рівня 2 OP Stack
ринки Звіт про новини Технологія
Найближчими тижнями Velodrome запускає бета-версію Superchain і розповсюджується на блокчейни рівня 2 OP Stack
Травень 3, 2024
CARV оголошує про партнерство з Aethir для децентралізації рівня даних і розподілу винагород
Business Звіт про новини Технологія
CARV оголошує про партнерство з Aethir для децентралізації рівня даних і розподілу винагород
Травень 3, 2024
CRYPTOMERIA LABS PTE. LTD.