Новостной репортаж Технологии
15 марта 2023

OpenAI Собирает команду из 50+ экспертов для улучшения GPT-4безопасность

Коротко

OpenAI нанял команду из более чем 50 экспертов, чтобы гарантировать, что его новейшие языковая модель, GPT-4, безопасен для использования.

В команду входят исследователи и инженеры, специализирующиеся на безопасности, этике и политике ИИ.

Цель состоит в том, чтобы предотвратить GPT-4 от создания вредного или предвзятого контента и обеспечивать его соответствие человеческим ценностям.

OpenAI Собирает команду из 50+ экспертов для улучшения GPT-4безопасность

OpenAI нанял более 50 экспертов из разных областей, чтобы сделать GPT-4 безопаснее. Эксперты работали над состязательным тестированием модели, чтобы выявить потенциальные риски и уязвимости. Это эксперты из разных областей: долгосрочные риски выравнивания ИИ, кибербезопасность, биориски и международная безопасность. Их выводы помогли OpenAI оценить поведение модели в областях повышенного риска, требующих нишевой экспертизы. 

Хотя новейшая языковая модель представляет те же риски, что и более мелкие языковые модели, дополнительные возможности GPT-4 привести к новым угрозам. Таким образом, привлечение экспертов было имеет решающее значение для обеспечения безопасности технологии.

OpenAI внедрил дополнительный набор обучающих подсказок с подкреплением, связанных с безопасностью, на основе человеческих предпочтений (RLHF) и моделей вознаграждения на основе правил (RBRM) для повышения безопасности GPT-4 модель. РБРМ имеют нулевой выстрел. GPT-4 классификаторы, которые действуют как дополнительный сигнал вознаграждения для GPT-4 модель политики в ходе тонкой настройки RLHF. Их цель — стимулировать соответствующее поведение, например отказ от создания вредоносного контента или отказ от отклонения безобидных запросов.

Чтобы обеспечить безопасность GPT-4 модели, OpenAI в августе 2022 года начала привлекать внешних экспертов для проведения учений «красной команды», включая стресс-тестирование, граничное тестирование и состязательное тестирование. У них был доступ к ранним версиям GPT-4 модель и выявила первоначальные риски, которые послужили мотивом для дальнейших исследований в области безопасности.

Отзывы экспертов привели к техническим мерам по смягчению последствий и мерам по обеспечению соблюдения политик для снижения рисков. Однако остается много угроз, и необходима дальнейшая оценка.

Говоря о сотрудниках в OpenAI, ChatGPT был изначально развитый при помощи отдельных лиц из беднейших регионов мира через OpenAIпартнерство с компанией Sama, в которой работают миллионы рабочих из бедных районов. Некоторые эксперты по этике ИИ подвергли критике OpenAIрешение отдать на аутсорсинг обучение своих ChatGPT модель Саме, обвиняя компанию в эксплуатации дешевой рабочей силы.

Прочитайте больше:

Отказ от ответственности

В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.

Об авторе

Агне — журналист, освещающий последние тенденции и разработки в области метавселенной, искусственного интеллекта и Web3 отрасли для Metaverse Post. Ее страсть к рассказыванию историй побудила ее проводить многочисленные интервью с экспертами в этих областях, всегда стремясь раскрыть захватывающие и увлекательные истории. Агне имеет степень бакалавра литературы и имеет обширный опыт написания статей на самые разные темы, включая путешествия, искусство и культуру. Она также работала волонтером в качестве редактора организации по защите прав животных, где помогала повышать осведомленность о проблемах защиты животных. Свяжитесь с ней по [электронная почта защищена].

Другие статьи
Агне Цимерман
Агне Цимерман

Агне — журналист, освещающий последние тенденции и разработки в области метавселенной, искусственного интеллекта и Web3 отрасли для Metaverse Post. Ее страсть к рассказыванию историй побудила ее проводить многочисленные интервью с экспертами в этих областях, всегда стремясь раскрыть захватывающие и увлекательные истории. Агне имеет степень бакалавра литературы и имеет обширный опыт написания статей на самые разные темы, включая путешествия, искусство и культуру. Она также работала волонтером в качестве редактора организации по защите прав животных, где помогала повышать осведомленность о проблемах защиты животных. Свяжитесь с ней по [электронная почта защищена].

Hot Stories
Подпишитесь на нашу рассылку.
Новости

Институциональный аппетит к биткойн-ETF растет на фоне волатильности

Раскрытие информации через отчеты 13F показывает, что известные институциональные инвесторы балуются биткойн-ETF, подчеркивая растущее признание...

Узнать больше

Наступил день вынесения приговора: судьба CZ висит на волоске, поскольку суд США рассматривает ходатайство Министерства юстиции

Чанпэн Чжао сегодня предстанет перед судом США в Сиэтле.

Узнать больше
Присоединяйтесь к нашему сообществу инновационных технологий
Узнать больше
Читать далее
Injective объединяет усилия с AltLayer, чтобы внести изменения в безопасность в inEVM
Бизнес Новостной репортаж Технологии
Injective объединяет усилия с AltLayer, чтобы внести изменения в безопасность в inEVM
3 мая 2024
Masa объединяется с Teller, чтобы представить кредитный пул MASA, позволяющий заимствовать USDC на базе
Области применения: Новостной репортаж Технологии
Masa объединяется с Teller, чтобы представить кредитный пул MASA, позволяющий заимствовать USDC на базе
3 мая 2024
Velodrome запускает бета-версию Superchain в ближайшие недели и распространяется на блокчейны второго уровня стека OP
Области применения: Новостной репортаж Технологии
Velodrome запускает бета-версию Superchain в ближайшие недели и распространяется на блокчейны второго уровня стека OP
3 мая 2024
CARV объявляет о партнерстве с Aethir для децентрализации уровня данных и распределения вознаграждений
Бизнес Новостной репортаж Технологии
CARV объявляет о партнерстве с Aethir для децентрализации уровня данных и распределения вознаграждений
3 мая 2024
CRYPTOMERIA LABS PTE. ООО