뉴스 보도 SMW Technology
2023 년 5 월 10 일

Anthropic은 60가지 원칙에 기반한 채팅 모델을 위한 '상황별 AI'를 제안합니다.

요컨대

OpenAI RLHF(인간 피드백의 강화 학습)를 사용하여 언어 모델 인간의 원칙, 안전 및 유용성.

Anthropic은 모델이 따라야 하는 헌법을 작성하는 사람들을 포함하는 상황별 AI라는 대안적인 접근 방식을 제안했습니다.

이 헌법은 유엔 인권 선언, Apple의 서비스 약관, 비서구적 관점의 고려를 장려하는 원칙을 기반으로 합니다.

Anthropic은 '헌법 AI'. 이 방법은 OpenAI의 강화 학습 사람의 피드백을 기반으로 하지만 딥 트레이닝 샘플을 작성할 필요가 없습니다. 대신, 모델은 모델이 따라야 할 일련의 법률 역할을 하는 헌법을 사용하여 입력에 응답하도록 훈련됩니다.

Anthropic은 60가지 원칙에 기반한 채팅 모델을 위한 '상황별 AI'를 제안합니다.
anthropic.com
권장 사항 : 전의-OpenAI 직원들은 700억 달러 이상의 자금 조달을 유치한 기업인 Anthropic을 설립했습니다.

이 방법을 통해 AI는 자신이 말한 내용과 법적으로 허용되는 일련의 원칙을 평가하여 자체 교육 샘플을 생성할 수 있습니다. 이 시간 절약 기술은 다음과 같이 볼 수 있습니다. 이삭 Asimov'에스 로봇의 법칙 실행에 옮겼다.

모델의 기반을 형성하는 원리는 너무 많아서 자세히 논의할 수 없습니다. 그러나 그들은 도덕성, 위험 회피, 경제 및 인공 지능과 같은 많은 주제를 다룹니다. 각각은 AI가 응답할 때 결정을 내리는 데 도움이 되도록 개발되었습니다. 대화 프롬프트.

Anthropic은 성공적으로 경쟁하는 Claude라는 AI 모델을 효과적으로 훈련시키는 데 성공했습니다. OpenAI의 ChatGPT. 사용 체질-AI 방식, Claude는 인상적인 수준의 정확도로 대화 프롬프트에 응답할 수 있지만 Anthropic이 이 판도를 바꾸는 기술을 계속 구축함에 따라 추가 개선이 예상됩니다.

일련의 원칙과 몇 가지 프로세스 예제를 사용하여 모델은 첫 번째 단계에서 자체 응답을 평가하고 수정하는 방법을 배웁니다. 두 번째 단계는 강화 학습을 사용하여 모델을 교육하는 것과 관련이 있지만, 인간의 입력을 사용하는 대신 일련의 원칙에 따라 AI가 생성한 피드백을 사용하여 더 좋은 결과를 선택합니다.

실제로 이 새로운 접근 방식은 더 이상 자체 교육 샘플을 구성할 필요가 없는 회사의 시간과 비용을 절약할 수 있는 잠재력이 있습니다. 오히려 이 '기성품' 방법은 맞춤형 모델을 만들기 위한 기초로 사용할 수 있으며 프로그래밍 지식이 필요하지 않습니다. 이 기술이 대화형 봇과 관련하여 어떻게 안전성을 높일 수 있는지 주목하는 것도 중요합니다. 법적으로 허용되는 일련의 원칙 만들기 위험을 완화 AI가 도적질하는 것.

따라서 Constituation AI는 채팅 모델 개발을 더 쉽고 빠르게 할 뿐만 아니라 더 안전하게 만들 것입니다. 인공 지능과 ChatBot 모두의 세계를 위한 윈-윈 상황입니다.

챗봇을 위한 Anthropic의 "컨텍스트 AI"에 대한 분석적 검토

Anthropic의 Contextual AI는 유엔 인권 선언, Apple의 서비스 약관, 비서구적 관점의 고려를 장려하는 원칙, 딥마인드의 참새 규칙, 인류 연구 세트 1 및 세트 2.

이제 AI가 이렇게 광범위하고 다양한 소스에서 파생된 원리에 따라 동작하도록 가르칠 수 있다는 사실은 정말 놀랍습니다. 예를 들어, 유엔 인권 선언문의 원칙을 통합함으로써 이제 챗봇 응답은 자유, 평등, 형제애라는 개념을 보존하는 것의 중요성을 반영합니다. 이러한 원칙은 다음을 보장하는 데 중요한 구성 요소입니다. 챗봇 대화 윤리적이고 존중하는 태도를 유지하십시오. 마찬가지로 Apple의 서비스 약관을 통합하면 다음이 보장됩니다. 채팅 봇 사용자의 개인 정보 보호 이익을 고려합니다.

비서구적 관점의 고려를 장려하는 원칙도 "컨텍스트 AI" 모델에서 중요한 역할을 합니다. 이러한 원칙은 AI가 다른 문화를 존중하고 챗봇 응답이 해롭거나 공격적인 것으로 인식되지 않도록 해야 할 필요성을 반영합니다. 마찬가지로 Deepmind의 Sparrow Rules는 챗봇이 사용자와의 관계를 구축하기 위한 응답으로 응답하도록 지시합니다.

Anthropic Research Set 1과 Set 2의 통합은 AI 대화가 예의바르고 정중하게 유지되도록 최종 보장합니다. AI는 사려 깊고 예의 바르게 질문에 답하도록 훈련되었습니다.

대체로 Anthropic의 "컨텍스트 AI" 모델은 AI 연구. 이러한 다양한 소스에서 파생된 원칙에 따라 AI를 학습할 수 있도록 함으로써 자동화된 대화의 윤리적 영향이 크게 개선됩니다.

AI에 대해 자세히 알아보기:

책임 부인

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

더 많은 기사
다미르 얄랄로프
다미르 얄랄로프

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

Hot Stories
뉴스레터에 가입하세요.
최신 뉴스

변동성 속에서 비트코인 ​​ETF를 향한 기관의 선호도 증가

13F 서류를 통한 공개를 통해 주목할만한 기관 투자자들이 비트코인 ​​ETF에 손을 대고 있음이 드러났으며, 이는 비트코인 ​​ETF에 대한 수용이 증가하고 있음을 강조합니다.

현장 사진

선고일이 다가왔습니다: 미국 법원이 DOJ의 주장을 고려함에 따라 CZ의 운명이 균형을 이루고 있습니다.

자오창펑(Changpeng Zhao)은 오늘 시애틀의 미국 법원에서 선고를 받을 예정이다.

현장 사진
혁신적인 기술 커뮤니티에 참여하세요
상세 보기
자세히 보기
Injective는 AltLayer와 힘을 합쳐 inEVM에 재스테이킹 보안을 도입했습니다.
근무지에서 발생 뉴스 보도 Technology
Injective는 AltLayer와 힘을 합쳐 inEVM에 재스테이킹 보안을 도입했습니다.
2024 년 5 월 3 일
Masa는 텔러와 협력하여 MASA 대출 풀을 도입하고 USDC에서 베이스 대출을 활성화합니다.
시장 뉴스 보도 Technology
Masa는 텔러와 협력하여 MASA 대출 풀을 도입하고 USDC에서 베이스 대출을 활성화합니다.
2024 년 5 월 3 일
Velodrome은 앞으로 몇 주 안에 Superchain 베타 버전을 출시하고 OP 스택 레이어 2 블록체인으로 확장합니다.
시장 뉴스 보도 Technology
Velodrome은 앞으로 몇 주 안에 Superchain 베타 버전을 출시하고 OP 스택 레이어 2 블록체인으로 확장합니다.
2024 년 5 월 3 일
CARV, 데이터 계층을 분산화하고 보상을 분배하기 위해 Aethir와의 파트너십 발표
근무지에서 발생 뉴스 보도 Technology
CARV, 데이터 계층을 분산화하고 보상을 분배하기 위해 Aethir와의 파트너십 발표
2024 년 5 월 3 일
CRYPTOMERIA LABS PTE. LTD.