Anthropic은 60가지 원칙에 기반한 채팅 모델을 위한 '상황별 AI'를 제안합니다.
요컨대
OpenAI RLHF(인간 피드백의 강화 학습)를 사용하여 언어 모델 인간의 원칙, 안전 및 유용성.
Anthropic은 모델이 따라야 하는 헌법을 작성하는 사람들을 포함하는 상황별 AI라는 대안적인 접근 방식을 제안했습니다.
이 헌법은 유엔 인권 선언, Apple의 서비스 약관, 비서구적 관점의 고려를 장려하는 원칙을 기반으로 합니다.
Anthropic은 '헌법 AI'. 이 방법은 OpenAI의 강화 학습 사람의 피드백을 기반으로 하지만 딥 트레이닝 샘플을 작성할 필요가 없습니다. 대신, 모델은 모델이 따라야 할 일련의 법률 역할을 하는 헌법을 사용하여 입력에 응답하도록 훈련됩니다.
이 방법을 통해 AI는 자신이 말한 내용과 법적으로 허용되는 일련의 원칙을 평가하여 자체 교육 샘플을 생성할 수 있습니다. 이 시간 절약 기술은 다음과 같이 볼 수 있습니다. 이삭 Asimov'에스 로봇의 법칙 실행에 옮겼다.
모델의 기반을 형성하는 원리는 너무 많아서 자세히 논의할 수 없습니다. 그러나 그들은 도덕성, 위험 회피, 경제 및 인공 지능과 같은 많은 주제를 다룹니다. 각각은 AI가 응답할 때 결정을 내리는 데 도움이 되도록 개발되었습니다. 대화 프롬프트.
Anthropic은 성공적으로 경쟁하는 Claude라는 AI 모델을 효과적으로 훈련시키는 데 성공했습니다. OpenAI의 ChatGPT. 사용 체질-AI 방식, Claude는 인상적인 수준의 정확도로 대화 프롬프트에 응답할 수 있지만 Anthropic이 이 판도를 바꾸는 기술을 계속 구축함에 따라 추가 개선이 예상됩니다.
실제로 이 새로운 접근 방식은 더 이상 자체 교육 샘플을 구성할 필요가 없는 회사의 시간과 비용을 절약할 수 있는 잠재력이 있습니다. 오히려 이 '기성품' 방법은 맞춤형 모델을 만들기 위한 기초로 사용할 수 있으며 프로그래밍 지식이 필요하지 않습니다. 이 기술이 대화형 봇과 관련하여 어떻게 안전성을 높일 수 있는지 주목하는 것도 중요합니다. 법적으로 허용되는 일련의 원칙 만들기 위험을 완화 AI가 도적질하는 것.
따라서 Constituation AI는 채팅 모델 개발을 더 쉽고 빠르게 할 뿐만 아니라 더 안전하게 만들 것입니다. 인공 지능과 ChatBot 모두의 세계를 위한 윈-윈 상황입니다.
챗봇을 위한 Anthropic의 "컨텍스트 AI"에 대한 분석적 검토
Anthropic의 Contextual AI는 유엔 인권 선언, Apple의 서비스 약관, 비서구적 관점의 고려를 장려하는 원칙, 딥마인드의 참새 규칙, 인류 연구 세트 1 및 세트 2.
이제 AI가 이렇게 광범위하고 다양한 소스에서 파생된 원리에 따라 동작하도록 가르칠 수 있다는 사실은 정말 놀랍습니다. 예를 들어, 유엔 인권 선언문의 원칙을 통합함으로써 이제 챗봇 응답은 자유, 평등, 형제애라는 개념을 보존하는 것의 중요성을 반영합니다. 이러한 원칙은 다음을 보장하는 데 중요한 구성 요소입니다. 챗봇 대화 윤리적이고 존중하는 태도를 유지하십시오. 마찬가지로 Apple의 서비스 약관을 통합하면 다음이 보장됩니다. 채팅 봇 사용자의 개인 정보 보호 이익을 고려합니다.
비서구적 관점의 고려를 장려하는 원칙도 "컨텍스트 AI" 모델에서 중요한 역할을 합니다. 이러한 원칙은 AI가 다른 문화를 존중하고 챗봇 응답이 해롭거나 공격적인 것으로 인식되지 않도록 해야 할 필요성을 반영합니다. 마찬가지로 Deepmind의 Sparrow Rules는 챗봇이 사용자와의 관계를 구축하기 위한 응답으로 응답하도록 지시합니다.
Anthropic Research Set 1과 Set 2의 통합은 AI 대화가 예의바르고 정중하게 유지되도록 최종 보장합니다. AI는 사려 깊고 예의 바르게 질문에 답하도록 훈련되었습니다.
대체로 Anthropic의 "컨텍스트 AI" 모델은 AI 연구. 이러한 다양한 소스에서 파생된 원칙에 따라 AI를 학습할 수 있도록 함으로써 자동화된 대화의 윤리적 영향이 크게 개선됩니다.
AI에 대해 자세히 알아보기:
책임 부인
줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.
저자에 관하여
Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다.
더 많은 기사Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다.