Anthropic은 거의 대작에 버금가는 성능과 확장된 장기 컨텍스트 기능을 제공하는 Claude Sonnet 4.6을 공개했습니다.
요컨대
Anthropic의 Claude Sonnet 4.6은 Opus 수준에 가까운 성능, 더욱 강력한 코딩 및 컴퓨터 사용 기능, 그리고 100만 토큰 컨텍스트 창을 이전 버전과 동일한 가격으로 모든 사용자에게 제공하는 주요 업그레이드를 도입했습니다.
AI 안전 및 연구 기업 인류 Claude는 지금까지 출시된 Sonnet 모델 중 가장 뛰어난 성능을 자랑하는 Claude Sonnet 4.6을 출시했다고 발표했습니다. 이번 릴리스는 코딩, 컴퓨터 사용, 장기 컨텍스트 추론, 에이전트 계획, 지식 작업 및 설계 전반에 걸친 완전한 업그레이드를 특징으로 하며, 100만 토큰 규모의 컨텍스트 창을 베타 버전으로 제공합니다. 무료 및 프로 플랜 사용자의 경우 Sonnet 4.6은 claude.ai 및 Claude Cowork에서 기본 모델로 사용되며, 가격은 Sonnet 4.5와 동일합니다.
이번 업데이트는 더 많은 사용자에게 고급 성능을 제공하는 단계로 자리매김하고 있습니다. 초기 테스트에 참여한 개발자들은 일관성, 지시 사항 준수, 맥락 이해 능력의 향상으로 Sonnet 4.5는 물론, 많은 경우 2025년 말 출시 예정인 Anthropic의 더욱 고급 모델인 Opus 4.5보다도 우수한 성능을 보였다고 보고했습니다. 특히 실제 사무 환경과 관련된 작업처럼 이전에는 Opus급 시스템이 필요했던 작업들도 이제 Sonnet 4.6을 통해 수행할 수 있게 되었습니다. 또한, 이전 Sonnet 모델들이 부족했던 컴퓨터 활용 능력도 크게 향상되었다고 강조합니다.
앤트로픽은 해당 모델이 광범위한 안전성 평가를 거쳤다고 강조합니다. 내부 연구원들은 소넷 4.6이 강력한 안전성을 보여주었으며 중대한 불일치 징후가 없었다고 설명했는데, 이는 회사가 책임감 있는 AI 개발에 대한 전반적인 입장을 강화하는 데 사용하는 근거입니다.
컴퓨터 사용 능력에 대한 논의는 API를 통하지 않고 소프트웨어를 직접 조작할 수 있는 AI 시스템의 가치에 대한 더 폭넓은 논의를 반영합니다. 앤스로픽은 많은 조직이 자동화가 용이하지 않은 기존 도구에 의존하고 있으며, 인간처럼 컴퓨터와 상호 작용할 수 있는 모델은 맞춤형 통합의 필요성을 줄일 수 있다고 지적합니다.
실제 소프트웨어 환경을 시뮬레이션하는 OSWorld와 같은 벤치마크 결과는 소넷 개발 16개월 동안 꾸준한 성능 향상을 보여줍니다. 소넷 4.6의 초기 사용자들은 이제 모델이 복잡한 스프레드시트 탐색이나 여러 단계를 거치는 웹 양식 작성과 같은 작업을 전문가 수준에는 미치지 못하지만, 인간에 가까운 수준으로 처리할 수 있다고 보고했습니다. 동시에, 회사는 프롬프트 주입 공격과 같은 위험성을 인정하고 이전 버전에 비해 보안성이 향상되었다고 주장합니다.
소네트 4.6은 코드 품질, 추론 및 도구 사용을 향상시킵니다.
컴퓨터 사용 외에도 Anthropic은 다양한 벤치마크에서 광범위한 개선을 보고했습니다. Claude Code 테스트에서 사용자들은 대부분의 테스트에서 Sonnet 4.5보다 Sonnet 4.6을 선호했는데, 그 이유로는 향상된 컨텍스트 읽기, 코드 중복 감소, 그리고 더욱 안정적인 다단계 실행을 꼽았습니다. 또한 많은 사용자들이 Opus 4.5보다 Sonnet 4.6을 선호했는데, 과도한 설계 경향이 적고 명령어를 더 일관되게 따른다는 점을 들었습니다. 확장된 컨텍스트 창을 통해 모델은 전체 코드베이스 또는 대규모 연구 데이터셋에서도 작동할 수 있으며, Anthropic은 Vending-Bench Arena 시뮬레이션에서 경쟁사보다 우수한 장기 투자 전략을 채택한 결과를 강조했습니다.
회사 측은 초기 고객들이 프런트엔드 개발, 재무 분석, 시각 디자인 품질 등 여러 분야에서 개선 사항을 확인했다고 밝혔습니다. Sonnet 4.6은 또한 적응형 및 확장형 사고 모드, 컨텍스트 압축, 향상된 웹 검색 처리, 확장된 도구 사용 기능 등 Claude 개발자 플랫폼과 API 전반에 걸친 업데이트와 함께 출시되었습니다. 이 모델은 이제 무료 플랜을 포함한 모든 Claude 플랜에서 사용할 수 있으며, Claude Cowork, Claude Code, API 및 주요 클라우드 플랫폼을 통해 이용할 수 있습니다.
책임 한계
줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.
저자에 관하여
전담 저널리스트인 알리사(Alisa) MPost암호화폐, 인공지능, 투자 및 광범위한 분야를 전문으로 합니다. Web3. 새로운 트렌드와 기술에 대한 예리한 안목을 바탕으로 그녀는 끊임없이 진화하는 디지털 금융 환경에 대해 독자들에게 정보를 제공하고 참여시키기 위해 포괄적인 취재를 제공합니다.
더 많은 기사
전담 저널리스트인 알리사(Alisa) MPost암호화폐, 인공지능, 투자 및 광범위한 분야를 전문으로 합니다. Web3. 새로운 트렌드와 기술에 대한 예리한 안목을 바탕으로 그녀는 끊임없이 진화하는 디지털 금융 환경에 대해 독자들에게 정보를 제공하고 참여시키기 위해 포괄적인 취재를 제공합니다.



