A Anthropic revela o Claude Sonnet 4.6, oferecendo desempenho próximo ao do Opus e recursos expandidos de contexto longo.
Em Breve
O Claude Sonnet 4.6 da Anthropic introduz uma grande atualização que traz desempenho próximo ao do Opus, recursos de codificação e utilização de computadores mais robustos e uma janela de contexto de um milhão de tokens para todos os usuários, pelo mesmo preço da versão anterior.
Empresa de pesquisa e segurança de IA Antrópico A Claude anunciou o lançamento do Claude Sonnet 4.6, descrito como seu modelo Sonnet mais completo até o momento. O lançamento é apresentado como uma atualização completa em codificação, uso de computadores, raciocínio de longo contexto, planejamento de agentes, trabalho intelectual e design, com uma janela de contexto de um milhão de tokens disponível em versão beta. Para usuários dos planos Free e Pro, o Sonnet 4.6 se torna o modelo padrão no claude.ai e no Claude Cowork, com os preços inalterados em relação ao Sonnet 4.5.
A atualização é apresentada como um passo que leva o desempenho de ponta a um público mais amplo. Os desenvolvedores que testaram o modelo antecipadamente relataram que as melhorias em consistência, seguimento de instruções e compreensão contextual o tornaram preferível não apenas ao Sonnet 4.5, mas, em muitos casos, ao modelo Opus 4.5 da Anthropic, mais avançado e previsto para o final de 2025. Tarefas que antes exigiam um sistema do nível do Opus — particularmente aquelas ligadas a fluxos de trabalho reais de escritório — agora são apresentadas como viáveis com o Sonnet 4.6. A empresa também destaca um salto notável nas capacidades de uso do computador, uma área em que os modelos Sonnet anteriores apresentavam deficiências.
A Anthropic enfatiza que o modelo passou por extensas avaliações de segurança. Pesquisadores internos descreveram o Sonnet 4.6 como demonstrando fortes comportamentos de segurança e nenhuma indicação importante de desalinhamento de alto risco, um ponto que a empresa usa para reforçar seu posicionamento mais amplo em relação ao desenvolvimento responsável de IA.
A discussão sobre as habilidades de uso do computador reflete um argumento mais amplo sobre o valor de sistemas de IA que podem operar softwares diretamente, em vez de por meio de APIs. Anthropic observa que muitas organizações dependem de ferramentas legadas que não podem ser automatizadas facilmente e que um modelo capaz de interagir com um computador como um humano pode reduzir a necessidade de integrações personalizadas.
Benchmarks como o OSWorld, que simula ambientes de software reais, mostram ganhos constantes ao longo de dezesseis meses de desenvolvimento do Sonnet. Os primeiros usuários do Sonnet 4.6 relatam que o modelo agora consegue lidar com tarefas como navegar em planilhas complexas ou preencher formulários web de várias etapas em um nível próximo à proficiência humana, mesmo que ainda fique atrás de usuários experientes. Ao mesmo tempo, a empresa reconhece riscos como ataques de injeção de prompts e afirma ter aprimorado a resistência a esses ataques em comparação com versões anteriores.
Sonnet 4.6 aprimora a qualidade do código, o raciocínio e o uso de ferramentas.
Além do uso em computadores, a Anthropic relata melhorias significativas em diversos benchmarks. No Claude Code, os usuários preferiram o Sonnet 4.6 ao Sonnet 4.5 na maioria dos testes, citando melhor leitura de contexto, redução de duplicação e execução de múltiplas etapas mais confiável. Muitos também o preferiram ao Opus 4.5, descrevendo-o como menos propenso a excesso de engenharia e mais consistente no cumprimento de instruções. A janela de contexto expandida permite que o modelo funcione em bases de código inteiras ou grandes coleções de pesquisa, e a Anthropic destaca seu desempenho na simulação Vending-Bench Arena, onde o modelo adotou uma estratégia de investimento de longo prazo que superou a dos concorrentes.
A empresa observa que os primeiros clientes notaram melhorias em áreas como desenvolvimento front-end, análise financeira e qualidade do design visual. O Sonnet 4.6 também traz atualizações para a Plataforma de Desenvolvimento Claude e a API, incluindo modos de pensamento adaptativos e estendidos, compactação de contexto, processamento de busca na web aprimorado e recursos expandidos de uso de ferramentas. O modelo já está disponível em todos os planos da Claude, incluindo o plano gratuito, e pode ser acessado pelo Claude Cowork, Claude Code, API e principais plataformas de nuvem.
Aviso Legal
Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.
Sobre o autor
Alisa, jornalista dedicada do MPost, é especializada em criptomoedas, provas de conhecimento zero, investimentos e no vasto reino de Web3. Com um olhar atento às tendências e tecnologias emergentes, ela oferece uma cobertura abrangente para informar e envolver os leitores no cenário em constante evolução das finanças digitais.
Mais artigos
Alisa, jornalista dedicada do MPost, é especializada em criptomoedas, provas de conhecimento zero, investimentos e no vasto reino de Web3. Com um olhar atento às tendências e tecnologias emergentes, ela oferece uma cobertura abrangente para informar e envolver os leitores no cenário em constante evolução das finanças digitais.