Anthropic, neredeyse başyapıt performansı ve genişletilmiş uzun bağlamlı yetenekler sunan Claude Sonnet 4.6'yı tanıttı.
Kısaca
Anthropic'in Claude Sonnet 4.6 sürümü, önceki sürümle aynı fiyata tüm kullanıcılara neredeyse Opus seviyesinde performans, daha güçlü kodlama ve bilgisayar kullanım yetenekleri ve bir milyon tokenlik bağlam penceresi getiren önemli bir yükseltme sunuyor.
Yapay zeka güvenliği ve araştırma şirketi Antropik Claude, bugüne kadarki en yetenekli Sonnet modeli olarak tanımlanan Claude Sonnet 4.6'yı tanıttığını duyurdu. Bu sürüm, kodlama, bilgisayar kullanımı, uzun bağlamlı akıl yürütme, ajan planlaması, bilgi tabanlı çalışma ve tasarım alanlarında tam bir yükseltme olarak çerçeveleniyor ve beta sürümünde bir milyon tokenlik bağlam penceresi mevcut. Ücretsiz ve Pro plan kullanıcıları için Sonnet 4.6, claude.ai ve Claude Cowork'te varsayılan model haline geliyor ve fiyatlandırma Sonnet 4.5 ile aynı kalıyor.
Bu güncelleme, daha geniş bir kitleye üst düzey performans getiren bir adım olarak konumlandırılıyor. Modeli erken test eden geliştiriciler, tutarlılık, talimat takibi ve bağlamsal anlama alanlarındaki iyileştirmelerin, onu yalnızca Sonnet 4.5'e değil, birçok durumda Anthropic'in 2025 sonlarında piyasaya süreceği daha gelişmiş Opus 4.5 modeline de tercih edilebilir kıldığını bildirdi. Daha önce Opus sınıfı bir sistem gerektiren görevler (özellikle gerçek dünya ofis iş akışlarıyla ilgili olanlar), artık Sonnet 4.6 ile gerçekleştirilebilir olarak sunuluyor. Şirket ayrıca, önceki Sonnet modellerinin geride kaldığı bir alan olan bilgisayar kullanım yeteneklerinde de önemli bir sıçramaya dikkat çekiyor.
Anthropic, modelin kapsamlı güvenlik değerlendirmelerinden geçtiğini vurguluyor. Şirket içi araştırmacılar, Sonnet 4.6'nın güçlü güvenlik davranışları sergilediğini ve yüksek riskli uyumsuzluk belirtileri göstermediğini belirtiyor; şirket bu noktayı, sorumlu yapay zeka geliştirme konusundaki daha geniş duruşunu güçlendirmek için kullanıyor.
Bilgisayar kullanım yeteneklerine ilişkin tartışma, API'ler aracılığıyla değil, doğrudan yazılım çalıştırabilen yapay zeka sistemlerinin değeri hakkındaki daha geniş bir argümanı yansıtmaktadır. Anthropic, birçok kuruluşun kolayca otomatikleştirilemeyen eski araçlara güvendiğini ve bir insan gibi bilgisayarla etkileşim kurabilen bir modelin özel entegrasyonlara olan ihtiyacı azaltabileceğini belirtiyor.
Gerçek yazılım ortamlarını simüle eden OSWorld gibi kıyaslama testleri, Sonnet geliştirme sürecinin on altı ayı boyunca istikrarlı kazanımlar gösteriyor. Sonnet 4.6'nın ilk kullanıcıları, modelin artık karmaşık elektronik tablolarda gezinme veya çok adımlı web formlarını doldurma gibi görevleri insan yeterliliğine yakın bir seviyede yerine getirebildiğini, ancak yine de uzman kullanıcıların gerisinde kaldığını bildiriyor. Aynı zamanda şirket, anlık enjeksiyon saldırıları gibi riskleri kabul ediyor ve önceki sürümlere kıyasla daha iyi direnç sağladığını iddia ediyor.
Sonnet 4.6, Kod Kalitesini, Mantıksal Akıl Yürütmeyi ve Araç Kullanımını Geliştiriyor
Bilgisayar kullanımının ötesinde, Anthropic, kıyaslama testlerinde geniş çaplı iyileştirmeler bildirdi. Claude Code'da kullanıcılar, daha iyi bağlam okuma, daha az tekrarlama ve daha güvenilir çok adımlı yürütme gerekçeleriyle çoğu testte Sonnet 4.6'yı Sonnet 4.5'e tercih etti. Birçoğu ayrıca, aşırı mühendisliğe daha az eğilimli ve talimatları takip etmede daha tutarlı olduğu gerekçesiyle Opus 4.5'e göre de tercih etti. Genişletilmiş bağlam penceresi, modelin tüm kod tabanlarında veya büyük araştırma koleksiyonlarında çalışmasına olanak tanır ve Anthropic, modelin rakiplerinden daha iyi performans gösteren uzun vadeli bir yatırım stratejisi benimsediği Vending-Bench Arena simülasyonundaki performansını vurgular.
Şirket, ilk müşterilerin ön uç geliştirme, finansal analiz ve görsel tasarım kalitesi gibi alanlarda iyileşmeler gördüğünü belirtiyor. Sonnet 4.6 ayrıca, uyarlanabilir ve genişletilmiş düşünme modları, bağlam sıkıştırma, geliştirilmiş web arama işleme ve genişletilmiş araç kullanım yetenekleri de dahil olmak üzere Claude Geliştirici Platformu ve API'sinde güncellemelerle birlikte geliyor. Model artık ücretsiz katman da dahil olmak üzere tüm Claude planlarında mevcuttur ve Claude Cowork, Claude Code, API ve büyük bulut platformları aracılığıyla erişilebilir.
Feragatname
Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.
Yazar hakkında
Alisa, kendini işine adamış bir gazetecidir. MPost, kripto para birimi, sıfır bilgi kanıtları, yatırımlar ve geniş kapsamlı bilgi alanında uzmanlaşmıştır. Web3. Gelişmekte olan trendlere ve teknolojilere yönelik keskin bir bakış açısıyla, okuyucuları sürekli gelişen dijital finans ortamı hakkında bilgilendirmek ve etkileşime geçirmek için kapsamlı bir kapsam sunuyor.
Daha fazla haber
Alisa, kendini işine adamış bir gazetecidir. MPost, kripto para birimi, sıfır bilgi kanıtları, yatırımlar ve geniş kapsamlı bilgi alanında uzmanlaşmıştır. Web3. Gelişmekte olan trendlere ve teknolojilere yönelik keskin bir bakış açısıyla, okuyucuları sürekli gelişen dijital finans ortamı hakkında bilgilendirmek ve etkileşime geçirmek için kapsamlı bir kapsam sunuyor.