商業 新聞報導 科技
2026 年 2 月 18 日

Anthropic 發布 Claude Sonnet 4.6,效能接近 Opus,並擴展了長上下文處理能力

簡單來說

Anthropic 的 Claude Sonnet 4.6 進行了重大升級,以與先前版本相同的價格,為所有用戶帶來接近 Opus 級別的性能、更強大的編碼和計算機使用能力以及一百萬個標記的上下文視窗。

Anthropic 發布 Claude Sonnet 4.6,效能接近 Opus,並擴展了長上下文處理能力

人工智慧安全和研究公司 人類的 微軟宣布推出 Claude Sonnet 4.6,稱其為迄今為止功能最強大的 Sonnet 車型。此版本更新涵蓋編碼、電腦使用、長上下文推理、智能體規劃、知識工作和設計等多個方面,並在測試版中提供百萬級上下文視窗。對於免費版和專業版用戶,Sonnet 4.6 將成為 claude.ai 和 Claude Cowork 的預設模型,價格與 Sonnet 4.5 相同。

此次更新旨在將更高階的效能帶給更廣泛的用戶群。早期測試該型號的開發者報告稱,其在一致性、指令執行和上下文理解方面的改進,使其不僅優於 Sonnet 4.5,而且在許多情況下甚至優於 Anthropic 公司將於 2025 年底推出的更先進的 Opus 4.5 型號。以前需要 Opus 級系統才能完成的任務——尤其是那些與實際辦公室工作流程相關的任務——現在使用 Sonnet 4.6 即可輕鬆完成。該公司還強調,電腦使用能力有了顯著提升,而這正是早期 Sonnet 型號的短板所在。

Anthropic強調,該模型經過了全面的安全評估。內部研究人員表示,Sonnet 4.6展現出強大的安全性能,且未出現任何重大的高風險偏差跡象。該公司以此強化其在負責任的人工智慧開發方面的整體定位。

關於電腦使用能力的討論反映了一個更廣泛的論點,即能夠直接操作軟體而非透過應用程式介面(API)運作的人工智慧系統的價值所在。 Anthropic 指出,許多組織依賴難以自動化的傳統工具,而能夠像人一樣與電腦互動的模型可以減少對客製化整合的需求。 

諸如 OSWorld 等模擬真實軟體環境的基準測試顯示,Sonnet 在十六個月的開發過程中穩步提升。 Sonnet 4.6 的早期用戶報告稱,該模型現在能夠處理諸如瀏覽複雜電子表格或填寫多步驟網頁表單等任務,其水平已接近人類熟練程度,儘管仍不及專家用戶。同時,該公司也承認存在諸如提示注入攻擊之類的風險,並聲稱與早期版本相比,其防禦能力有所提高。

Sonnet 4.6 提升了程式碼品質、推理能力和工具使用效率

除了電腦應用之外,Anthropic 還報告稱,Sonnet 4.6 在各項基準測試中均取得了顯著改進。在 Claude Code 測試中,使用者在大多數測試中都更傾向於使用 Sonnet 4.6 而非 Sonnet 4.5,理由是 Sonnet 4.6 的上下文讀取能力更強、重複程式碼更少,並且多步驟執行更加可靠。許多使用者也更青睞 Sonnet 4.6 而非 Opus 4.5,認為 Sonnet 4.6 較不容易出現過度設計,並且在遵循指令方面更加一致。擴展的上下文視窗使該模型能夠處理整個程式碼庫或大型研究資料集,Anthropic 還重點介紹了 Sonnet 4.6 在自動販賣機競技場模擬中的出色表現,該模型採用的長期投資策略優於競爭對手。

該公司指出,早期客戶已體驗到前端開發、財務分析和視覺設計品質等方面的改進。 Sonnet 4.6 也對 Claude 開發者平台和 API 進行了全面更新,包括自適應和擴展思維模式、上下文壓縮、改進的網路搜尋處理以及擴展的工具使用功能。該模型現已適用於所有 Claude 套餐(包括免費套餐),可透過 Claude Cowork、Claude Code、API 和主流雲端平台存取。

免責聲明

在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。

關於作者

Alisa,一位熱心記者 MPost專注於加密貨幣、人工智慧、投資以及廣闊的領域 Web3。她對新興趨勢和技術有著敏銳的洞察力,提供全面的報道,讓讀者了解並吸引讀者了解不斷發展的數位金融領域。

更多文章
艾莉莎戴維森
艾莉莎戴維森

Alisa,一位熱心記者 MPost專注於加密貨幣、人工智慧、投資以及廣闊的領域 Web3。她對新興趨勢和技術有著敏銳的洞察力,提供全面的報道,讓讀者了解並吸引讀者了解不斷發展的數位金融領域。

Hot Stories
加入我們的時事通訊。
最新消息

Solana 風暴前的寧靜:圖表、鯨魚和鏈上訊號現在在說什麼

Solana 表現出色,受到日益普及的採用、機構興趣和關鍵合作夥伴關係的推動,但同時也面臨潛在的…

了解更多

2025 年 XNUMX 月加密貨幣:關鍵趨勢、轉變以及未來展望

2025 年 XNUMX 月,加密領域專注於加強核心基礎設施,以太坊正在為 Pectra 做準備…

了解更多
閱讀更多
閱讀更多
牛津大學人工智慧利用常規CT掃描,在72,000名患者中以86%的準確率檢測出早期心臟衰竭風險。
意見 科技
牛津大學人工智慧利用常規CT掃描,在72,000名患者中以86%的準確率檢測出早期心臟衰竭風險。
2026 年 4 月 10 日
Perplexity推出Plaid集成,將其人工智慧「電腦」代理轉變為個人理財中心
新聞報導 科技
Perplexity推出Plaid集成,將其人工智慧「電腦」代理轉變為個人理財中心
2026 年 4 月 10 日
Hack Seasons 坎城大會內幕:專家揭示從測試網到主網的營運經驗
黑客季節 面試課程 商業 Lifestyle
Hack Seasons 坎城大會內幕:專家揭示從測試網到主網的營運經驗
2026 年 4 月 10 日
DISCO突破酵素設計壁壘,創造出自然界中不存在的蛋白質。
意見 科技
DISCO突破酵素設計壁壘,創造出自然界中不存在的蛋白質。
2026 年 4 月 10 日
CRYPTOMERIA LABS PTE。 有限公司