Anthropic Memperkenalkan Claude Sonnet 4.6, Menyampaikan Prestasi Near-Opus dan Keupayaan Konteks Panjang yang Diperluas
Secara ringkas
Claude Sonnet 4.6 daripada Anthropic memperkenalkan naik taraf utama yang membawakan prestasi hampir tahap Opus, kebolehan pengekodan dan penggunaan komputer yang lebih mantap, serta tetingkap konteks satu juta token kepada semua pengguna pada harga yang sama seperti versi sebelumnya.
Syarikat keselamatan dan penyelidikan AI Antropik mengumumkan bahawa ia telah memperkenalkan Claude Sonnet 4.6, yang digambarkan sebagai model Sonnet yang paling berkemampuan setakat ini. Keluaran ini dirangka sebagai peningkatan penuh merentasi pengekodan, penggunaan komputer, penaakulan konteks panjang, perancangan ejen, kerja pengetahuan dan reka bentuk, dengan tetingkap konteks satu juta token tersedia dalam versi beta. Bagi pengguna pada pelan Percuma dan Pro, Sonnet 4.6 menjadi model lalai dalam claude.ai dan Claude Cowork, dengan harga tidak berubah daripada Sonnet 4.5.
Kemas kini ini diletakkan sebagai langkah yang membawa prestasi yang lebih tinggi kepada khalayak yang lebih luas. Pembangun yang menguji model tersebut pada awal melaporkan bahawa penambahbaikan dalam konsistensi, pematuhan arahan dan pemahaman kontekstual menjadikannya lebih baik bukan sahaja berbanding Sonnet 4.5 tetapi, dalam banyak kes, berbanding model Opus 4.5 Anthropic yang lebih canggih dari akhir tahun 2025. Tugasan yang sebelum ini memerlukan sistem kelas Opus—terutamanya yang berkaitan dengan aliran kerja pejabat dunia sebenar—kini dibentangkan sebagai boleh dicapai dengan Sonnet 4.6. Syarikat itu juga mengetengahkan lonjakan ketara dalam keupayaan penggunaan komputer, satu bidang di mana model Sonnet terdahulu ketinggalan.
Anthropic menekankan bahawa model tersebut telah menjalani penilaian keselamatan yang meluas. Penyelidik dalaman menyifatkan Sonnet 4.6 sebagai menunjukkan tingkah laku keselamatan yang kukuh dan tiada tanda-tanda utama ketidakselarasan berisiko tinggi, satu perkara yang digunakan oleh syarikat untuk mengukuhkan kedudukannya yang lebih luas di sekitar pembangunan AI yang bertanggungjawab.
Perbincangan tentang kebolehan penggunaan komputer mencerminkan hujah yang lebih luas tentang nilai sistem AI yang boleh mengendalikan perisian secara langsung dan bukannya melalui API. Anthropic menyatakan bahawa banyak organisasi bergantung pada alat legasi yang tidak boleh diautomasikan dengan mudah, dan model yang mampu berinteraksi dengan komputer seperti manusia boleh mengurangkan keperluan untuk integrasi tersuai.
Penanda aras seperti OSWorld, yang mensimulasikan persekitaran perisian sebenar, menunjukkan peningkatan yang stabil sepanjang enam belas bulan pembangunan Sonnet. Pengguna awal Sonnet 4.6 melaporkan bahawa model tersebut kini boleh mengendalikan tugas seperti menavigasi hamparan kompleks atau melengkapkan borang web berbilang langkah pada tahap yang menghampiri kecekapan manusia, walaupun ia masih ketinggalan di belakang pengguna pakar. Pada masa yang sama, syarikat itu mengakui risiko seperti serangan suntikan segera dan mendakwa rintangan yang lebih baik berbanding versi terdahulu.
Sonnet 4.6 Memajukan Kualiti Kod, Penaakulan dan Penggunaan Alat
Selain penggunaan komputer, Anthropic melaporkan penambahbaikan meluas merentasi penanda aras. Dalam Claude Code, pengguna lebih menyukai Sonnet 4.6 berbanding Sonnet 4.5 dalam kebanyakan ujian, dengan menyatakan bacaan konteks yang lebih baik, pengurangan duplikasi dan pelaksanaan berbilang langkah yang lebih andal. Ramai juga yang menyukainya berbanding Opus 4.5, menggambarkannya sebagai kurang terdedah kepada kejuruteraan berlebihan dan lebih konsisten dalam mengikuti arahan. Tetingkap konteks yang diperluas membolehkan model berfungsi merentasi keseluruhan pangkalan kod atau koleksi penyelidikan yang besar, dan Anthropic mengetengahkan prestasinya dalam simulasi Vending‑Bench Arena, di mana model tersebut menggunakan strategi pelaburan jangka panjang yang mengatasi pesaing.
Syarikat itu menyatakan bahawa pelanggan awal telah melihat peningkatan dalam bidang seperti pembangunan bahagian hadapan, analisis kewangan dan kualiti reka bentuk visual. Sonnet 4.6 juga tiba dengan kemas kini merentasi Platform dan API Pembangun Claude, termasuk mod pemikiran adaptif dan lanjutan, pemadatan konteks, pemprosesan carian web yang lebih baik dan keupayaan penggunaan alat yang diperluas. Model ini kini tersedia merentasi semua pelan Claude, termasuk peringkat percuma dan boleh diakses melalui Claude Cowork, Claude Code, API dan platform awan utama.
Penafian
Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.
Tentang Pengarang
Alisa, seorang wartawan yang berdedikasi di MPost, pakar dalam mata wang kripto, bukti pengetahuan sifar, pelaburan dan alam luas Web3. Dengan memerhatikan trend dan teknologi yang sedang muncul, beliau menyampaikan liputan komprehensif untuk memaklumkan dan melibatkan pembaca dalam landskap kewangan digital yang sentiasa berkembang.
lebih banyak artikel
Alisa, seorang wartawan yang berdedikasi di MPost, pakar dalam mata wang kripto, bukti pengetahuan sifar, pelaburan dan alam luas Web3. Dengan memerhatikan trend dan teknologi yang sedang muncul, beliau menyampaikan liputan komprehensif untuk memaklumkan dan melibatkan pembaca dalam landskap kewangan digital yang sentiasa berkembang.