Az Anthropic bemutatja a Claude Sonnet 4.6-ot, amely közel Opus teljesítményt és kibővített hosszú kontextusú képességeket kínál.
Röviden
Az Anthropic Claude Sonnet 4.6-os verziója egy jelentős frissítést vezet be, amely közel Opus-szintű teljesítményt, jobb kódolási és számítógép-használati képességeket, valamint egymillió tokenes kontextusablakot biztosít minden felhasználó számára az előző verzió áráért.
MI biztonsági és kutató cég Antropikus bejelentette, hogy bemutatta a Claude Sonnet 4.6-ot, amelyet a mai napig a legképzettebb Sonnet modelljeként tartanak számon. A kiadás a kódolás, a számítógép-használat, a hosszú kontextusú gondolkodás, az ágenstervezés, a tudásalapú munka és a tervezés teljes frissítését jelenti, egymillió tokenes kontextusablakkal, amely béta verzióban érhető el. Az ingyenes és a Pro csomaggal rendelkező felhasználók számára a Sonnet 4.6 lesz az alapértelmezett modell a claude.ai-ban és a Claude Cowork-ben, az ár változatlan marad a Sonnet 4.5-höz képest.
A frissítés egy olyan lépésként van pozícionálva, amely szélesebb közönség számára teszi elérhetővé a magasabb kategóriájú teljesítményt. A modellt korábban tesztelő fejlesztők arról számoltak be, hogy a konzisztencia, az utasítások követése és a kontextuális megértés terén elért javulások nemcsak a Sonnet 4.5-höz, hanem sok esetben az Anthropic 2025 végétől megjelenő, fejlettebb Opus 4.5 modelljéhez képest is előnyösebbé tették. Azok a feladatok, amelyek korábban Opus-osztályú rendszert igényeltek – különösen a valós irodai munkafolyamatokhoz kapcsolódóak –, mostantól elérhetőek a Sonnet 4.6-tal. A vállalat kiemeli a számítógép-használati képességek jelentős ugrását is, egy olyan területet, ahol a korábbi Sonnet modellek lemaradtak.
Az Anthropic hangsúlyozza, hogy a modell átfogó biztonsági értékeléseken esett át. Belső kutatók a Sonnet 4.6-ot erős biztonsági viselkedésként írták le, és nem mutattak jelentős jeleket a nagy téttel járó eltérésekre, amivel a vállalat megerősíti a felelős mesterséges intelligencia fejlesztésével kapcsolatos szélesebb körű pozícióját.
A számítógép-használati képességekről szóló vita egy tágabb vitát tükröz a mesterséges intelligencia által működtetett rendszerek értékéről, amelyek közvetlenül, nem pedig API-kon keresztül képesek szoftvereket működtetni. Az Anthropic megjegyzi, hogy sok szervezet olyan hagyományos eszközökre támaszkodik, amelyeket nem lehet könnyen automatizálni, és hogy egy olyan modell, amely képes az emberhez hasonlóan kommunikálni a számítógéppel, csökkentheti az egyedi integrációk szükségességét.
Az olyan benchmarkok, mint az OSWorld, amelyek valós szoftverkörnyezeteket szimulálnak, a Sonnet fejlesztésének tizenhat hónapja alatt folyamatos javulást mutatnak. A Sonnet 4.6 korai felhasználói arról számoltak be, hogy a modell most már képes olyan feladatokat kezelni, mint az összetett táblázatok navigálása vagy a többlépéses webes űrlapok kitöltése, az emberi jártasság szintjét megközelítő szinten, még akkor is, ha még mindig elmarad a szakértő felhasználók szintjétől. A vállalat ugyanakkor elismeri az olyan kockázatokat, mint az azonnali injekciós támadások, és a korábbi verziókhoz képest jobb ellenállást állít.
A Sonnet 4.6 fejleszti a kódminőséget, az érvelést és az eszközhasználatot
A számítógépes használaton túl az Anthropic széleskörű javulásról számol be a benchmarkokban. A Claude Code tesztben a felhasználók a legtöbb tesztben a Sonnet 4.6-ot részesítették előnyben a Sonnet 4.5-tel szemben, jobb kontextusolvasást, csökkent duplikációt és megbízhatóbb többlépéses végrehajtást említve. Sokan az Opus 4.5-tel szemben is előnyben részesítették, mivel kevésbé hajlamos a túlmérnöki munkára és következetesebb az utasítások követésében. A kibővített kontextusablak lehetővé teszi a modell számára, hogy teljes kódbázisokon vagy nagy kutatási gyűjteményeken is működjön, az Anthropic pedig kiemeli a Vending-Bench Arena szimulációban nyújtott teljesítményét, ahol a modell egy hosszú távú befektetési stratégiát alkalmazott, amely felülmúlta a versenytársakat.
A vállalat megjegyzi, hogy a korai ügyfelek javulást tapasztaltak olyan területeken, mint a frontend fejlesztés, a pénzügyi elemzés és a vizuális design minősége. A Sonnet 4.6 frissítéseket is tartalmaz a Claude fejlesztői platformon és API-ban, beleértve az adaptív és kiterjesztett gondolkodási módokat, a kontextustömörítést, a továbbfejlesztett webes keresési feldolgozást és a kibővített eszközhasználati lehetőségeket. A modell mostantól minden Claude csomagban elérhető, beleértve az ingyenes csomagot is, és elérhető a Claude Cowork, a Claude Code, az API és a főbb felhőplatformokon keresztül.
Jogi nyilatkozat
Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.
A szerzőről
Alisa, a The MPost, a kriptovalutákra, a nulla tudásalapú bizonyítékokra, a befektetésekre és a Web3. Élénk szemmel figyeli a feltörekvő trendeket és technológiákat, ezért átfogó tájékoztatást nyújt, hogy tájékoztassa és bevonja olvasóit a digitális pénzügyek folyamatosan fejlődő világába.
További cikkek
Alisa, a The MPost, a kriptovalutákra, a nulla tudásalapú bizonyítékokra, a befektetésekre és a Web3. Élénk szemmel figyeli a feltörekvő trendeket és technológiákat, ezért átfogó tájékoztatást nyújt, hogy tájékoztassa és bevonja olvasóit a digitális pénzügyek folyamatosan fejlődő világába.