Anthropic predstavuje Claude Sonnet 4.6, prinášajúci výkon takmer ako opus a rozšírené možnosti dlhodobého kontextu
Stručne
Verzia 4.6 od Anthropic prináša zásadnú aktualizáciu, ktorá prináša výkon blízky Opusu, silnejšie kódovacie a počítačové schopnosti a kontextové okno s miliónom tokenov pre všetkých používateľov za rovnakú cenu ako predchádzajúca verzia.
Spoločnosť pre bezpečnosť a výskum umelej inteligencie Antropický oznámila, že predstavila Claude Sonnet 4.6, ktorý je označovaný za jej doteraz najvýkonnejší model Sonnet. Toto vydanie je koncipované ako kompletná aktualizácia v oblasti kódovania, používania počítača, dlhodobého kontextového uvažovania, plánovania agentov, práce so znalosťami a dizajnu s kontextovým oknom s kapacitou jedného milióna tokenov dostupným v beta verzii. Pre používateľov s plánmi Free a Pro sa Sonnet 4.6 stáva predvoleným modelom v claude.ai a Claude Cowork, pričom ceny zostali nezmenené oproti Sonnet 4.5.
Táto aktualizácia je navrhnutá ako krok, ktorý prináša vyšší výkon širšiemu publiku. Vývojári, ktorí model testovali už skôr, uviedli, že zlepšenia v konzistencii, sledovaní pokynov a porozumení kontextu ho robia výhodnejším nielen pred Sonnet 4.5, ale v mnohých prípadoch aj pred pokročilejším modelom Opus 4.5 od spoločnosti Anthropic z konca roka 2025. Úlohy, ktoré predtým vyžadovali systém triedy Opus – najmä tie, ktoré boli viazané na reálne kancelárske pracovné postupy – sú teraz s Sonnet 4.6 prezentované ako dosiahnuteľné. Spoločnosť tiež zdôrazňuje výrazný skok v možnostiach používania počítača, čo je oblasť, v ktorej predchádzajúce modely Sonnet zaostávali.
Spoločnosť Anthropic zdôrazňuje, že model prešiel rozsiahlymi bezpečnostnými hodnoteniami. Interní výskumníci opísali Sonnet 4.6 ako model, ktorý preukazuje silné bezpečnostné správanie a žiadne závažné známky nesúladu s vysokými stávkami, čo spoločnosť používa na posilnenie svojho širšieho postavenia v oblasti zodpovedného vývoja umelej inteligencie.
Diskusia o schopnostiach používať počítač odráža širší argument o hodnote systémov umelej inteligencie, ktoré dokážu ovládať softvér priamo, a nie prostredníctvom API. Anthropic poznamenáva, že mnohé organizácie sa spoliehajú na staršie nástroje, ktoré sa nedajú ľahko automatizovať, a že model schopný interagovať s počítačom ako človek môže znížiť potrebu vlastných integrácií.
Benchmarky ako OSWorld, ktoré simulujú reálne softvérové prostredia, vykazujú stabilný nárast počas šestnástich mesiacov vývoja Sonnetu. Prví používatelia Sonnetu 4.6 uvádzajú, že model teraz dokáže zvládnuť úlohy, ako je navigácia v zložitých tabuľkách alebo vypĺňanie viackrokových webových formulárov, na úrovni blížiacej sa ľudskej zdatnosti, aj keď stále zaostáva za expertnými používateľmi. Zároveň spoločnosť uznáva riziká, ako sú útoky typu prompt-injection, a tvrdí, že má lepšiu odolnosť v porovnaní s predchádzajúcimi verziami.
Sonnet 4.6 zlepšuje kvalitu kódu, uvažovanie a používanie nástrojov
Okrem používania počítača spoločnosť Anthropic hlási rozsiahle zlepšenia v rámci benchmarkov. V Claude Code používatelia vo väčšine testov uprednostnili Sonnet 4.6 pred Sonnet 4.5, pričom uviedli lepšie čítanie kontextu, zníženú duplikáciu a spoľahlivejšie viackrokové vykonávanie. Mnohí ho tiež uprednostnili pred Opusom 4.5 a opísali ho ako menej náchylný na prepracovanie a konzistentnejší v dodržiavaní pokynov. Rozšírené kontextové okno umožňuje modelu pracovať naprieč celými kódovými základňami alebo rozsiahlymi výskumnými kolekciami a Anthropic vyzdvihuje jeho výkon v simulácii Vending-Bench Arena, kde model prijal dlhodobú investičnú stratégiu, ktorá prekonala konkurenciu.
Spoločnosť poznamenáva, že prví zákazníci zaznamenali zlepšenia v oblastiach, ako je vývoj frontendu, finančná analýza a kvalita vizuálneho dizajnu. Sonnet 4.6 tiež prichádza s aktualizáciami v rámci platformy Claude Developer Platform a API, vrátane adaptívnych a rozšírených režimov myslenia, zhutnenia kontextu, vylepšeného spracovania webového vyhľadávania a rozšírených možností používania nástrojov. Model je teraz k dispozícii vo všetkých plánoch Claude vrátane bezplatnej úrovne a je prístupný prostredníctvom Claude Cowork, Claude Code, API a hlavných cloudových platforiem.
Disclaimer
V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.
O autorovi
Alisa, oddaná novinárka v MPost, sa špecializuje na kryptomeny, dôkazy s nulovými znalosťami, investície a rozsiahlu oblasť Web3. So záujmom o nové trendy a technológie poskytuje komplexné pokrytie s cieľom informovať a zapojiť čitateľov do neustále sa vyvíjajúceho prostredia digitálnych financií.
Ďalšie články
Alisa, oddaná novinárka v MPost, sa špecializuje na kryptomeny, dôkazy s nulovými znalosťami, investície a rozsiahlu oblasť Web3. So záujmom o nové trendy a technológie poskytuje komplexné pokrytie s cieľom informovať a zapojiť čitateľov do neustále sa vyvíjajúceho prostredia digitálnych financií.



