Anthropic predstavlja Claude Sonnet 4.6, ki ponuja skoraj opusno zmogljivost in razširjene zmogljivosti za daljše obdobje
Na kratko
Anthropicov Claude Sonnet 4.6 predstavlja veliko nadgradnjo, ki vsem uporabnikom prinaša zmogljivost skoraj na ravni Opusa, močnejše kodiranje in uporabo računalnika ter kontekstno okno z milijonom žetonov po isti ceni kot prejšnja različica.
Podjetje za varnost in raziskave umetne inteligence Antropično je objavil, da je predstavil Claude Sonnet 4.6, ki je opisan kot njihov doslej najzmogljivejši model Sonnet. Izdaja je zasnovana kot popolna nadgradnja kodiranja, uporabe računalnika, dolgoročnega kontekstnega sklepanja, načrtovanja agentov, dela z znanjem in oblikovanja, z oknom konteksta z milijonom žetonov, ki je na voljo v beta različici. Za uporabnike z brezplačnim in profesionalnim paketom Sonnet 4.6 postane privzeti model v claude.ai in Claude Cowork, cene pa se v primerjavi s Sonnet 4.5 ne spremenijo.
Posodobitev je zasnovana kot korak, ki širšemu občinstvu prinaša višjo zmogljivost. Razvijalci, ki so model testirali že zgodaj, so poročali, da so izboljšave v doslednosti, sledenju navodilom in kontekstualnem razumevanju naredile ta model boljši ne le pred Sonnetom 4.5, temveč v mnogih primerih tudi pred naprednejšim modelom Opus 4.5 podjetja Anthropic iz konca leta 2025. Naloge, ki so prej zahtevale sistem razreda Opus – zlasti tiste, ki so bile povezane z resničnimi pisarniškimi delovnimi procesi – so zdaj s Sonnetom 4.6 predstavljene kot dosegljive. Podjetje poudarja tudi opazen skok v zmogljivostih uporabe računalnika, področje, kjer so prejšnji modeli Sonnet zaostajali.
Anthropic poudarja, da je bil model podvržen obsežnim varnostnim ocenam. Notranji raziskovalci so opisali Sonnet 4.6 kot dokaz močnega varnostnega vedenja in brez večjih znakov neusklajenosti z visokimi vložki, kar podjetje uporablja za okrepitev svojega širšega stališča glede odgovornega razvoja umetne inteligence.
Razprava o sposobnostih uporabe računalnika odraža širši argument o vrednosti sistemov umetne inteligence, ki lahko upravljajo programsko opremo neposredno in ne prek API-jev. Anthropic ugotavlja, da se številne organizacije zanašajo na starejša orodja, ki jih ni mogoče enostavno avtomatizirati, in da lahko model, ki je sposoben interakcije z računalnikom kot človek, zmanjša potrebo po integracijah po meri.
Primerjalni testi, kot je OSWorld, ki simulirajo resnična programska okolja, kažejo stalen napredek v šestnajstih mesecih razvoja Sonneta. Zgodnji uporabniki Sonneta 4.6 poročajo, da lahko model zdaj obvladuje naloge, kot so navigacija po kompleksnih preglednicah ali izpolnjevanje večstopenjskih spletnih obrazcev, na ravni, ki se približuje človeški usposobljenosti, čeprav še vedno zaostaja za izkušenimi uporabniki. Hkrati podjetje priznava tveganja, kot so napadi s prompt-injection, in trdi, da je odpornost v primerjavi s prejšnjimi različicami izboljšana.
Sonnet 4.6 izboljšuje kakovost kode, sklepanje in uporabo orodij
Poleg uporabe računalnika Anthropic poroča o številnih izboljšavah v vseh primerjalnih testih. V Claude Code so uporabniki v večini testov dali prednost Sonnetu 4.6 pred Sonnetom 4.5, pri čemer so navedli boljše branje konteksta, manj podvajanja in zanesljivejše izvajanje v več korakih. Mnogi so mu dali prednost tudi pred Opusom 4.5, saj so ga opisali kot manj nagnjenega k pretiranemu inženiringu in bolj doslednega pri sledenju navodilom. Razširjeno kontekstno okno omogoča modelu, da deluje v celotnih kodnih bazah ali velikih raziskovalnih zbirkah, Anthropic pa poudarja njegovo učinkovitost v simulaciji Vending-Bench Arena, kjer je model sprejel dolgoročno naložbeno strategijo, ki je prekašala konkurenco.
Podjetje ugotavlja, da so zgodnje stranke opazile izboljšave na področjih, kot so razvoj frontenda, finančna analiza in kakovost vizualnega oblikovanja. Sonnet 4.6 prihaja tudi s posodobitvami platforme za razvijalce Claude in API-ja, vključno s prilagodljivimi in razširjenimi načini razmišljanja, zgoščevanjem konteksta, izboljšano obdelavo spletnega iskanja in razširjenimi zmogljivostmi uporabe orodij. Model je zdaj na voljo v vseh paketih Claude, vključno z brezplačnim paketom, in je dostopen prek Claude Cowork, Claude Code, API-ja in večjih platform v oblaku.
Zavrnitev odgovornosti
V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.
O avtorju
Alisa, predana novinarka pri MPost, specializiran za kriptovalute, umetno inteligenco, naložbe in široko področje Web3. Z ostrim očesom za nastajajoče trende in tehnologije zagotavlja celovito pokritost za informiranje in vključevanje bralcev v nenehno razvijajočo se pokrajino digitalnih financ.
več člankov
Alisa, predana novinarka pri MPost, specializiran za kriptovalute, umetno inteligenco, naložbe in široko področje Web3. Z ostrim očesom za nastajajoče trende in tehnologije zagotavlja celovito pokritost za informiranje in vključevanje bralcev v nenehno razvijajočo se pokrajino digitalnih financ.



