Anthropic julkistaa Claude Sonnet 4.6:n, joka tarjoaa lähes Opus-tason suorituskyvyn ja laajennetut pitkän kontekstin ominaisuudet
Lyhyesti
Anthropicin Claude Sonnet 4.6 esittelee merkittävän päivityksen, joka tuo lähes Opus-tason suorituskyvyn, vahvemmat koodaus- ja tietokoneen käyttöominaisuudet sekä miljoonan merkin konteksti-ikkunan kaikille käyttäjille samaan hintaan kuin edellinen versio.
Tekoälyn turvallisuus- ja tutkimusyritys Antropinen ilmoitti esitelleensä Claude Sonnet 4.6:n, jota kuvaillaan tähän mennessä tehokkaimmaksi Sonnet-mallikseen. Julkaisu on täydellinen päivitys koodaukseen, tietokoneen käyttöön, pitkän kontekstin päättelyyn, agenttisuunnitteluun, tietotyöhön ja suunnitteluun, ja beetaversiossa on saatavilla miljoonan tunnuksen konteksti-ikkuna. Ilmais- ja Pro-tilausten käyttäjille Sonnet 4.6:sta tulee claude.ai:n ja Claude Coworkin oletusmalli, ja hinnoittelu pysyy samana Sonnet 4.5:een verrattuna.
Päivitys on asemoitu askeleeksi, joka tuo huippuluokan suorituskyvyn laajemmalle yleisölle. Mallia testanneet kehittäjät raportoivat, että parannukset johdonmukaisuudessa, ohjeiden seurannassa ja kontekstuaalisessa ymmärryksessä tekivät siitä paremman paitsi Sonnet 4.5:een verrattuna, myös monissa tapauksissa Anthropicin edistyneempään Opus 4.5 -malliin, joka julkaistaan vuoden 2025 lopulla. Tehtävät, jotka aiemmin vaativat Opus-luokan järjestelmää – erityisesti tosielämän toimistotyönkulkuihin liittyvät tehtävät – esitetään nyt saavutettavissa Sonnet 4.6:lla. Yritys korostaa myös huomattavaa tietokoneen käyttöominaisuuksien parantumista, alueella, jolla aiemmat Sonnet-mallit jäivät jälkeen.
Anthropic korostaa, että mallille tehtiin laajat turvallisuusarvioinnit. Sisäiset tutkijat kuvailivat Sonnet 4.6:n osoittavan vahvoja turvallisuusominaisuuksia eikä merkittäviä merkkejä korkean panoksen epäsuhdasta, mitä yritys käyttää vahvistaakseen laajempaa asemaansa vastuullisen tekoälykehityksen suhteen.
Keskustelu tietokoneen käyttötaidoista heijastelee laajempaa argumenttia tekoälyjärjestelmien arvosta, jotka pystyvät käyttämään ohjelmistoja suoraan API-rajapintojen sijaan. Anthropic huomauttaa, että monet organisaatiot luottavat vanhoihin työkaluihin, joita ei voida automatisoida helposti, ja että malli, joka pystyy vuorovaikuttamaan tietokoneen kanssa kuten ihminen, voi vähentää räätälöityjen integraatioiden tarvetta.
Testit, kuten OSWorld, jotka simuloivat todellisia ohjelmistoympäristöjä, osoittavat tasaista kehitystä Sonnetin kuudentoista kuukauden kehityksen aikana. Sonnet 4.6:n varhaiset käyttäjät raportoivat, että malli pystyy nyt käsittelemään tehtäviä, kuten monimutkaisten laskentataulukoiden selaamista tai monivaiheisten verkkolomakkeiden täyttämistä, lähes ihmisen taitotasoa vastaavalla tasolla, vaikka se jääkin edelleen jälkeen kokeneista käyttäjistä. Samalla yritys tunnustaa riskit, kuten pikainjektiohyökkäykset, ja väittää paremman vastustuskyvyn aiempiin versioihin verrattuna.
Sonnet 4.6 parantaa koodin laatua, päättelykykyä ja työkalujen käyttöä
Tietokoneen käytön lisäksi Anthropic raportoi laajoista parannuksista eri vertailuarvoissa. Claude Codessa käyttäjät suosivat Sonnet 4.6:ta useimmissa testeissä Sonnet 4.5:een verrattuna mainiten paremman kontekstin lukemisen, vähentyneen päällekkäisyyden ja luotettavamman monivaiheisen suorituksen. Monet suosivat sitä myös Opus 4.5:een verrattuna kuvaillen sitä vähemmän alttiiksi ylisuunnittelulle ja johdonmukaisemmaksi ohjeiden noudattamisessa. Laajennettu konteksti-ikkuna mahdollistaa mallin työskentelyn kokonaisten koodikantojen tai suurten tutkimuskokoelmien kanssa, ja Anthropic korostaa suorituskykyään Vending-Bench Arena -simulaatiossa, jossa malli käytti kilpailijoitaan paremmin menestynyttä pitkän aikavälin sijoitusstrategiaa.
Yritys huomauttaa, että alkuvaiheen asiakkaat ovat nähneet parannuksia esimerkiksi käyttöliittymäkehityksessä, talousanalyysissä ja visuaalisen suunnittelun laadussa. Sonnet 4.6 sisältää myös päivityksiä Claude-kehittäjäalustalle ja -rajapintaan, mukaan lukien mukautuvat ja laajennetut ajattelutilat, kontekstin tiivistäminen, parannettu verkkohakujen käsittely ja laajennetut työkalujen käyttöominaisuudet. Malli on nyt saatavilla kaikissa Claude-sopimuksissa, mukaan lukien ilmainen taso, ja siihen pääsee käsiksi Claude Coworkin, Claude Coden, API:n ja tärkeimpien pilvialustojen kautta.
Vastuun kieltäminen
Mukaisesti Luottamusprojektin ohjeetHuomaa, että tällä sivulla annettuja tietoja ei ole tarkoitettu eikä niitä tule tulkita oikeudellisiksi, verotukselliseksi, sijoitus-, rahoitus- tai minkään muun muodon neuvoiksi. On tärkeää sijoittaa vain sen verran, mitä sinulla on varaa menettää, ja pyytää riippumatonta talousneuvontaa, jos sinulla on epäilyksiä. Lisätietoja saat käyttöehdoista sekä myöntäjän tai mainostajan tarjoamista ohje- ja tukisivuista. MetaversePost on sitoutunut tarkkaan, puolueettomaan raportointiin, mutta markkinaolosuhteet voivat muuttua ilman erillistä ilmoitusta.
Author
Alisa, omistautunut toimittaja MPost, erikoistunut kryptoon, tekoälyyn, sijoituksiin ja laajaan maailmaan Web3. Hän tarkkailee tarkasti nousevia trendejä ja teknologioita, ja hän tarjoaa kattavan kattavuuden tiedottaakseen ja saadakseen lukijat mukaan digitaalisen rahoituksen jatkuvasti kehittyvään maisemaan.
lisää artikkeleita
Alisa, omistautunut toimittaja MPost, erikoistunut kryptoon, tekoälyyn, sijoituksiin ja laajaan maailmaan Web3. Hän tarkkailee tarkasti nousevia trendejä ja teknologioita, ja hän tarjoaa kattavan kattavuuden tiedottaakseen ja saadakseen lukijat mukaan digitaalisen rahoituksen jatkuvasti kehittyvään maisemaan.



