Anthropic prezentuje Claude Sonnet 4.6, oferujący wydajność bliską wydajności Opus i rozszerzone możliwości obsługi długiego kontekstu
W skrócie
Wersja 4.6 Claude Sonnet firmy Anthropic wprowadza znaczącą aktualizację, która zapewnia wydajność zbliżoną do Opus, mocniejsze kodowanie i lepsze możliwości obsługi komputera, a także okno kontekstowe o wartości miliona tokenów dla wszystkich użytkowników w tej samej cenie, co poprzednia wersja.
Firma zajmująca się bezpieczeństwem i badaniami nad sztuczną inteligencją Antropiczny Firma ogłosiła wprowadzenie Claude Sonnet 4.6, określanego jako najpotężniejszy jak dotąd model Sonnet. Wersja ta jest oferowana jako pełna aktualizacja obejmująca kodowanie, obsługę komputera, wnioskowanie długokontekstowe, planowanie agentów, pracę z wiedzą i projektowanie, z oknem kontekstowym o wartości miliona tokenów dostępnym w wersji beta. Dla użytkowników planów Free i Pro Sonnet 4.6 staje się domyślnym modelem w claude.ai i Claude Cowork, a ceny pozostają niezmienione w stosunku do Sonnet 4.5.
Aktualizacja jest pozycjonowana jako krok w kierunku zapewnienia wyższej wydajności szerszemu gronu odbiorców. Deweloperzy testujący model na wczesnym etapie zgłaszali, że poprawa spójności, realizacji instrukcji i rozumienia kontekstu sprawiła, że jest on lepszy nie tylko od Sonnet 4.5, ale w wielu przypadkach od bardziej zaawansowanego modelu Opus 4.5 firmy Anthropic, który ma się pojawić pod koniec 2025 roku. Zadania, które wcześniej wymagały systemu klasy Opus – zwłaszcza te powiązane z rzeczywistymi procesami pracy w biurze – są teraz prezentowane jako możliwe do wykonania dzięki Sonnet 4.6. Firma podkreśla również znaczący wzrost możliwości korzystania z komputera, w obszarze, w którym wcześniejsze modele Sonnet pozostawały w tyle.
Firma Anthropic podkreśla, że model przeszedł gruntowne oceny bezpieczeństwa. Wewnętrzni badacze opisali Sonnet 4.6 jako wykazujący silne zachowania w zakresie bezpieczeństwa i brak istotnych oznak niezgodności o wysokim ryzyku, co firma wykorzystuje do wzmocnienia swojego szerszego stanowiska w zakresie odpowiedzialnego rozwoju sztucznej inteligencji.
Dyskusja na temat umiejętności obsługi komputera odzwierciedla szerszy argument dotyczący wartości systemów sztucznej inteligencji (AI), które mogą obsługiwać oprogramowanie bezpośrednio, a nie za pośrednictwem interfejsów API. Anthropic zauważa, że wiele organizacji korzysta ze starszych narzędzi, których nie da się łatwo zautomatyzować, a model zdolny do interakcji z komputerem jak człowiek może zmniejszyć potrzebę niestandardowych integracji.
Testy porównawcze, takie jak OSWorld, symulujące rzeczywiste środowiska programistyczne, wykazują stały wzrost w ciągu szesnastu miesięcy rozwoju Sonnet. Wcześni użytkownicy Sonnet 4.6 zgłaszają, że model ten radzi sobie teraz z zadaniami takimi jak nawigacja po złożonych arkuszach kalkulacyjnych czy wypełnianie wieloetapowych formularzy internetowych na poziomie zbliżonym do poziomu biegłości człowieka, choć nadal ustępuje doświadczonym użytkownikom. Jednocześnie firma przyznaje, że dostrzega zagrożenia, takie jak ataki typu prompt-injection, i twierdzi, że oferuje lepszą odporność w porównaniu z wcześniejszymi wersjami.
Sonet 4.6 poprawia jakość kodu, rozumowanie i wykorzystanie narzędzi
Poza wykorzystaniem komputera, Anthropic odnotowuje znaczną poprawę w testach porównawczych. W Claude Code użytkownicy preferowali Sonnet 4.6 w porównaniu z Sonnet 4.5 w większości testów, wskazując na lepsze odczytywanie kontekstu, mniejszą duplikację i bardziej niezawodne wykonywanie wieloetapowe. Wielu preferowało go również w porównaniu z Opus 4.5, opisując go jako mniej podatny na nadmierną inżynierię i bardziej konsekwentny w wykonywaniu instrukcji. Rozszerzone okno kontekstowe pozwala modelowi działać w całych bazach kodu lub dużych zbiorach badawczych, a Anthropic podkreśla jego wydajność w symulacji Vending‑Bench Arena, gdzie model przyjął długoterminową strategię inwestycyjną, która przewyższyła wyniki konkurencji.
Firma zauważa, że pierwsi klienci zauważyli poprawę w takich obszarach jak tworzenie front-endu, analiza finansowa i jakość projektu wizualnego. Sonnet 4.6 wprowadza również aktualizacje platformy i interfejsu API Claude Developer Platform, w tym adaptacyjne i rozszerzone tryby myślenia, zagęszczanie kontekstu, ulepszone przetwarzanie wyszukiwania w sieci oraz rozszerzone możliwości korzystania z narzędzi. Model ten jest teraz dostępny we wszystkich planach Claude, w tym w planie darmowym, i można uzyskać do niego dostęp za pośrednictwem Claude Cowork, Claude Code, interfejsu API oraz głównych platform chmurowych.
Zastrzeżenie
Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.
O autorze
Alisa, oddana dziennikarka w MPost, specjalizuje się w kryptowalutach, dowodach wiedzy zerowej, inwestycjach i ekspansywnej dziedzinie Web3. Ze szczególnym uwzględnieniem pojawiających się trendów i technologii zapewnia wszechstronne informacje, aby informować czytelników i angażować ich w stale zmieniający się krajobraz finansów cyfrowych.
Więcej artykułów
Alisa, oddana dziennikarka w MPost, specjalizuje się w kryptowalutach, dowodach wiedzy zerowej, inwestycjach i ekspansywnej dziedzinie Web3. Ze szczególnym uwzględnieniem pojawiających się trendów i technologii zapewnia wszechstronne informacje, aby informować czytelników i angażować ich w stale zmieniający się krajobraz finansów cyfrowych.