Anthropic представя Claude Sonnet 4.6, предлагащ изпълнение, близко до опус, и разширени възможности за дългосрочен контекст
Накратко
Claude Sonnet 4.6 на Anthropic въвежда основно подобрение, което осигурява производителност, близка до нивото на Opus, по-силно кодиране и възможности за работа с компютър, както и контекстен прозорец с един милион токена за всички потребители на същата цена като предишната версия.
Компания за безопасност и изследвания в областта на изкуствения интелект Антропен обяви, че е представила Claude Sonnet 4.6, описан като най-способния модел Sonnet до момента. Изданието е оформено като пълно подобрение на кодирането, използването на компютър, дългосрочното контекстно разсъждение, планирането на агенти, работата със знания и дизайна, с контекстен прозорец от един милион токена, наличен в бета версия. За потребителите с безплатни и професионални планове, Sonnet 4.6 става моделът по подразбиране в claude.ai и Claude Cowork, като цените остават непроменени спрямо Sonnet 4.5.
Актуализацията е позиционирана като стъпка, която осигурява по-висока производителност на по-широка аудитория. Разработчиците, тестващи модела в началото, съобщиха, че подобренията в последователността, следването на инструкциите и контекстуалното разбиране го правят за предпочитане не само пред Sonnet 4.5, но в много случаи и пред по-усъвършенствания модел Opus 4.5 на Anthropic от края на 2025 г. Задачи, които преди изискваха система от клас Opus – особено тези, свързани с реални офис работни потоци – сега са представени като постижими със Sonnet 4.6. Компанията също така подчертава забележим скок във възможностите за използване на компютър, област, в която по-ранните модели на Sonnet изоставаха.
Anthropic подчертава, че моделът е преминал през обширни оценки на безопасността. Вътрешни изследователи описват Sonnet 4.6 като демонстриращ силно поведение по отношение на безопасността и липса на сериозни признаци на несъответствия с високи залози, аргумент, който компанията използва, за да подсили по-широката си позиция по отношение на отговорното разработване на изкуствен интелект.
Дискусията за уменията за използване на компютър отразява по-широк аргумент за стойността на системите с изкуствен интелект, които могат да управляват софтуер директно, а не чрез API. Anthropic отбелязва, че много организации разчитат на остарели инструменти, които не могат лесно да бъдат автоматизирани, и че модел, способен да взаимодейства с компютър като човек, може да намали необходимостта от персонализирани интеграции.
Бенчмаркове като OSWorld, които симулират реални софтуерни среди, показват стабилен напредък през шестнадесетте месеца на разработка на Sonnet. Ранните потребители на Sonnet 4.6 съобщават, че моделът вече може да се справя със задачи като навигация в сложни електронни таблици или попълване на многостъпкови уеб формуляри на ниво, приближаващо се до човешка компетентност, дори ако все още изостава от експертните потребители. В същото време компанията признава рискове като атаки с prompt-injection и твърди, че е по-устойчива в сравнение с по-ранните версии.
Сонет 4.6 подобрява качеството на кода, разсъжденията и използването на инструменти
Отвъд използването на компютър, Anthropic отчита значителни подобрения в бенчмарк тестовете. В Claude Code потребителите предпочитат Sonnet 4.6 пред Sonnet 4.5 в повечето тестове, посочвайки по-доброто четене на контекста, намаленото дублиране и по-надеждното многоетапно изпълнение. Много от тях също го предпочитат пред Opus 4.5, описвайки го като по-малко склонен към свръхинженеринг и по-последователен в следването на инструкциите. Разширеният контекстен прозорец позволява на модела да работи върху цели кодови бази или големи изследователски колекции, а Anthropic подчертава производителността му в симулацията Vending-Bench Arena, където моделът е възприел дългосрочна инвестиционна стратегия, която е превъзхождала конкурентите.
Компанията отбелязва, че ранните клиенти са забелязали подобрения в области като разработка на интерфейси, финансов анализ и качество на визуалния дизайн. Sonnet 4.6 също така пристига с актуализации в платформата за разработчици на Claude и API, включително адаптивни и разширени режими на мислене, уплътняване на контекста, подобрена обработка на уеб търсене и разширени възможности за използване на инструменти. Моделът вече е достъпен във всички планове на Claude, включително безплатния пакет, и е достъпен чрез Claude Cowork, Claude Code, API и основни облачни платформи.
Отказ от отговорност
В съответствие с Доверете се насоките на проекта, моля, имайте предвид, че предоставената на тази страница информация не е предназначена да бъде и не трябва да се тълкува като правен, данъчен, инвестиционен, финансов или каквато и да е друга форма на съвет. Важно е да инвестирате само това, което можете да си позволите да загубите, и да потърсите независим финансов съвет, ако имате някакви съмнения. За допълнителна информация предлагаме да се обърнете към правилата и условията, както и към страниците за помощ и поддръжка, предоставени от издателя или рекламодателя. MetaversePost се ангажира с точно, безпристрастно отчитане, но пазарните условия подлежат на промяна без предизвестие.
За автора
Алиса, всеотдаен журналист в MPost, специализира в криптовалути, изкуствен интелект, инвестиции и обширната сфера на Web3. С остър поглед към нововъзникващите тенденции и технологии, тя предоставя изчерпателно покритие, за да информира и ангажира читателите в непрекъснато развиващия се пейзаж на дигиталните финанси.
Още статии
Алиса, всеотдаен журналист в MPost, специализира в криптовалути, изкуствен интелект, инвестиции и обширната сфера на Web3. С остър поглед към нововъзникващите тенденции и технологии, тя предоставя изчерпателно покритие, за да информира и ангажира читателите в непрекъснато развиващия се пейзаж на дигиталните финанси.



