Технологии

Новый Claude Sonnet 5 обещает почти флагманские возможности за заметно меньшие деньги

RusPhotoBank

Anthropic делает ставку на доступные ИИ-агенты

Компания Anthropic представила новую языковую модель Claude Sonnet 5, ориентированную на выполнение сложных автономных задач. Новинка должна стать более доступной альтернативой флагманским моделям, сохранив при этом высокий уровень производительности. По словам разработчиков, Sonnet 5 приближается по возможностям к Claude Opus 4.8, но обходится значительно дешевле при использовании.

С запуском новой модели Anthropic фактически подтверждает, что способность ИИ самостоятельно выполнять последовательность действий становится стандартом для современных систем. Теперь ключевыми факторами конкуренции становятся стоимость эксплуатации таких моделей и их надежность при работе без постоянного контроля человека.

Производительность близка к флагманскому уровню

В компании сообщили, что Claude Sonnet 5 демонстрирует результаты, близкие к Opus 4.8. В тестах, связанных с агентным программированием, новая модель набрала 63,2%, тогда как Opus 4.8 получил 69,2%, а предыдущая версия Sonnet 4.6 — 58,1%.

При выполнении задач, связанных с обработкой знаний, Sonnet 5 даже немного превзошел Opus 4.8, который ранее считался наиболее сильной моделью Anthropic для решения сложных аналитических задач и работы с глубокими исследованиями.

Основной акцент — на снижении стоимости

Одним из главных преимуществ новой модели стала цена. До 31 августа Anthropic предлагает Claude Sonnet 5 по стоимости 2 доллара за миллион входных токенов и 10 долларов за миллион выходных. После завершения промопериода тариф увеличится до 3 и 15 долларов соответственно.

Даже после повышения стоимости модель останется дешевле Claude Opus 4.8, а также ряда конкурирующих решений, включая OpenAI GPT-5.5 и Google Gemini 3.1 Pro. При этом Sonnet 5 по-прежнему будет стоить дороже Gemini 3.5 Flash.

Модель лучше справляется с длинными задачами

По данным Anthropic, тестирование показало, что Claude Sonnet 5 заметно увереннее завершает комплексные задачи, на которых предыдущие версии модели могли останавливаться. Кроме того, система способна самостоятельно проверять результаты своей работы даже без отдельной команды пользователя.

Инженер Zapier Дэниел Шепард сообщил, что во время испытаний модели поручили одновременно обновить уровни аккаунтов Salesforce и разослать анонс корпоративным клиентам. По его словам, Claude Sonnet 5 выполнил весь процесс полностью, тогда как прежние версии нередко прекращали работу на промежуточном этапе.

Безопасность остается одним из приоритетов

Несмотря на заметный рост возможностей, Anthropic подчеркивает, что Claude Sonnet 5 не заменяет Opus 4.8 в задачах, где требуется максимальная точность. Компания отмечает, что разработчики могут выбирать между двумя моделями, балансируя стоимость вычислений и качество результата.

Кроме того, результаты внутренних оценок показывают, что Sonnet 5 обладает существенно меньшими возможностями для выполнения потенциально опасных задач в области кибербезопасности по сравнению с моделями семейства Opus. Также участники предварительного тестирования отметили, что новая модель стабильно и последовательно отклоняет небезопасные запросы.