Anthropic выпустила нейросеть Claude Opus 4.1, превосходящую продукты OpenAI и Google

Компания Anthropic 5 августа 2025 года анонсировала выход новой версии своей языковой модели — Claude Opus 4.1. Это обновление направлено на решение сложных задач, связанных с программированием, анализом данных и логическими рассуждениями. Новая модель призвана усилить позиции компании в конкурентной борьбе с OpenAI и Google.

Jona/Unsplash

Opus 4.1 уже доступен для платных пользователей Claude, а также через API, Amazon Bedrock и Google Cloud Vertex AI. Важно, что стоимость использования осталась на уровне предыдущей версии, Opus 4. Этот шаг должен стимулировать разработчиков перейти на обновленную модель, чтобы получить большую производительность при тех же затратах.

Ключевое улучшение коснулось производительности в кодинге. Модель демонстрирует результат в 74,5% на тесте SWE-bench Verified, превосходя Opus 4 (72.5%) и модели конкурентов, такие как OpenAI o3 (69,1%) и Gemini 2.5 Pro (67,2%). Компании GitHub и Rakuten Group отмечают значительные улучшения в рефакторинге кода и точности исправлений в больших проектах.

Несмотря на успехи в программировании, в других областях Opus 4.1 пока уступает. В тесте на логические задачи повышенного уровня сложности (GPQA Diamond) модель набрала 80,9% — это меньше, чем у Gemini 2.5 Pro (86,4%) и OpenAI o3 (83,3%). Схожая ситуация и в решении математических задач школьного уровня, где результат составил 78% против 88% у конкурентов.

Ранее Anthropic представила технику, которая позволяет управлять поведением нейросетей, добавляя или убирая подхалимство, злобу и другие качества.