Два новых проекта DeepSeek для ИИ-моделей

Китайская компания DeepSeek представила две новые открытые модели искусственного интеллекта под названиями V3.2 и V3.2-Speciale. Разработчик заявляет, что эти системы могут конкурировать по производительности с ведущими мировыми моделями, такими как GPT-5 от OpenAI и Gemini 3 Pro от Google. Основой стратегии компании остается акцент на эффективности вычислений, а не на максимальном масштабе аппаратных средств.

Информация о выходе моделей появилась спустя год после предыдущего крупного обновления от DeepSeek, которое оказало влияние на глобальный рынок. Модель V3.2 уже доступна для использования через официальный сайт компании, мобильные приложения и API. Более экспериментальная версия V3.2-Speciale работает через временный API-эндпоинт, который будет отключен после 15 декабря 2025 года. На данный момент V3.2-Speciale функционирует исключительно как система для рассуждений, без возможности вызова внешних инструментов.

Утверждения о высокой производительности основаны на внутренних тестах компании. DeepSeek сообщает, что V3.2-Speciale превзошла GPT-5 в этих внутренних бенчмарках и показала результаты на уровне Gemini 3 Pro в задачах, которые требуют сложных логических рассуждений. В качестве доказательства компания ссылается на сильные результаты в тестах, которые основаны на задачах Международной математической олимпиады и Международной олимпиады по информатике 2025 года. Итоговые работы модели опубликованы для открытой проверки.

Технический прогресс в новых моделях разработчик объясняет двумя ключевыми инновациями. Первая — это специальный механизм разреженного внимания, который создали для эффективной работы с длинным контекстом. Вторая — это расширенный конвейер обучения с подкреплением. Для этого обучения использовали более 85 тысяч сложных многошаговых задач. Все эти задачи сгенерировала внутренняя система компании под названием «агентский синтез задач».

Особенностью стандартной модели V3.2 компания называет встроенную способность к рассуждению при использовании инструментов. Это означает, что модель может применять структурированное мышление для работы с инструментами без необходимости активации специального режима. Такой подход отличается от методологии некоторых конкурентов, где подобные функции требуют явного переключения между режимами работы.