Вышел DeepSeek-V3.1 с контекстом 160K

Компания Silicon Intelligence 25 августа запустила модель DeepSeek-V3.1, разработанную командой DeepSeek. Новая версия искусственного интеллекта поддерживает обработку контекста длиной до 160 тысяч токенов. Общее количество параметров модели составляет 671 миллиард при 37 миллиардах активируемых параметров.

Архитектура модели сочетает режимы мышления и прямого ответа, что повышает эффективность обработки запросов по сравнению с предыдущей версией DeepSeek-R1-0528. Модель демонстрирует улучшенные показатели в использовании инструментов и выполнении задач агентов. Тестирование на наборах SWE, Browsecomp, xbench и SimpleQA показало значительный прирост производительности.

Стоимость использования DeepSeek-V3.1 составляет 4 юаня за миллион токенов на входе и 12 юаней за миллион токенов на выходе. Ценовые показатели в 5 раз ниже на входе и в 9 раз ниже на выходе по сравнению с моделью Claude 4 Sonnet. Платформа поддерживает пропускную способность до 5 миллионов токенов в минуту.

Увеличение длины контекста до 160 тысяч токенов позволяет обрабатывать сложные сценарии работы с длинными документами, многораундовыми диалогами, программированием и агентскими задачами. Модель анализирует юридические договоры, академические статьи, финансовые отчеты и программные кодовые базы без необходимости предварительного разделения на сегменты.

Улучшенные возможности памяти поддерживают сложные сценарии взаимодействия, включая обслуживание клиентов, психологическое консультирование и образовательные процессы. Модель выполняет сложные задачи по принципу сквозной обработки без необходимости инженерной реализации сцепки промежуточных результатов.

Технология RAG обеспечивает точность извлечения информации при работе со сотнями документов в контексте, что снижает количество ошибок поиска. Обработка полного объема информации позволяет генерировать точные ответы на сложные запросы.