Российские ученые создали тест для оценки ИИ на длинных текстах

В России Опубликовано 02 декабря 2025, 14:55 1 мин. Инструмент сравнивает работу больших языковых моделей на русском Ученые из SberAI, НИУ ВШЭ, Института искусственного интеллекта AIRI и МФТИ разработали первый комплексный инструмент для оценки способности больших языковых моделей работать с длинными текстами на русском языке. Тест решает проблему отсутствия единого стандарта для сравнения таких систем. © Ferra.ru Инструмент представляет собой «экзамен» из 18 заданий, проверяющих понимание текстов объемом от 4 тысяч до 128 тысяч структурных элементов. Задания включают поиск конкретных...