Лингвисты описали словарь ИИ в современных текстах

У медиатекстов, созданных с помощью нейросетей, формируется узнаваемый лексический и стилистический профиль. Об этом Агентству городских новостей «Москва» сообщили опрошенные лингвисты.

«Сейчас можно говорить о формировании собственного набора речевых маркеров текстов нейросетей. ИИ формирует собственный набор устойчивых речевых маркеров. Это связано с тем, что ИИ обучается на больших объемах данных и выявляет наиболее частые и эффективные языковые конструкции», – рассказала доктор филологических наук, заведующая кафедрой медиаобеспечения государственных интересов и национальной безопасности Института права и национальной безопасности РАНХиГС Лидия Малыгина.

По ее словам, в текстах нейросетей часто используются слова и конструкции «системно», «напрямую», «фактически», «остается ключевым» или «остается проблемой».

«Они создают впечатление уверенности и точности, но могут восприниматься как избыточные или даже манипулятивные, если используются слишком часто. Фразы типа «остается ключевым» или «остается проблемой» действительно очень часто встречаются. Они подчеркивают важность обсуждаемых тем, но могут казаться читателям шаблонными. А конструкции типа «именно так», «именно поэтому» придают тексту акцент, однако их частое употребление может привести к риторической предсказуемости. Это снижает интерес читателя», – пояснила эксперт.

Заведующая лабораторией когнитивных и лингвистических исследований Института Пушкина Мария Лебедева назвала узнаваемым признаком ИИ-текста формулу «это не просто X – это Y».

«Это, например, конструкции «Это не просто инструмент – это новый способ мышления», «это не просто тренд – это смена парадигмы». «Живой» автор использует такую конструкцию редко, уместно. А модель имитирует риторическую выразительность и воспроизводит это клише везде там, где нужна убедительность. В результате прием обесценивается и начинает работать в обратную сторону», – пояснила эксперт.

Об этом в апреле писало и американское деловое издание Barron’s. Журналисты сообщили, что конструкция «it’s not just X, it’s Y» была обнаружена в 49 корпоративных документах крупных компаний США в 2023 году, в 100 – в 2024 году и в 208 – в 2025 году.

Агентство «Москва» сравнило около 20 публикаций федеральных СМИ до появления ChatGPT и после массового распространения генеративных нейросетей. При анализе учитывались характерные для ИИ двоеточия, противопоставления, а также выражения «именно», «сам по себе», «все чаще», «напрямую», «на практике», «остается/становится/превращается», «система/системно». В материалах 2019 года такие маркеры встречались редко или отсутствовали совсем.

В публикациях 2026 года такие конструкции обнаруживаются регулярно, при этом в рамках одного текста можно увидеть сразу несколько признаков ИИ. В одном из проанализированных материалов число двоеточий доходило до 14, а количество противопоставлений – до 12.

При этом, по словам доцента факультета журналистики ИГСУ Президентской академии Любови Гогиной, не все повторяющиеся приемы можно автоматически считать признаком использования нейросетей.

«Текст ИИ – умное и трансформирующееся явление, способное меняться под любой запрос и мимикрировать. Например, еще недавно боты использовали наречие «сильно» везде, где требовались синонимы («очень», «весьма», «значительно», «в высшей степени» и так далее). Но при указании на это ИИ быстро найдет варианты», – отметила она.

По мнению заведующей лабораторией когнитивных и лингвистических исследований Института Пушкина Марии Лебедевой, распространение нейросетей может привести к закреплению в массовых коммуникациях отдельного речевого регистра – алгоритмически оптимизированной, или условно «ИИ-нейтральной», речи.

«Но все же язык – это прежде всего социальный феномен, и живое общение будет сохранять свою вариативность, иронию, ситуативность – всe то, что модели воспроизводят с трудом», – сказала Лебедева.

Любовь Гогина отметила, в свою очередь, что бороться с распространением ИИ-стиля в массовой коммуникации нет смысла.

«Видимо, это данность времени, которую мы все рано или поздно примем. В конце концов, тексты нужны для коммуникации, а тексты, созданные роботами, коммуникацию осуществить способны», – сказала она.