Роскомнадзор планирует внедрить механизм блокировки запрещённых сайтов с использованием машинного обучения

На проект собираются направить 2,27 млрд рублей. Начинание описана в плане цифровизации ведомства, который 26 декабря внесли на рассмотрение президиума правительственной комиссии по цифровому развитию. С документомознакомилсяForbes.

Через ТСПУ ужезаблокированоболее миллиона ресурсов, запрещенных в России. Ежедневно ограничения в среднем вводятся для 5500 новых сетевых адресов и доменов, рассказывал в интервью «Известиям» замглавы РКН Олег Терляков в июне 2025 года. Параллельно действует и реестр запрещенных сайтов, который Роскомнадзор ведет с 2012 года: туда попадают площадки с детской порнографией, сведениями о наркотиках и способах суицида, онлайн-казино, экстремистскими материалами и другим контентом, запрещенным к распространению законом о защите детей. Операторы обязаны блокировать такие ресурсы из реестра.

С 2025 года федеральные ведомства должны отчитываться о проектах по внедрению ИИ-технологий, поэтому включение подобных инициатив в программы цифровой трансформации «не удивляет», отмечает источник, близкий к аппарату вице-премьера Дмитрия Григоренко. По его словам, Роскомнадзор может хотеть находить запрещенный контент с помощью машинного обучения, а еще лучше - выявлятьVPN-сервисы. Насколько это выполнимо на практике и эффективно с финансовой точки зрения, с учетом необходимости доработки ТСПУ, не очевидно, добавил собеседник Forbes.

«Мы не можем ничего нового сказать по теме», - заявили Forbes в Роскомнадзоре.

Классические DPI-решения позволяют классифицировать типы трафика на основе фиксированных алгоритмов, поясняют в пресс-службе «Мегафона». DPI закрывают большинство базовых задач операторов связи, связанных с управлением сетью и обеспечением стабильности ее работы. При этом развитие сервисов и рост доли шифрованного и усложненного трафика в отдельных случаях требует дополнительных методов. В таких сценариях применяются элементы эвристического анализа трафика, где и помогают механизмы машинного обучения, отметили в компании. «Мегафон» точечно использует такие инструменты, в том числе в защите от мошенников, как часть комплексного подхода к поддержанию устойчивости сети.

По мнению экспертов, интерес регулятора к машинному обучению связан с тем, что владельцы заблокированных ресурсов часто создают «зеркала» с новыми адресами и используют разные приемы обхода ограничений. В таких случаях блокировки по спискам доменов и IP быстро устаревают: вместо одного адреса появляется другой, а сам контент переносится и маскируется. Машинное обучение может позволить искать и ограничивать доступ не только по интернет-адресам, но и по признакам содержания - словам, выражениям, фрагментам предложений и другим маркерам. Одновременно это может помочь находить тех, кто размещает копии или цитирует запрещенные материалы.

Если смотреть на то, как машинное обучение используют корпоративные системы анализа трафика для выявления угроз безопасности, и переносить эти сценарии на масштаб Рунета, то возможны несколько направлений расширения функциональности ТСПУ. Среди них называют выявление зашифрованного трафика и методов обхода блокировок - это важно в контексте курса на блокировку VPN-сервисов. Также упоминаются обнаружение DDoS-атак и выявление взаимодействия с командными серверами ботнетов и другой вредоносной инфраструктурой, которую используют кибермошенники. Еще один вариант - классификация веб-приложений, чтобы находить запрещенные в России сервисы, например отдельные мессенджеры. Дополнительно можно отличать стриминговый трафик от скачивания контента, что позволит выявлять пиратские ресурсы.

Технологии машинного обучения дают возможность более «прицельного» воздействия на сети - например, делать «деградацию» конкретного типа трафика вместо «ковровых» мер. В DPI это способ лучше определять, что именно за трафик проходит по сети, когда классические методы по сигнатурам, портам и другим признакам уже не помогают.

Инструменты машинного обучения на ТСПУ могут использоваться для разработки и автоматического применения правил фильтрации трафика, например для поиска и блокировки VPN-трафика, допускают в отрасли. Также такие технологии могут расширить поиск по содержимому: по текстам на разных языках, по изображениям и видео. В качестве примера приводится Китай, который уже вовсюиспользуетИИ в мониторинге интернета.

При этом не во всех системах применение ИИ оказалось одинаково эффективным. В системе мониторинга использования персональных данных нейросети тестировали, но, по признанию замруководителя Роскомнадзора Милоша Вагнера, результативность в тестовом режиме оценили в 60%. Чтобы повысить точность анализа, потребовались бы обучающие наборы данных по объемам, превосходящим данные всех сайтов, который ведомство собрало за несколько лет, и такие трудозатраты на этом этапе сочли преждевременными в условиях экономии средств.