Роскомнадзор планирует начать вести реестр запрещенной информации с применением ИИ

10.04.2024 15:25

Уже с 2024 года Роскомнадзор планирует формировать и вести реестр заблокированных сайтов с применением искусственного интеллекта. Об этом со ссылкой на новую версию паспорта программы цифровой трансформации РКН сообщает "Коммерсант".

Из документа следует, что в 2023 году реестр запрещенных сайтов велся без применения ИИ. В свою очередь, информационная система мониторинга интернет-ресурсов — ИС МИР — предназначена для отслеживания текстов с запрещенной информацией и поиска перепечаток. Саму информацию классифицируют по характеру "нейтральное", "негативное" или "позитивное" мнение автора. Так, в 2023 году регулятор выявлял незаконный контент в интернете спустя три часа после публикации.

В текущем же году этот показатель планируется сократить до двух часов. А по итогам 2026 года — до одного. Также служба планирует повысить эффективность работы: в частности, снизить показатель ошибочно выявленных признаков нарушений в СМИ с 20% в 2023 году до 10% в 2026 году. 

Также известно, что в 2026 году, согласно паспорту, Роскомнадзор намерен наполнять с помощью ИИ реестр операторов персональных данных. Аналитик профильного Telegram-канала abloud62 Алексей Бойко уточнил изданию, что выявлять операторов персональных данных в автоматическом режиме можно по открытой информации. Однако существует риск, что на первых порах такой ИИ станет выдавать ложные обнаружения.

Использование же ИИ, а не заданных алгоритмов обработки текстов позволит сократить объем человеческих ресурсов для обслуживания системы. Таким мнением с "Коммерсантом" поделился менеджер продуктов Innostage Евгений Сурков. Он считает, что для этого нужно обучить ИИ-модель на выборке материалов верифицированной и контролируемой оператором системы. Затем модель может работать с минимальным участием человека.

Кроме того, ИИ позволит выявлять сложные контекстуальные связи между текстовыми фрагментами, находить скрытые закономерности и ассоциации, отмечает менеджер продукта Just AI Алексей Борщов. Технология может использоваться и для структурирования баз данных. Впрочем, подобные примеры назвать сложно, поскольку зачастую база знаний не формируется с помощью ИИ, а, скорее, интегрируется с ним.

Глава же департамента расследований T. Hunter Игорь Бедеров полагает, что через несколько лет доля выявляемого запрещенного контента, который потребует дополнительной модерации человеком, вряд ли будет ниже 60%. А оценить извне скорость работы системы будет затруднительно, считает он. Так, аналитики исходят из сроков собственно блокировки контента. Для сравнения, в 2022 году блокировка отдельных сайтов с запрещенной информацией занимала до 50 дней".

Напомним, как ранее писал "Кабельщик", глава НТВ Алексей Земский считает, что со временем искусственный интеллект на ТВ сможет создавать контент самостоятельно.