Раздел Интернет
2 ноября 2011, 12:12

Словарь из 5 млн слов составили для цензуры СМИ и блогов

Сегодня Роскомнадзор готовится продемонстрировать ПАК, который с декабря этого года будет следить за соблюдением статьи 4 закона о СМИ о недопустимости злоупотребления свободой массовой информации.

Для мониторинга текстов в системе заложен словарь более чем на 5 миллионов слов и словосочетаний. Комплекс будет также отслеживать порнографические снимки и видео.

С декабря некий робот будет обходить по списку, который есть в Роскомнадзоре, все сайты, зарегистрированные как средства массовой информации, и механически отслеживать на них «запретные» слова и словосочетания. Подозрительные страницы будут направляться на рассмотрение сотрудников Роскомнадзора, которые и будут принимать по ним решения.

К слову, запрет коснется и личных блогов читателей 66.ru. Являясь частью СМИ, данные блоги также подвергнутся цензуре со стороны государства.

Как рассказал МК помощник руководителя Роскомнадзора Михаил Воробьев, ничего принципиально не изменится, потому что этот мониторинг осуществляется и сейчас, просто делается это вручную, через поисковые системы.

Михаил Воробьев:

— ПАК просто снизит наши трудозатраты. Количество сетевых СМИ растет — их уже почти 6000, а наши штаты не расширяются. Информация будет поступать к сотрудникам в автоматическом режиме, а дальше все пойдет, как и шло. Если редакционный материал нарушает статью 4, Роскомнадзор вправе вынести предупреждение. Редакция может его оспорить в суде. После второго предупреждения в течение 12 месяцев Роскомнадзор может обратиться в суд о закрытии СМИ.

Как рассказала «Вести ФМ» генеральный директор агентства «Стратег» Екатерина Аксенова, в 5 млн запретов попали слова и словосочетания, которые относятся по определенным признакам к экстремистским, которые призывают к межнациональной розни, к нарушению существующего строя и так далее.

Екатерина Аксенова:

— Понятно, что если представим себе статьи, описывающие какие-то события, связанные с митингами националистов, то там неизбежно будут такого рода словосочетания, хотя сами статьи, очевидно, не нарушают закон о средствах массовой информации. Есть вполне понятные регламенты, которые описывают то, каким образом наказываются СМИ, нарушившие регулирующие документы.

В ответ на появление многомиллионного списка запретных слов в интернете уже прозвучали заявления о введении цензуры. Однако вводимая система явно не обладает такими функциями, так как не может влиять на саму публикацию какой-либо информации.

Однако интересно другое. Как объяснил в интервью МТРК «МИР» политтехнолог, генеральный директор агентства «Социальные сети» Денис Терехов, машина только в 20% случаев может определить, что заключено в сообщении. «Иван Иванович Иванов поехал по Ленинградке, и ее перекрыли — вот же он молодец!» — с точки зрения машины это позитивное высказывание, хотя с точки зрения пользователя понятно, что я издеваюсь», — говорит Терехов.

Денис Терехов:

— Эта система давно уже придумана, она называется «Яндекс» или Google. Если у спецслужб есть желание анализировать личные данные, из которых 99% посвящены кошечкам и собачкам и только один процент касается каких-то политических или экстремистских высказываний, то они могут заниматься этим прямо сейчас.

Увидеть «комплекс контроля» специалисты смогут уже 2 ноября, а то, насколько он эффективен в действии, будет понятно через несколько месяцев, когда разработчикам придется отчитываться о найденных в Сети противоправных материалах.