Принимаю условия соглашения и даю своё согласие на обработку персональных данных и cookies.

За вами следят, а потом продают данные государству и компаниям. Как устроена Big Data в России

23 октября 2020, 10:01
За вами следят, а потом продают данные государству и компаниям. Как устроена Big Data в России
Фото: Анна Коваленко, 66.RU
На самом деле большие данные — это неотъемлемая часть жизни людей и необходимая составляющая бизнеса. Однако понятие «Big Data» в российском законодательстве не особо прописано, что несет правовые риски. Какую информацию о вас могут собирать соцсети, банки, магазины, сотовые операторы и что могут продавать третьим лицам — в материале 66.RU.

Что такое Big Data

Фото: Анна Коваленко, 66.RU

В классическом определении Big Data — огромные массивы структурированной и неструктурированной информации, собранной из разных источников. Сейчас под большими данными понимают не только информацию, но и различные инструменты, подходы и методы их обработки.

Основные источники Big Data:

  • корпоративные базы данных;
  • интернет (соцсети, блоги, форумы и др.);
  • информация с датчиков, измерительных устройств и сенсорных сетей.

Три главные характеристики Big Data:

  • Volume. Большой объем информации — потоки данных свыше 100 Гб в день. Big Data считается та информация, которая выходит за пределы возможностей обработки вручную.
  • Velocity. Большая скорость накопления и необходимость в быстрой обработке.
  • Variety. Большое разнообразие данных.

Кто и как собирает информацию

Фото: Анна Коваленко, 66.RU

Под сбором информации подразумевается любое действие потребителя, которое можно отследить. Например, передвижение абонентов мобильных операторов, подключение к wi-fi в общественном месте или оплата покупки банковской картой.

Первыми с большими данными начали работать сотовые операторы и поисковые системы. Сегодня к анализу Big Data в России присоединились банки, ретейлеры, интернет-компании и др. Несмотря на то, что рынок больших данных в РФ уступает масштабами западному, 54% российских компаний начали инвестировать в аналитику Big Data. По разным оценкам он составляет от 10 до 30 млрд рублей. В Ассоциации участников рынка больших данных прогнозируют, что к 2024 году его объем достигнет 300 млрд рублей.

Сотовые операторы

К июлю 2019 года в России было зарегистрировано 260,6 млн мобильных абонентов. По подсчетам компании Mediascope, 78% населения пользуется мобильным интернетом.
Мобильный оператор определяет, где находится каждый из его абонентов, их ежедневные маршруты. Но речь идет не только о геолокации. Компания знает, как часто абоненты ездят за границу, где любят гулять, какие сайты просматривают, в каких интернет-магазинах совершают покупки.

Банки

По карточным транзакциям банки видят, сколько, на что и где вы тратите деньги, сколько вам перевел работодатель. Эта информация также позволяет анализировать кредитоспособность клиента, что в конечном итоге сокращает время рассмотрения кредитных заявок.

Магазины

Ретейл также собирает сведения о покупателях: персональные данные (оформляя бонусную карту, вы оставите дату рождения, телефон и ФИО), историю покупок, информацию из чеков.

Поисковики, соцсети, сайты, приложения

Информацию собирают «Яндекс», Google, Facebook и еще бесконечное множество компаний. Например, «Яндекс» с помощью технологии «Крипта» анализирует 300 факторов и создает условный портрет пользователя — обезличенный человек без имени и конкретной даты рождения, со своими интересами и пристрастиями. Google собирает личные данные, информацию о действиях, созданный контент. Подробную инструкцию о том, как избавиться от слежки Google хотя бы частично, читайте здесь.

Даже лайки и комментарии, которые вы оставляете в социальных сетях, — часть Big Data. Например, Facebook признался в прослушке и расшифровке голосовых сообщений пользователей. Правда, в компании заявили, что предупреждали пользователей о прослушивании и расшифровке голосовых сообщений.

Какие ваши данные могут продать по закону

Фото: Анна Коваленко, 66.RU

В России нет отдельного законодательства, которое регулировало бы обработку больших данных. Занимаясь этим, компании должны руководствоваться Законом о персональных данных. Однако участники рынка и эксперты признают его размытость.

Попытки регулирования Big Data в России выглядят так:

  • В октябре 2018 года депутаты «Единой России» Михаил Романов и Алексей Кобилев внесли в Госдуму законопроект, который обязывал интернет-компании уведомлять пользователей, что их данные будут обрабатываться в обезличенном виде. Документ не приняли и отправили на доработку.
  • В августе 2019 года Ассоциация больших данных и Институт развития интернета объявили о создании кодекса этики использования Big Data. Кодекс, который приняли в декабре 2019-го, включает в себя принципы профессиональной этики, а также предполагает ведение реестра добросовестных участников. В комитете Госдумы по информполитике посчитали саморегулирование недостаточной мерой для рынка.
  • В сентябре 2019 года Минкомсвязь разместила законопроект, предлагающий ввести понятие «обезличенные данные». Однако законопроект так и не внесли в Госудуму.
  • В феврале 2020 года Минкомсвязь подготовила законопроект, который должен был закрепить подходы к обработке больших данных. Предложенные поправки предусматривают введение понятий «большие данные», «оператор больших данных» и «обработка больших данных». Однако в июне ведомство отозвало законопроект о регулировании рынка Big Data.

Компании, сайты и сервисы могут собирать персональную информацию (например, чтобы выдавать потом таргетированную рекламу), но не имеют права продавать ее третьим лицам.
Операторы Big Data обезличивают персональную информацию, обрабатывая ее в агрегированном виде, и получают статистические или демографические данные. Собственно, для тех, кто использует Big Data, не нужны конкретные имена, адреса и номера телефонов. Смысл больших данных завязан на объеме — чем он больше, тем эффективнее и точнее будет анализ поведения.

Для тех, кто собирает и покупает большие данные, вы будете не инженером с завода Ивановым Иваном Ивановичем 1987 года рождения, а мужчиной от 30 до 40 лет со средним достатком.
Правда, существует риск утечки персональных данных, что происходит регулярно. Тогда хакеры получают доступ к ФИО, телефонным номерам, паспортным данным и другой личной информации.

В чем польза Big Data для каждого

Польза для компаний от собранного массива информации понятна — они оптимизируют продажи, логистику, составляют портреты клиентов. Соответственно, доходы растут. Но Big Data приносит пользу и конечному потребителю.

Big Data и транспортная система города

Фото: Анна Коваленко, 66.RU

Big Data применяют в развитии транспортных систем городов. С помощью информации, полученной от сотовых операторов, интернет-провайдеров, камер наблюдения, можно оптимизировать потоки транспорта. Мегаполисы используют Big Data для объединения транспортной инфраструктуры с другими видами коммунальных услуг в единое целое. Зная данные о передвижениях, можно корректировать маршруты общественного транспорта, управлять светофорами, анализировать очаги аварийности, места скопления машин и своевременно устранять их.

В октябре 2019 года МБУ «Центр организации движения» заключило контракт с МТС на проведение анализа данных по изменению плотности и динамике перемещения людей в Екатеринбурге. Эта информация ляжет в основу научно-исследовательской работы, посвященной разработке транспортно-экономической модели города на перспективу до 2035 года. Обезличенная информация о количестве людей, направлении их перемещения и скорости даст «истинную картину плотности заселения» и позволит рассчитать реальную потребность в транспорте. Аналогичные проекты реализуют в Москве, Санкт-Петербурге и Тюмени Tele2 и «Мегафон».

В Москве Big Data используют для решения транспортных проблем давно и активно. В 2018 году в столице внедрили систему, которая определяет участки дороги с высоким риском ДТП. Она учитывает внешние факторы (осадки, освещение, температуру) и анализирует саму дорогу (ширину, пропускную способность, скорость потока). В итоге Ситуационный центр ЦОДД принимает решение о приоритетном вызове ГИБДД на место аварии с учетом расположения этих участков.

Большие данные используют для прокладывания маршрутов общественного транспорта: за перемещением пассажиров следят с помощью чипов в билетах, которые считываются при валидации.

С 2015 по 2018 год департамент информационных технологий Москвы потратил на покупку геоаналитики и мобильных операторов 516 млн рублей.

Big Data и магазины

Фото: Анна Коваленко, 66.RU

В Екатеринбурге 60% торговых точек на рынке продуктового ретейла поделили между собой четыре компании. Активнее всего город захватывает «Пятерочка» — магазины сети открывают в домах друг напротив друга. Причем, как правило, покупатели из одного магазина не ходят в другой, хотя ассортимент и стоимость товаров одинаковые.

Это значит, что в районе есть несколько независимых основных пешеходных маршрутов. И покупатель выберет «магазин у дома», а не пойдет через дорогу. Информацию о потоках покупателей как раз и собирают с помощью больших данных. Например, у сотовых операторов можно получить информацию о геопозиции устройств и их перемещении. Поставьте wi-fi и Bluetooth-точки в разных местах района — они соберут информацию о проходящих потенциальных покупателях через телефоны.

Один из известных примеров использования Big Data в продуктовом ретейле — опыт «Ленты». Основной источник данных о клиентах — карта лояльности. От 93 до 95% продаж в супермаркетах составляют транзакции с участием карт лояльности. Такой покупатель — часть клиентской базы, и магазин фиксирует и запоминает историю покупок, что позволяет спрогнозировать динамику спроса, создать адресные рекламные предложения и рассчитать оптимальный размер скидки.

Big Data помогает сузить поток информации для конечного потребителя — он получает уже целевую рекламу, которая заточена под него и, скорее всего, будет интересна.

Big Data и рестораны

Фото: Анна Коваленко, 66.RU

Как и в случае с магазинами, в пищевой индустрии большие данные используют для оптимизации меню и цен, для контроля качества и поставок продуктов. Однако рестораны также накапливают информацию из чеков, сумм чаевых, времени визитов, чтобы в итоге предугадывать предпочтения гостей.

Big Data и туризм

Фото: Анна Коваленко, 66.RU

Чтобы его развивать, в Свердловской области властям нужен срез — какие потоки туристов куда едут, где останавливаются, сколько платят и т. д. Его можно получить именно с помощью Big Data.

Коме того, анализируя данные мобильных операторов, можно контролировать спросы на авиа- и железнодорожные билеты, менять и добавлять направления. Например, понимая, что люди летают в определенную точку через их аэропорт, но с пересадками, воздушная гавань может привлечь авиакомпании, чтобы те открыли прямые рейсы.


Big Data и развитие бизнеса в городах

Министерство инвестиций и развития и Фонд поддержки предпринимательства Свердловской области с помощью Big Data анализируют потребность жителей небольших городов в предприятиях сфер услуг — кафе, парикмахерских, салонах красоты и т. д. В итоге бизнес получает развитие, а людям не приходится ездить за услугами в другой район или город.
Чтобы получить представление, какие ниши пустуют, специалисты анализируют платежные данные по банковским картам. Это позволяет выявить спрос и предложения. По словам директора СОФПП Валерия Пиличева, проект стал возможен после того, как массив людей, которые пользуются банковскими картами и цифровыми устройствами, вырос, а количество перешло в качество.

Сфер применения Big Data — бесконечное множество — от медицины до горного дела, от экологии до рекламы, и описать их все невозможно. С каждым годом рынок Big Data будет расти и развиваться. По прогнозам агентства ResearchAndMarket, рынок аналитики больших данных будет повышаться в среднем на 11,9% с 2020 по 2028 год. По прогнозам экспертов, он вырастет до 115,13 млрд долларов.