![]() Фото: Анна Коваленко, 66.RU |
---|
В классическом определении Big Data — огромные массивы структурированной и неструктурированной информации, собранной из разных источников. Сейчас под большими данными понимают не только информацию, но и различные инструменты, подходы и методы их обработки.
Основные источники Big Data:
Три главные характеристики Big Data:
![]() Фото: Анна Коваленко, 66.RU |
---|
Под сбором информации подразумевается любое действие потребителя, которое можно отследить. Например, передвижение абонентов мобильных операторов, подключение к wi-fi в общественном месте или оплата покупки банковской картой.
Первыми с большими данными начали работать сотовые операторы и поисковые системы. Сегодня к анализу Big Data в России присоединились банки, ретейлеры, интернет-компании и др. Несмотря на то, что рынок больших данных в РФ уступает масштабами западному, 54% российских компаний начали инвестировать в аналитику Big Data. По разным оценкам он составляет от 10 до 30 млрд рублей. В Ассоциации участников рынка больших данных прогнозируют, что к 2024 году его объем достигнет 300 млрд рублей.
Сотовые операторы
К июлю 2019 года в России было зарегистрировано 260,6 млн мобильных абонентов. По подсчетам компании Mediascope, 78% населения пользуется мобильным интернетом.
Мобильный оператор определяет, где находится каждый из его абонентов, их ежедневные маршруты. Но речь идет не только о геолокации. Компания знает, как часто абоненты ездят за границу, где любят гулять, какие сайты просматривают, в каких интернет-магазинах совершают покупки.
Банки
По карточным транзакциям банки видят, сколько, на что и где вы тратите деньги, сколько вам перевел работодатель. Эта информация также позволяет анализировать кредитоспособность клиента, что в конечном итоге сокращает время рассмотрения кредитных заявок.
Магазины
Ретейл также собирает сведения о покупателях: персональные данные (оформляя бонусную карту, вы оставите дату рождения, телефон и ФИО), историю покупок, информацию из чеков.
Поисковики, соцсети, сайты, приложения
Информацию собирают «Яндекс», Google, Facebook и еще бесконечное множество компаний. Например, «Яндекс» с помощью технологии «Крипта» анализирует 300 факторов и создает условный портрет пользователя — обезличенный человек без имени и конкретной даты рождения, со своими интересами и пристрастиями. Google собирает личные данные, информацию о действиях, созданный контент. Подробную инструкцию о том, как избавиться от слежки Google хотя бы частично, читайте здесь.
Даже лайки и комментарии, которые вы оставляете в социальных сетях, — часть Big Data. Например, Facebook признался в прослушке и расшифровке голосовых сообщений пользователей. Правда, в компании заявили, что предупреждали пользователей о прослушивании и расшифровке голосовых сообщений.
![]() Фото: Анна Коваленко, 66.RU |
---|
В России нет отдельного законодательства, которое регулировало бы обработку больших данных. Занимаясь этим, компании должны руководствоваться Законом о персональных данных. Однако участники рынка и эксперты признают его размытость.
Попытки регулирования Big Data в России выглядят так:
Компании, сайты и сервисы могут собирать персональную информацию (например, чтобы выдавать потом таргетированную рекламу), но не имеют права продавать ее третьим лицам.
Операторы Big Data обезличивают персональную информацию, обрабатывая ее в агрегированном виде, и получают статистические или демографические данные. Собственно, для тех, кто использует Big Data, не нужны конкретные имена, адреса и номера телефонов. Смысл больших данных завязан на объеме — чем он больше, тем эффективнее и точнее будет анализ поведения.
Для тех, кто собирает и покупает большие данные, вы будете не инженером с завода Ивановым Иваном Ивановичем 1987 года рождения, а мужчиной от 30 до 40 лет со средним достатком.
Правда, существует риск утечки персональных данных, что происходит регулярно. Тогда хакеры получают доступ к ФИО, телефонным номерам, паспортным данным и другой личной информации.
Польза для компаний от собранного массива информации понятна — они оптимизируют продажи, логистику, составляют портреты клиентов. Соответственно, доходы растут. Но Big Data приносит пользу и конечному потребителю.
Big Data и транспортная система города
![]() Фото: Анна Коваленко, 66.RU |
---|
Big Data применяют в развитии транспортных систем городов. С помощью информации, полученной от сотовых операторов, интернет-провайдеров, камер наблюдения, можно оптимизировать потоки транспорта. Мегаполисы используют Big Data для объединения транспортной инфраструктуры с другими видами коммунальных услуг в единое целое. Зная данные о передвижениях, можно корректировать маршруты общественного транспорта, управлять светофорами, анализировать очаги аварийности, места скопления машин и своевременно устранять их.
В октябре 2019 года МБУ «Центр организации движения» заключило контракт с МТС на проведение анализа данных по изменению плотности и динамике перемещения людей в Екатеринбурге. Эта информация ляжет в основу научно-исследовательской работы, посвященной разработке транспортно-экономической модели города на перспективу до 2035 года. Обезличенная информация о количестве людей, направлении их перемещения и скорости даст «истинную картину плотности заселения» и позволит рассчитать реальную потребность в транспорте. Аналогичные проекты реализуют в Москве, Санкт-Петербурге и Тюмени Tele2 и «Мегафон».
В Москве Big Data используют для решения транспортных проблем давно и активно. В 2018 году в столице внедрили систему, которая определяет участки дороги с высоким риском ДТП. Она учитывает внешние факторы (осадки, освещение, температуру) и анализирует саму дорогу (ширину, пропускную способность, скорость потока). В итоге Ситуационный центр ЦОДД принимает решение о приоритетном вызове ГИБДД на место аварии с учетом расположения этих участков.
Большие данные используют для прокладывания маршрутов общественного транспорта: за перемещением пассажиров следят с помощью чипов в билетах, которые считываются при валидации.
С 2015 по 2018 год департамент информационных технологий Москвы потратил на покупку геоаналитики и мобильных операторов 516 млн рублей.
Big Data и магазины
![]() Фото: Анна Коваленко, 66.RU |
---|
В Екатеринбурге 60% торговых точек на рынке продуктового ретейла поделили между собой четыре компании. Активнее всего город захватывает «Пятерочка» — магазины сети открывают в домах друг напротив друга. Причем, как правило, покупатели из одного магазина не ходят в другой, хотя ассортимент и стоимость товаров одинаковые.
Это значит, что в районе есть несколько независимых основных пешеходных маршрутов. И покупатель выберет «магазин у дома», а не пойдет через дорогу. Информацию о потоках покупателей как раз и собирают с помощью больших данных. Например, у сотовых операторов можно получить информацию о геопозиции устройств и их перемещении. Поставьте wi-fi и Bluetooth-точки в разных местах района — они соберут информацию о проходящих потенциальных покупателях через телефоны.
Один из известных примеров использования Big Data в продуктовом ретейле — опыт «Ленты». Основной источник данных о клиентах — карта лояльности. От 93 до 95% продаж в супермаркетах составляют транзакции с участием карт лояльности. Такой покупатель — часть клиентской базы, и магазин фиксирует и запоминает историю покупок, что позволяет спрогнозировать динамику спроса, создать адресные рекламные предложения и рассчитать оптимальный размер скидки.
Big Data помогает сузить поток информации для конечного потребителя — он получает уже целевую рекламу, которая заточена под него и, скорее всего, будет интересна.
Big Data и рестораны
![]() Фото: Анна Коваленко, 66.RU |
---|
Как и в случае с магазинами, в пищевой индустрии большие данные используют для оптимизации меню и цен, для контроля качества и поставок продуктов. Однако рестораны также накапливают информацию из чеков, сумм чаевых, времени визитов, чтобы в итоге предугадывать предпочтения гостей.
Big Data и туризм
![]() Фото: Анна Коваленко, 66.RU |
---|
Чтобы его развивать, в Свердловской области властям нужен срез — какие потоки туристов куда едут, где останавливаются, сколько платят и т. д. Его можно получить именно с помощью Big Data.
Коме того, анализируя данные мобильных операторов, можно контролировать спросы на авиа- и железнодорожные билеты, менять и добавлять направления. Например, понимая, что люди летают в определенную точку через их аэропорт, но с пересадками, воздушная гавань может привлечь авиакомпании, чтобы те открыли прямые рейсы.
Big Data и развитие бизнеса в городах
Министерство инвестиций и развития и Фонд поддержки предпринимательства Свердловской области с помощью Big Data анализируют потребность жителей небольших городов в предприятиях сфер услуг — кафе, парикмахерских, салонах красоты и т. д. В итоге бизнес получает развитие, а людям не приходится ездить за услугами в другой район или город.
Чтобы получить представление, какие ниши пустуют, специалисты анализируют платежные данные по банковским картам. Это позволяет выявить спрос и предложения. По словам директора СОФПП Валерия Пиличева, проект стал возможен после того, как массив людей, которые пользуются банковскими картами и цифровыми устройствами, вырос, а количество перешло в качество.
Сфер применения Big Data — бесконечное множество — от медицины до горного дела, от экологии до рекламы, и описать их все невозможно. С каждым годом рынок Big Data будет расти и развиваться. По прогнозам агентства ResearchAndMarket, рынок аналитики больших данных будет повышаться в среднем на 11,9% с 2020 по 2028 год. По прогнозам экспертов, он вырастет до 115,13 млрд долларов.