Использование персональных данных в маркетинге: законы и этика

Использование персональных данных в маркетинге: законы и этика

Директор по продукту Илья Цырульников рассказал изданию «РБК Тренды» о том, как регулируется сбор персональных данных и как тренд на анонимизацию в интернете влияет на работу маркетологов.
В 1960–70-х годах появились первые дата-центры и реляционные базы данных — первые решения для работы с большим объемом информации. В 2005-м была запущена платформа Hadoop на основе открытого кода, чуть позже — аналогичная ей Spark: обрабатывать данные стало проще и дешевле. В 2008 году входит в употребление сам термин Big Data. Крупные компании уже изучают поведенческие модели пользователей, разрабатываются первые алгоритмы машинного обучения (ML), появляются новые решения для применения данных в разных сферах — от бизнеса до государственного управления. В Австралии, например, большие данные используют для устранения последствий чрезвычайных ситуаций, а в Испании сервис Madrid iNTeligente помогает управлять подрядчиками, которые отвечают за разные аспекты городской жизни: состояние улиц, освещение и ирригацию.
В 2020 году общий объем сгенерированных в мире данных достиг 64,2 зеттабайт. В одном зеттабайте — миллиард терабайтов информации. «Бытовая» аналогия для такого массива — это, например, склад на 64 млрд iPhone 13 Pro с памятью 1 ТБ. Если сложить их в одну стопку, высота этого столба достигнет 500 тыс. км — в полтора раза больше, чем до Луны.

Данные и риски

Данные называют «цифровой нефтью», так как они представляют собой большую ценность, а их сбор и обработка связаны с рисками: данные можно продать третьим лицам, украсть, использовать для вмешательства в экономические и политические процессы.
Классический прецедент — сотрудничество Cambridge Analytica со штабом Дональда Трампа в 2016 году. Cambridge Analytica использовала данные пользователей Facebook, собранные с помощью цифровой викторины, чтобы направить уникальную политическую рекламу на релевантные (и очень узкие) аудитории. При формировании сегментов было учтено больше 5 тыс. параметров: политические взгляды, любимые передачи, покупательские привычки.
Компании-брокеры продают данные, лидер рынка поисковых систем Google время от времени подвергается обвинениям в манипуляциях с выдачей, наконец, данные могут просто украсть. Особенно опасны утечки персональных данных, по которым можно идентифицировать человека: eBay, например, в 2014 году потерял персональные данные всей пользовательской базы, а это 145 млн человек. В сентябре 2021 года в сети появилась информация о том, что на хакерском форуме выставлены на продажу данные 1,5 млрд пользователей Facebook: имена, пол и возраст, номера телефонов, адреса проживания и ID.
Такие события закономерно провоцируют дискуссию о регулировании. И сегодня мы можем наблюдать, как государства, компании и пользователи все чаще делают выбор в пользу необходимости контроля и защиты.

Big Data + MarTech

Персональные данные пользователей лежат в основе современного маркетинга. Они помогают бизнесу «лучше узнать» клиента, прогнозировать его поведение и персонализировать предложения. По данным агентства V12, 69% компаний сегодня считают персонализацию клиентского опыта приоритетной задачей маркетинговой стратегии: она помогает наращивать выручку и работать с лояльностью.
Сайт Airbnb, например, опираясь на пользовательские данные, умеет рекомендовать интересные города, в которых пользователю скорее всего захочется побывать, и жилье с «привычной» для него ценой за сутки. А крупный косметический бренд Ulta создает уникальные предложения, основанные не только на истории покупок, но и на данных, которые указывает в профиле сам покупатель (например, «неровный тон кожи», «кудрявые волосы» или отказ от определенных компонентов в составе косметики).
Эффективные маркетинговые стратегии и новые инструменты часто разрабатывают с помощью технологий искусственного интеллекта. Пара примеров:
ML-алгоритм Next Best Action, который определяет вероятную дату следующей покупки клиента. Для корректной работы алгоритма нужна информация о заказах, просмотрах товаров и категорий: всего используется порядка 30 признаков (число и частота покупок за все время, средний чек и так далее). Когда информация собрана, применяется алгоритм «Градиентный бустинг»: он помогает определить, через сколько дней после последней активности клиенту нужно отправить письмо, которое приведет к следующей покупке.
Нейросеть на основе алгоритма Residual Neural Network (создана ученым, работавшим на Microsoft и Facebook), которая распознает объекты на фотографиях. Базовый алгоритм доработан так, чтобы нейросеть не только классифицировала вещи, но и запоминала их сочетания, и использовала их для формирования товарных рекомендаций в интернет-магазинах одежды.
Несколько лет назад клиенты могли даже не догадываться, что компания собирает какую-то информацию. Непрозрачность целей и методов сбора и обработки данных провоцировала разные проблемы: от «агрессивности» маркетинговых кампаний, которые пользователи находили слишком навязчивыми, до утечек персональных данных. Параллельно с другими индустриями, которые собирали данные, маркетинг постепенно формировал запрос на изменения.

ИТ и законодательство

Сегодня возможность собирать и обрабатывать информацию все больше ограничивается и регулируется. Так, в 2018 году вступил в силу GDPR: общий регламент, который дает резидентам Евросоюза возможность управлять персональными данными, запрашивать информацию про цели обработки и место хранения, даже удалять их, если потребуется. GDPR обязывает компании объяснять, для чего они собирают данные, не использовать их повторно для других целей, не собирать больше, чем нужно, удалять данные после достижения цели и не передавать их третьим лицам, а в случае утечки сообщать об этом в течение трех дней.
Вслед за GDPR обновленные акты о защите данных приняли в других странах. В том же 2018 году в штате Калифорния был одобрен California Consumer Privacy Act (CCPA, вступил в силу в 2020-м). Каждый житель Калифорнии получил право запросить у компании информацию о том, как используют его данные, уточнить список третьих лиц, которым они были переданы, и потребовать удаления. А в 2019-м закон, вдохновленный GDPR, представил Китай. Местные регуляторы сразу же начали проверку популярных приложений. Доказывать, что они не собирают «лишние» данные, пришлось сервисам доставки еды, такси и навигаторам.
В России похожие изменения были внесены в федеральный закон «О персональных данных» в 2020-м. Операторов персональных данных (это все компании, госструктуры и физлица, которые собирают соответствующую информацию) обязали получать согласие на обработку и удалять данные по первому запросу «настоящего» владельца.

О технических ограничениях и этике

На самом деле, вопрос регулировании ИТ-сервисов выходит далеко за пределы государственных интересов. О готовности сотрудничать с законом и защищать данные пользователей говорили многие лидеры индустрии. CEO Salesforce Марк Бениофф, например, отмечал, что прецедент с выборами 2016 года подорвал доверие общества к отрасли и показал, как сильно она нуждается в изменениях и внешнем контроле. С ним согласился и CEO Facebook Марк Цукерберг. Комментируя эти события, он указал: больше нет уверенности в том, что индустрия не нуждается в регулировании. Правда, акцент был сделан на инструменты саморегулирования: формирование прозрачных рекламных предложений и использование алгоритмов ML для отслеживания контента, который нарушает права пользователей.
Мнения лидеров бигтеха обычно подтверждаются действиями. Большое количество функций для защиты данных предлагает Apple: в браузер Safari сегодня добавлена функция блокировки сторонних cookie, а приложениям из AppStore ограничена возможность отслеживать действия пользователей без их согласия. О планах по запрету сторонних cookie к 2023 году заявили в Google. Правда, дедлайн внедрения функции уже несколько раз переносился. Данные пользователей помогают продавать рекламу через AdSense: в 2020 году реклама составляла 81% доходов компании.
Важно, что Google при этом занимает 92% глобального рынка поисковых систем, 2/3 рынков веб-браузеров и веб-рекламы. В отношении компании неоднократно проводились антимонопольные расследования. Хотя формально Google не является монополистом: зарабатывая на рекламе, он конкурирует с миллионами медиа. Да еще и остается бесплатными для конечного потребителя, потому что зарабатывает не на нем, а на рекламодателях, которым «продает» пользователей через таргетинг. Аудитория Google и других ИТ-гигантов — это миллиарды человек, для которых сервисы давно стали частью повседневности. Защита интересов такого количества пользователей — еще один аргумент в вопросах необходимости отрегулировать работу с данными.
Наконец, из-за того, что развитие технологий опережает развитие законодательства, появляются альтернативные способы регулировать сектор. Например, кодексы этики использования данных. В российском среди главных этических принципов работы с данными, помимо законности, перечислены обеспечение безопасности хранения, уважение прав и свобод человека, недопустимость фальсификаций.

Маркетинг в эпоху анонимности

Инструменты маркетинга теряют эффективность на фоне ограничений — но только частично. Новые функции iOS 15, например, влияют на e-mail маркетинг: почтовый клиент больше не дает компаниям отслеживать, когда пользователь открыл письмо. А запрет на передачу идентификаторов между разными системами без согласия пользователя осложняет создание контекстной рекламы.
В итоге интерес маркетологов может смещаться в сторону прямых коммуникаций с клиентами: разобраться, что пользователь делает в рамках одного приложения (приложения компании) можно так же легко, как и раньше. Кроме того, маркетологи могут работать с данными, которые человек оставил «добровольно»: при регистрации на сайте, оформлении заказа, прохождении опроса. Клиентам могут предлагать «менять» данные на бонусы от компании: например, ответить на несколько вопросов о предпочтениях в обмен на промокод. Или оформить карту лояльности, прикрепив ее к номеру телефона и СМС-рассылке.

Как еще можно поддерживать эффективность маркетинговых активностей на фоне изменений?

Использовать опыт офлайна. Когда покупатель приходит в офлайн-магазин, единственная возможность продавца понять, откуда и почему он зашел — спросить его об этом. Классическое «Откуда вы узнали о нашей компании?» переживает второе рождение, как только эту информацию становится невозможно извлечь из цифрового следа.
Разработать и популяризировать приложение. Собственное приложение — способ легально собирать данные. При регистрации пользователь указывает имя, номер телефона или почту, а внутри приложения изучает интересные ему сегменты, собирает разные корзины, реагирует на промо акции. То есть ведет себя наиболее типичным образом.

Не отказываться от таргета «вручную». Если площадка не дает таргетироваться на целевой сегмент автоматически, можно «собрать» релевантную для показа аудиторию вручную, задав нужные параметры в рекламном кабинете (look-alike). В небольшой компании структурировать клиентские данные и сформировать сегменты может команда аналитиков или отдельный специалист. Для крупного бизнеса лучше подойдут готовые ИТ-решения: например, аналитика CDP-платформы.