Централизация данных и отчеты для уверенности в качестве

20 Сен ‘16

Чтобы что-то улучшать, нужно централизовать данные. Без этого отчетность неполная, триггеры неинтересные.

Качество данных - важно

Наши клиенты доверяют нам свои данные и, когда происходит централизация, возникает два вопроса:

  1. Данные правильно обработались? А дубли?
  2. Как проверить, что все хорошо?

Что мы сделали

  1. Выработали схему обработки
    • учли безопасность
    • рассмотрели около 50 сложных случаев
  2. Разработали отчеты по качеству данных
    • Выводим по всей базе и по каждому импорту отдельно
    • Показываем количество дублей, похожих
    • Вычисляем опечатки в именах и отчествах, невалидные контакты, некорректные сочетания имени и пола
  3. Для каждого потребителя храним полную историю изменения его личных данных

В чем сложность централизации?

Приведем несколько примеров:

Схемы обработки данных
  • Человек авторизовался на сайте с одним email, а сделал заказ на маму, указал ее контактные данные и поставил в заказе “хочу получать рассылки”. Нужно не затереть изначальный email, смс по заказу слать маме, а еще маме отправить opt-in.
  • Казалось бы, что номер телефона можно считать уникальным идентификатором, но есть сложности. Например, несколько разных людей указали фиктивный телефон,  900-111-11-11. Нельзя их считать одним покупателем.
  • Был потребитель Иван 1984 года рождения. И тут приезжает информация об изменении имени на Петр Иванович. Корректно ли изменить только имя, а год рождения оставить?

Мы обдумали множество таких случаев и выработали схемы поведения. Процесс был долгий и мучительный, но мы очень довольны результатом.

Как все проверить?

Мы сделали три отчета

Все три отчета

“Краткий обзор. Внешние системы, дисконтные карты, неочевидные моменты” помогает посмотреть:

  • все ли потребители загрузились из каждой системы
  • за нужный ли период
  • что с дисконтными картами
  • сколько объединилось и сколько похожих
Краткий обзор

Отчет “Распределение потребителей и заказов” нужно смотреть, если есть сомнения, что:

  • загрузились все заказы
  • все заказы привязались к правильным потребителям
Отчет по заказам

Отчет “ФИО, пол, контакты. Редактирование и опечатки” показывает, все ли хорошо с особо важными для персональных коммуникаций данными:

  • Сколько пустых, отредактированных телефонов, email, имен
  • Сколько невалидных контактов и данных с опечатками
Отчет по контактам и ФИО

Везде можно посмотреть примеры таких потребителей. Например, посмотрим, как выглядят данные потребителей с опечатками в имени

Опечатки в имени

Или посмотрим, что означает “некорректный пол”

Некорректный пол

Каждый отчет можно посмотреть по любому сегменту потребителей или по конкретному импорту

По сегменту потребителей

У каждого потребителя можно посмотреть полную историю. Это касается любого потребителя из базы, не только примеров в отчете. Например, мы захотели посмотреть, что может означать “был email, но редактировался”. Для каждого изменения известны источник, номер задачи импорта или пользователь системы. То есть если возникли какие-то странности, понятно, где и у кого можно узнать подробности.

Изменение адреса

Если нажать на “нажмите, чтобы посмотреть”, то можно увидеть изменения по всем дополнительным полям и увидеть причину объединения

Объединение потребителей

Итог

Проработанная схема обработки, отчетность и история изменения каждого потребителя  дают уверенность в качестве данных. Если есть сомнения или недопонимания – понятно, куда бежать и что делать. Не всегда интеграция проходит гладко, а отчеты и история изменений потребителей помогают заметить, оценить масштабы и понять, что где надо исправить. Это очень ценно и наши клиенты это отмечают. Весь этот функционал и знания доступны нашим заказчикам бесплатно, в рамках подписки по любому тарифу.

Ответственные за фичу

  • Николай Андрейчук, архитектор
  • Леонид Гуреев, разработчик
  • Сергей Коробков, разработчик
  • Светлана Сельменева, менеджер продукта

Запрос на подключение

Кол-во контактов*
  • 50 000
  • 100 000
  • 150 000
  • 200 000
  • 250 000
  • 300 000
  • 350 000
  • 400 000

Форма обратной связи

Свяжемся в течение
рабочего дня

Заявка на партнерство

Свяжемся в течение
рабочего дня

Обратная связь