Предиктивная или прогнозная аналитика: зачем и как применять ее в бизнесе

Предиктивная или прогнозная аналитика: зачем и как применять ее в бизнесе

Предиктивная аналитика с высокой долей вероятности предсказывает поведение клиента, вероятность покупки и другие события. Например, стоит дать клиенту скидку или же он достаточно лоялен, чтобы купить товар по полной цене.
В статье расскажем о том, как прогнозная аналитика приносит выгоду «Еаптеке» и Mario Berluссi.

Что такое предиктивная аналитика

Предиктивная аналитика — это прогнозирование событий и их характеристик. Событием может быть покупка или не покупка товара, а характеристикой — ее цена.
Такой прогноз всегда делается на основе данных и разных моделей их обработки. В маркетинге обычно собирают данные по клиентам: история покупок, личные данные и интересы. Модели обработки — это методы математической статистики, алгоритмы машинного обучения, нейросети и другие.
Спрогнозировать можно почти любое событие в любой индустрии. Например, в онлайн-продажах можно предсказать, купит ли клиент конкретный товар, основываясь на истории его покупок. Точность такого предсказания далека от 100%, но все равно помогает компаниям улучшать метрики.
Mario Berlucci отслеживает действия клиентов на сайте, чтобы предсказать, купит ли клиент в текущей сессии и вернется ли на сайт в течение семи дней. Клиентам, которые, скорее всего, не купят и больше не вернутся, показывают попап со скидкой, ограниченной по времени. Если по предсказанию клиент, скорее всего, купит, то попап ему не показывают. Скидка на основе предсказания помогла сократить число брошенных корзин на сайте на 17,2%.
Картинка
Попап всплывает, если по предсказанию алгоритма клиент в текущей сессии не оформит заказ и не вернется позже

Зачем использовать прогнозную аналитику

Прогнозная аналитика позволяет:
Увеличить продажи
Предиктивная аналитика в маркетинге подскажет, какие товары стоит предложить клиенту, на основе истории его активности: что он смотрел, заказывал или добавлял в корзину ранее. Можно показывать эти товары на сайте или отправлять подборку в рассылке. Это экономит время клиента на поиск нужных товаров, тем самым увеличивая вероятность покупки.
Картинка
Персональные рекомендации на сайте «Мегастрой» содержат товары, которые с большой вероятностью заинтересуют клиента
Увеличить средний чек покупки
Аналитика предскажет, какие сопутствующие товары могут понадобиться клиенту вместе с купленным. Для такого предсказания алгоритм анализирует чеки и товары всех клиентов, чтобы понять, какие товары чаще всего покупаются вместе. Со смартфоном часто покупают наушники, а с туфлями — сумочку.
Картинка
Сопутствующие товары в корзине «Музторга», которые часто покупали с гитарой
Сохранить маржинальность
Аналитика может предсказать, нужно ли давать клиенту скидку или он купит без нее. Такие предсказания помогают не раздавать скидки просто так, особенно на товары с невысокой маржинальностью, для которых даже 200 ₽ скидки снижают маржу на 60%.
«Еаптека» использовала предсказания, чтобы выделить группу активных покупателей, которые покупают независимо от скидки. Чтобы подтвердить результаты, компания провела АВ-тест. Половине группы отправили письмо с промокодом, а второй — без него. Конверсия писем в покупки в двух группах была примерно одинаковой. Это значит, что клиентам из этой группы не нужно давать скидки. Предиктивная аналитика помогла компании сэкономить маржу.
Оптимизировать закупки
На основе данных по продажам за разные периоды можно предположить, какие товары будут покупать в следующем сезоне. Это поможет вовремя пополнить складские запасы или сбыть плохо продающиеся товары с помощью скидок.
Особенно важно это в период распродаж, потому что объемы продаж увеличатся и запасов на складе может не хватить. Или, напротив, компания закупит больше товаров, чем требуется. Все это может привести к финансовым потерям.
Алгоритмы предиктивной аналитики проанализируют прошлую статистику продаж, покупательскую способность клиентов и другие параметры. На основе этих данных они предскажут, сколько товара надо закупить, чтобы получить от распродажи максимум прибыли.
Снизить риски
Предиктивная аналитика может составить портрет потенциально неблагонадежного клиента. Обычно она учитывает пол, возраст, социальное положение и другие характеристики ненадежных людей. Особенно важно это в банковской сфере или в страховании. Например, страховой полис для работников промышленных заводов всегда стоит дороже, чем для офисных работников, потому что у них травмы случаются намного чаще.

Методы предиктивной аналитики

Все методы предиктивной аналитики можно условно разделить на три большие группы: классические статистические методы, методы машинного обучения и большие языковые модели.
Классические статистические методы возникли до 90-х годов прошлого века. К ним можно отнести анализ временных рядов, регрессионный анализ, теорию обработки сигналов и другие. Это сложные математические формулы, которые описаны в учебниках. Для каждой конкретной задачи использовали разные формулы, но специалисты их легко понимали. Это так называемый белый ящик, когда ты видишь всю начинку системы, которая решает за тебя задачи.
Методы машинного обучения появились в 90-е годы. Это уже более универсальные алгоритмы, которые умеют решать почти любые задачи на основе данных. Например, распространенный ML-алгоритм «решающее дерево» может предсказать и скорость доставки, и лучшее время для отправки email клиенту, не требуя ручной настройки. Предсказание делается автоматически на основе исторических данных, которые подходят для этого расчета.
К методам машинного обучения относят: решающие деревья, методы градиентного бустинга, решающих ансамблей, нейронные сети и другие. В отличие от классической статистики аналитикам уже не нужно вникать в то, что происходит внутри этих алгоритмов. Когда решающее дерево само строит суперсложный алгоритм прогнозирования для конкретной задачи, работа аналитиков — уметь протестировать этот готовый алгоритм.
Большие языковые модели — это Chat GPT, нейросеть глубокого обучения и другие. Это сверхсложные алгоритмы, которые обучаются на всех данных интернета.
Позиционируется, что Chat GPT 4 может ответить на любые вопросы — от программирования до ухода за котиками. Ее можно использовать в качестве вспомогательной системы, которая дает подсказки, или обучить на своих данных, чтобы применить к своей индустрии. При этом необязательно понимать, что происходит внутри нее.
Чтобы проиллюстрировать разницу в работе классического и продвинутого алгоритма, рассмотрим, как они считают вероятность просрочки по кредиту. В классической модели можно взять три параметра: возраст человека с определенным коэффициентом, его среднюю зарплату с коэффициентом и его склонность к употреблению алкоголя. Сложить эти величины с нужным коэффициентом и получить вероятность просрочки. Таким образом, предсказание будет базироваться на трех параметрах. Нейросеть содержит около 800 миллиардов таких параметров, и каждый из них будет влиять на предсказание. Точно понять, каким образом нейросеть подобрала ответ к конкретной задаче, почти невозможно.

Как внедрить предиктивную аналитику

Основные этапы, которые нужно пройти, чтобы использовать преимущества предиктивной аналитики:
Собрать и проверить данные
Начать работать с аналитикой можно, только если у компании есть большое количество достоверных данных. Чем больше данных, тем больше точных прогнозов можно сделать.
Чтобы ритейлер мог предсказать вероятность покупки постоянного клиента, ему достаточно данных по количеству его покупок, дате первой и последней. Предсказать поведение клиентов, которые купили единожды, сложнее, потому что данных о единственной покупке недостаточно, чтобы достоверно предсказать поведение клиента.
Если данных о конкретном клиенте недостаточно, в предсказаниях можно опираться на данные постоянных клиентов. Новый клиент может быть похож на какого-то из текущих: по возрасту, месту проживания и другим характеристикам. Обычно у таких клиентов похожие интересы. Аналитика подберет предложения для нового клиента на основе истории покупок похожих на него покупателей. Предположим, что женщины от 30 до 40 лет из Санкт-Петербурга чаще всего покупают сумки определенного бренда. Новым посетительницам сайта, подходящим под эти параметры, стоит предложить именно эти сумки, чтобы повысить вероятность покупки.
Чтобы предсказать, с какой вероятностью клиент вернется на сайт в течение семи дней, Mario Berlucci использует такие данные:
  • Действия на сайте: просмотр карточек товаров, добавление товаров в корзину, покупки.
  • Действия с контентом: открытие таблицы размеров, добавление товара в избранное, чтение отзывов. 
  • Данные из CRM интернет-магазина: история покупок.
Перед тем как делать предсказания, нужно обязательно проверить достоверность данных. Бывает так, что люди оставляют свой email на сайте, используя сервис одноразовых email. Такого человека невозможно отследить, поэтому считается, что данные по нему недостоверны. Если невалидных данных много, то, скорее всего, предиктивную аналитику настроить не получится.
Обозначить цель прогноза и критерии успешности
Цель прогноза зависит от сферы бизнеса. В ритейле чаще всего хотят предсказывать вероятность покупки, а в финансовых организациях — вероятность дефолта по кредиту. Критериями успеха для этих целей могут быть: увеличение среднего чека или сокращение числа просрочек по кредитам.
Представим, что цель прогноза в онлайн-кинотеатре — сохранить подписчиков. Для этого он рекомендует действующему пользователю подборку фильмов, которые ему могут быть интересны. Чем лучше рекомендация, тем выше вероятность продления подписки. Критерий успеха в данном случае может быть либо формальным — используют клиенты рекомендации или нет, либо фактическим — увеличилось ли количество клиентов, которые продлевают подписку.
Выбрать способ для создания алгоритма прогноза
Компания может создавать алгоритм самостоятельно, передать задачу в специализированные компании или использовать уже готовые алгоритмы прогноза.
Самостоятельная разработка потребует создать отдел анализа, который будет писать алгоритмы, тестировать и внедрять их. Это дорогое решение, потому что нужно нанять в штат несколько разных специалистов.
В Mario Berlucci каждый этап по запуску механик с предсказанием подразумевает работу таких специалистов:
  • Аналитик — анализирует данные, находит аномалии и проводит AB-тесты.
  • Два специалиста по data science — пишут алгоритмы, которые возвращают ответы-предсказания в виде вероятности того или иного действия пользователя на сайте.
  • Маркетолог — разрабатывает и запускает механики с применением алгоритмов.
  • Разработчик — внедряет механики и алгоритмы на сайте.
Обращение в специализированную фирму, которая занимается разработкой программного обеспечения, также потребует времени и финансовых вложений. Фирма может создать любую систему для предсказаний под конкретную компанию. Она будет разработана под ее нужды и обучена по ее данным. В среднем это может занять до полугода и будет стоить несколько миллионов рублей.
Готовые алгоритмы можно внедрить быстрее и дешевле, чем разработанные самостоятельно. Mindbox предлагает три варианта ML-алгоритмов:
Лучшее время отправки
Next best action
Продуктовые рекомендации
Принцип работы
Определяет время, когда клиент вероятнее всего готов получить письмо. Оптимальное время подбирается для каждого дня недели
Рассчитывает лучшую дату для отправки. Дату можно использовать в сценариях коммуникации и отправлять оффер, когда клиент вероятнее всего готов к следующей покупке
Подбирает релевантные продукты для каждого пользователя в зависимости от настроек и конкретной ситуации
Протестировать прототип алгоритма
Тестировать прототип можно на офлайн-данных или небольшой группе пользователей. В онлайн-маркетинге можно протестировать алгоритм на небольшой группе пользователей. Если клиенты из тестируемой группы стали покупать больше, алгоритм работает. Его можно распространять на весь бизнес.
Мониторить алгоритм после внедрения
Если алгоритм прошел тестирование, его можно распространять на текущие процессы и сразу настраивать систему мониторинга. Мониторинг нужен, потому что в системе могут быть ошибки, которые нельзя увидеть во время тестирования. Например, онлайн-магазин хочет улучшить метрики «число покупок» и «средний чек». Запускается алгоритм рекомендаций, который поднимает продажи определенных товаров. Остальные 90% товаров продаются хуже, чем раньше, потому что их никто не видит. Это эффект популярности в рекомендательных системах.

Для чего используют предиктивную аналитику клиенты Mindbox 

Клиенты Mindbox используют алгоритмы предиктивной аналитики, чтобы:

Увеличить конверсию рассылок

Гипотеза. Обувной интернет-магазин Mario Berluссi предположил, что клиентам с разной вероятностью покупки надо отправлять разные коммуникации.
Чтобы предсказать действия клиентов, компания использовала алгоритмы машинного обучения. Когда клиент заходит на сайт, его действия передаются алгоритму. Он анализирует их и выдает предсказание: «купит в текущей сессии или не купит» и «вернется в течение семи дней или не вернется».
На основе предсказания клиентов разделяют на четыре группы: с высокой вероятностью покупки и возврата, с высокой вероятностью покупки, но низкой вероятностью возврата и так далее. Каждой группе шлют разные коммуникации. Группе, которая, скорее всего, купит, отправляют информацию о программе лояльности, но исключают из массовых рассылок, чтобы не спамить. Группе с низкой вероятностью возврата — скидку, ограниченную по времени.
Картинка
Содержание рассылок Mario Berluссi зависит от вероятности покупки, которую предсказал для клиента алгоритм
Результат. Конверсия в транзакцию у рассылок на основе предсказаний — 4,42%. Средний показатель обычных триггерных рассылок — 1,5%.

Увеличить прибыль от продаж 

«Еаптека» выяснила, что теряет прибыль, раздавая небольшие скидки. Если средний чек покупки — 3000 ₽, а маржа —10% (300 ₽), то промокод 200 ₽ «съедает» целых 66% маржи.
Гипотеза. Чтобы сэкономить маржу, компания предположила, что клиентам с высокой вероятностью покупки скидку давать не надо. Группы с высокой вероятностью покупки выделили по формуле:
Картинка
В формуле predict — вероятность покупки от 0 до 100%, inverse recency — время от 1-й покупки до последней, lifetime — время от первой покупки до текущей даты, frequency — количество покупок.
Расчет. Исходные данные: сегодня 21.03.2021. Клиент совершил первую покупку 01.09.2018, а последнюю — 01.01.2020. Всего покупал семь раз.
Картинка
Расчет показал, что клиент с такими исходными данными попадает в группу с низкой вероятностью покупки — от 0 до 20%. Если по формуле рассчитать вероятность покупки для каждого клиента, то можно выделить группу активных покупателей, которым не нужно давать скидки.
Результат. Компания экономит на раздаче скидок без потери общей прибыли. Сэкономленная маржа может распределяться на другие группы клиентов, чтобы мотивировать их на покупки.

Советы по работе с предиктивной аналитикой

1. Прежде чем внедрять алгоритмы предсказаний, нужно проанализировать те данные по клиентам, которые есть. Если данных недостаточно или они недостоверны, то не стоит вкладывать бюджет в алгоритмы машинного обучения.
2. Не стоит сразу нанимать большую команду в штат, чтобы создать уникальную систему предиктивной аналитики. Лучше протестировать уже готовые алгоритмы, например от Mindbox, чтобы понять, нужны они бизнесу или нет.
3. От предиктивной аналитики не стоит ждать точных предсказаний. Хороший результат — это 70–80% точности. Такая точность позволяет верно предсказать поведение 70 клиентов из 100, чтобы мотивировать на покупки.