Колонка экспертов
28 июля 2021

LTV на стероидах: как использовать офлайн- и онлайн- данные для прогноза метрики в омниканальном ритейле (и не только) с помощью машинного обучения

Андрей Муратов

Андрей Муратов, управляющий партнер Coffee Analytics

Какую выручку принесут ваши текущие клиенты в будущем? Поиск надежного ответа на этот вопрос делает пожизненную ценность клиента (LTV или CLV) популярной во многих отраслях. Помимо этого, LTV привносит строгость и перспективу в процесс привлечения клиентов и выстраивания взаимоотношений с ними.

Вместо того чтобы искать способы, как привлечь много клиентов и как дешево это сделать, LTV помогает понять, как оптимизировать затраты на привлечение с максимальной отдачей с учетом полной ценности новых покупателей для бизнеса.

Как в известной аналогии с айсбергом, компания видит и анализирует покупки клиента в прошлом для роста операционных показателей (например, ROAS, CPO). Важнее же понять, какую выручку принесут клиенты в будущем, и формировать стратегию роста данной метрики и, как следствие, ценности всего бизнеса.

Мем

В материале раскрываются особенности расчета метрики наиболее точным из известных способом с помощью машинного обучения, приводятся российские и зарубежные кейсы ритейлеров, а также сравниваются цифры из профильных исследований и рекомендации от практиков.

Содержание:

Зачем читать эту статью

В мире среди маркетологов накапливается явное противоречие. С одной стороны, 91% из них уверены, что рекламные инвестиции позитивно влияют на доходы компании, с другой, только 35% согласны, что ROI важен для аналитики, и только 50% строят отчеты атрибуции (20% вообще не знают, есть ли они в компании!).

Исследование Hubspot

По результатам нашего исследования в России, только 30% маркетологов в ритейле считают LTV. Для сравнения, согласно отчету Criteo еще от 2018 года, в Англии таких более 93%! Эта трехкратная разница и настораживает (авторы не нашли явных отличий в методах проведения этих исследований), и является зоной роста для тех компаний, которые внедрят LTV в свои маркетинговые стратегии, начнут им осмысленно управлять.

Отчет Criteo

Поэтому сегодня поговорим о том, что такое customer lifetime value, как он считается, зачем нужен, и рассмотрим способы расчета и применения данной метрики на примере United Colors of Benetton и ASOS.

Также рекомендуем мастер-класс Coffee Analytics, Mindbox и Benetton из цикла «Технологии алгоритмического маркетинга» по основам LTV:

Основы LTV: валовый метод расчета

LTV (lifetime value), или CLV (customer lifetime value), — это ценность клиента в деньгах, которые он предположительно принесет компании в течение своей жизни как покупателя (в качестве сложившегося стандарта для ритейл-индустрии анализируется год).

Основная сложность расчета данного показателя заключается в том, что для него нет единой методологии подсчета: разные виды бизнеса используют разные модели вычисления. Поэтому, с одной стороны, LTV вычисляют «из прошлого», применяя валовый метод расчета или когортный анализ. С другой — «из будущего», опираясь на методы машинного обучения или статистический подход.

Прогнозирование метрики значительно полезнее для бизнеса, так как позволяет оценить потенциал работы как с конкретным клиентом, так и ценность отдельных сегментов и когорт внутри базы. На слайде ниже видно, что средний LTV на активного покупателя в несколько раз выше оборота за год. Полный демоотчет в Power BI — в конце статьи.

Пример отчета LTV-ценности базы клиентов
Пример отчета LTV‑ценности базы клиентов

Как правило, выбор расчетной методики зависит от количества и качества данных, которые доступны компании уже сейчас. Другими словами, чем больше хороших данных в наличии, тем более сложным и точным будет способ расчета LTV.

Самый простой подход — расчет ценности клиента валовым методом или через churn rate (отток клиентов). Базовая формула в этом случае выглядит так:

LTV

где r (retention rate) — процент покупателей, которые остаются с компанией после первой покупки в течение выбранного отрезка времени;

d (discount rate) — стоимость капитала для компании;

GC (gross contribution) — ожидаемая прибыль с пользователя за выбранный отрезок времени.

Недостаток этого подхода в том, что он, во-первых, рассчитывает LTV для всей базы в целом, а не для конкретного человека или определенной когорты. Во-вторых, по формуле скорее вычисляется не LTV, а CP (Customer Profitability), то есть ценность клиента в деньгах, которые он уже принес в прошлом, а не принесет в будущем.

Поэтому, если требуется вычислить LTV наиболее точно, применяют метод машинного обучения (machine learning, ML-подход), где используется весь доступный набор данных о действиях клиента. От традиционных — структуры транзакций (чеков), кликстрима и микроконверий на сайте, информации в профиле клиента; до специализированных — действия в мобильном приложении, содержание переписки в чат-боте, чтение тематических статей в блоге компании или на сторонних ресурсах.

2 дек
18:00
Зарегистрируйтесь, чтобы не пропустить. Мы пришлём напоминание и ссылку на запись.
Регистрируясь, вы соглашаетесь на передачу данных.

Какие индустрии сразу выиграют от LTV

Если клиенты совершают у вас более одной покупки, вам стоит задуматься о расчете LTV. Но, как упоминалось выше, разные виды бизнеса используют разные модели вычисления. Это значит, что успешно применяемая для одной индустрии методика может совершенно не подходить для другой.

Виды бизнеса, где клиенты делают более одной покупки
Виды бизнеса, где клиенты делают более одной покупки

Например, традиционно LTV считают в мобильных приложениях и сервисах подписки (правый верхний квадрат на слайде), так как там предсказуемость поведения потребителя выше, чем в остальных видах бизнеса — компании изначально собирают и хранят о пользователях множество разных данных.

Однако модель расчета LTV для мобильной связи не подойдет для магазина одежды или спортзала, продающего абонементы на фитнес-услуги: люди не покупают вещи каждый месяц и, купив абонемент на год, не обязательно продлевают его. Для некоторых компаний эффективнее прогнозировать не доход за год на клиента (CLV), а доход за год на продукт — такой unit-подход, например, актуален для магазинов мебели и крупной бытовой техники.

Зачем считать LTV с помощью машинного обучения

В общем виде расчет и мониторинг LTV позволяет понять текущую ценность клиентской базы и ее динамику. Однако имея посчитанный показатель для конкретного клиента или сегмента/когорты, бизнес понимает, на каких каналах, сообщениях, географиях, коллекциях лучше сделать акцент для привлечения наиболее доходной категории покупателей, сколько компания готова тратить на привлечение новых и удержание старых клиентов в каждой точке своего присутствия.

На какие вопросы помогает ответить LTV, посчитанный до клиента
На какие вопросы помогает ответить LTV, посчитанный до клиента

По нашим наблюдениям, сама идея работы с LTV, размышления о влияющих на метрику факторах, уже выявленных с помощью ML-модели, размышления о систематизации данных уже повышают КПД бизнеса, выявляя зоны в смежных с маркетингом областях.

Мониторинг LTV также позволяет компаниям увидеть, что необходимо делать для увеличения показателя. Таким образом, расчет и мониторинг LTV помогает:

  • находить новые источники знания о покупателях (1P/3P-данные),
  • видеть значительную пользу от AB-экспериментов,
  • улучшать качество и использовать доступные данных,
  • заниматься интеграцией новых офлайн- и онлайн-данных о поведении покупателей.

Как рассчитать LTV с помощью машинного обучения

Чтобы получить LTV, необходимо, в первую очередь, начать системно собирать данные.

Для этого потребуется запустить программу лояльности, даже самую простую, и начать агрегировать в базе данных информацию из разных источников, например данные о рекламных расходах, о просмотренных товарах и категориях, об использовании баллов лояльности, действия в мобильном приложении.

После того как нужный объем данных собран, потребуется определить факторы, влияющие на LTV сильнее всего. Выбор факторов — важный этап, его не получится скопировать или перенять у другого бизнеса, так как одни и те же атрибуты (features, «фичи») могут по-разному влиять на LTV в разных индустриях. Например, скидки положительно влияют на LTV в ритейле и негативно — для SaaS-решений.

Data shows SaaS discounting lowers SaaS LTV by over 30%

Влияние одних и тех же факторов на LTV в разных видах бизнеса
Влияние одних и тех же факторов на LTV в разных видах бизнеса

Уже через 6–8 месяцев после того, как вы определили факторы влияния и начали собирать данные, вы сможете довольно точно предсказывать LTV, если вы знаете ID клиента и понимаете, какие действия он совершает в онлайне и офлайне.

Применяем LTV на практике. Кейс Benetton

United Colors of Benetton — крупный премиальный fashion‑бренд, у которого более 6000 магазинов по всему миру и более 120 в России. В конце 2018 года компания внедрила программу лояльности, которая начала бурно расти с момента запуска. Поэтому перед бизнесом встал вопрос о том, как грамотно оценить отдачу от этой программы и понять:

  • какие дополнительные деньги может принести программа лояльности завтра;
  • сколько стоит привлечение нового клиента и сколько денег он принесет компании на протяжении следующего периода;
  • какова ценность всей клиентской базы;
  • от каких факторов зависит поведение покупателя;
  • как через эти факторы влияния адаптировать весь маркетинг для работы с более доходными сегментами потребителей.

Сначала Benetton считал доход с клиента, средний чек и количество покупок. Однако довольно быстро стало понятно, что эти метрики дают только понимание того, что уже произошло, а не того, что произойдет завтра. Например, если у какого-либо сегмента падали продажи, эти показатели не могли объяснить, случайное это событие или это тренд, который продолжится в будущем.

В итоге компания приняла решение считать LTV, опираясь на ML-подход. Проект осуществлялся в несколько этапов.

Этап 1. Подготовка витрины данных (все источники)

На первом этапе собиралась витрина данных из всех факторов, которые могут влиять на LTV:

Пример витрины
Пример витрины, где разными цветами подсвечены данные, которые: а) уже есть в наличии; б) нужно начать собирать; в) можно собирать, но на их подключение и сбор еще не поставлено ТЗ

Кроме того, для каждого фактора влияния подсчитывались максимальное, минимальное и медианное значения. Так, сначала для Benetton было определено 646 атрибутов, способных влиять на LTV.

Параллельно с витриной готовилась архитектура данных проекта, которая выглядела так:

  • На уровне CDP Mindbox фиксировались все данные по пользователям: их транзакции, реакции на рассылки, действия в мобильном приложении и прочие.
  • На уровне облачного хранилища данных (в данном случае Google BigQuery) фиксировались данные о рекламных расходах, данные со счетчиков на сайте и данные о трафике в магазинах.
Архитектура данных в проекте

Потом эта архитектуру доработали и полученный LTV стали передавать в Mindbox. На основе этих данных в CDP построили сегменты пользователей, которые затем использовались для настройки эффективных промо активностей. Заметим, что эту модель можно доработать и дальше — передавать LTV в рекламные кабинеты и таким образом влиять на приоритетность показа объявлений потенциальным клиентам (например, в ретаргетинге) и при формировании look-a-like сегментов.

В короткой презентации на форуме Effie TECH 2021 вы можете ознакомиться, как компания сумела поженить онлайн- и офлайн-данные для прогноза LTV:

Этап 2. Расчет показателя

После подготовки витрины и архитектуры данных производился расчет показателя. Для этого подготавливались две модели: одна предсказывала churn rate, другая (с помощью регрессионного анализа) считала LTV. При этом LTV рассчитывался в несколько шагов.

Сперва на выборке данных за два года обучали модель. Грубо говоря, брали базу из десятков тысяч пользователей и делили на две части: на тех, кто уже «прожил» с компанией год, и тех, кто этот год еще не прожил. На основе первой части измерялся фактический LTV (он же customer profitability), который потом внедрялся в модель для обучения и расчета LTV по второй части пользователей.

Стратегия расчета LTV, часть 1
Стратегия расчета LTV, часть 1

Так получалось, что каждый день у компании была аудитория, которая только что закончила свой первый год жизни. Такие клиенты автоматически уходили в обучение модели и улучшали качество предсказания LTV по новым потребителям.

После запуска модели начиналась вторая часть по расчету LTV. Она заключалась в том, чтобы постоянно проверять, какие данные можно еще добавить к модели. Если таковые находились, то они добавлялись в существующую модель, которая заново проводила оценку решения, после чего цикл возвращался к шагу поиска и подготовки новых данных. По сути, этот процесс не прекращается, и модель расчета LTV можно дорабатывать постоянно, чтобы получать более надежные результаты в метриках.

Стратегия расчета LTV, часть 2
Стратегия расчета LTV, часть 2

Следующим шагом была комбинация двух моделей:

  • Сперва определялась вероятность того, что человек вернется в течение будущего года.
  • Затем к покупателям с наиболее высокой вероятностью возвращения применялись коэффициенты из регрессионной модели, и таким образом рассчитывался LTV.

Этап 3. Визуализация отчетов в Power BI

После расчета и применения модели LTV построили несколько отчетов, которые компания United Colors of Benetton использует в следующих случаях:

Примеры отчетов представлены ниже.

Примеры отчетов: эффективность базы

Отчет об эффективности базы
Отчет об эффективности базы позволяет понять, сколько денег получит компания, даже если база не будет расти в течение года

Примеры отчетов: факторы влияния на LTV

Отчет по факторам влияния на LTV
Отчет по факторам влияния на LTV позволяет увидеть, почему какие-то клиенты приносят больше денег, чем другие. Другими словами, этот показывает, как изменение одного фактора влияет на изменение LTV в целом

Примеры отчетов: сегментация клиентской базы

После того как факторы влияния были определены, Benetton смогла создавать кастомные сегменты и передавать их в Mindbox
После того как факторы влияния были определены, Benetton смогла создавать кастомные сегменты и передавать их в Mindbox. Например, при помощи отчета по сегментации базы компания смогла определить пользователей, наиболее склонных покупать новые коллекции, и запустила для них специальную рекламную кампанию

Высший пилотаж расчета LTV. Кейс ASOS из UK

Пример расчета LTV для компании ASOS создал Имперский колледж Лондона (Imperial College London). Этот кейс интересен тем, что архитектура проекта, помимо churn rate и регрессионной модели LTV, учитывает эмбединги (embedding — группировка слов, встречающихся в схожем контексте).

Архитектура данных для проекта ASOS
Архитектура данных для проекта ASOS
Пример эмбедингов для проекта ASOS
Пример эмбедингов для проекта ASOS

Другими словами, в проекте ASOS пересекали между собой пользователей и продукты. Исследовали способ коллаборативной фильтрации: находили очень похожих друг на друга людей (например, смотревших один и тот же товар) и оценивали их эмбединг в виде связки «продукт — пользователь» и через эту связку улучшали предсказания LTV.

Всё еще сомневаетесь в полезности метрики?

Ключевые мысли

  1. LTV придает новый смысл всем маркетинговым усилиям компании и переводит оценку их эффективности на качественно новый уровень.
  2. Собирать данные и рассчитывать LTV надо сразу, как только у бизнеса появляется запрос со стороны стратегической клиентской аналитики.
  3. Грамотная постановка бизнес‑задач на базе данной метрики с учетом доступных данных и ресурсов поможет компании оптимально подойти к расчетной части. Например, начать с валового метода и постепенно прийти к машинному обучению, постоянно улучшая точность метрики.
  4. Построение первой модели и расчет LTV — начало пути. После построения модели надо обязательно следить за чистотой данных и контролировать обмен информации между сервисами (CRM-, CDP‑системы, облачная база данных, рекламные кабинеты и прочее).
  5. Необходимо постоянно мониторить, учитывает ли текущая модель все факторы, влияющие на LTV. Если нет, то модель необходимо дополнять новыми данными или даже в целом пересматривать методы оценки факторов.

О чем еще стоит подумать менеджменту

Если после прочтения материала у вас остались вопросы, например:

  • как клиенты компании могут становиться более ценными с течением времени;
  • какие сервисы, продукты, маркетинг способствуют росту метрики;
  • какие бизнес-инновации, расширяющие возможности клиентов, делают их более ценными для компании;

то следующее простое упражнение от Harvard Business Review поможет вашей команде не только понять, как измерить ценность клиентов, но и начать рассматривать их как партнеров, создающих ценность, а не как цели извлечения ценности.

HBR: What Most Companies Miss About Customer Lifetime Value

Для этого, вам нужно лишь закончить предложение «Наши клиенты становятся намного более ценными, когда...»

Это не так просто и прямолинейно, как может показаться. Уверены, первые качественные варианты ответов на этот вопрос вы уже нашли в данной статье. Следующие наши обучающие материалы и кейсы помогут развить их.

Материалы для самостоятельного изучения по теме

Изучить теорию и рассчитать показатель можно самостоятельно на следующих курсах:

  1. Predicting customer lifetime value на Coursera.
  2. A Definitive Guide for predicting Customer Lifetime Value (CLV) на Analytics Vidhya.
  3. Customer Lifetime Value Prediction with XGBoost Multi-classification на Towards data science.

А еще рекомендуем посмотреть на результаты первого исследования по теме развития и применения методологии LTV в СНГ.

Подводя итог: хотя показателя клиентской ценности и нет в отчетности публичных компаний, именно он показывает суммарную ценность любого бизнеса, как суммы ценности всех его клиентов, для инвесторов, акционеров и руководителей.

Поэтому, как в стратегическом горизонте, менеджмент и маркетинг директора становятся заинтересованы в точном расчете ценности клиентов, внедрении метрики на все уровни принятия ключевых маркетинговых решений.

Так и на тактическом уровне, показатель позволяет начать применять строгую экономическую дисциплину сопоставляя LTV с CAC, CPA или CPI, а также расставлять приоритеты при сегментации и удержании клиентов, планировании промо кампаний и многом другом. И обеспечивает, таким образом, компании прозрачный ROI для системной работы.

Демоотчет Power BI