«Намозоленные» моменты в работе с данными: процент, сортировка, масштаб

Когда вы проделаете такой же длинный карьерный путь, как я, и получите достаточно опыта, чтобы написать 785 535 слов в своем блоге, у вас обязательно сформируются ваши любимые мозоли.
Они приходят из осознания упущенных возможностей повлиять на что-то — только из-за того, что какая-то мелкая деталь не была сделана правильно.
У меня есть порядка 800 таких «мозолей» :) Вот три из них:

1. Неправильное использование процентов

1А. Никогда не верьте процентам. Никогда вообще. Спрашивайте абсолютные цифры.
% — «Мы наблюдаем рост кликов на 87% из поиска».
АЦ: «У нас стало на 16 кликов больше из поиска».
Или круче...
АЦ: «У нас стало на 16 кликов больше из поиска, и клик стоит $69».
Или еще круче...
АЦ: «У нас стало на 16 кликов больше из поиска, и клик стоит $69, и все это привело к одной конверсии с выручкой в $55».
Сырые данные показали вам реальную историю, и прослеживание результата от сырых данных дает контекст для умных решений.
Никогда не доверяйте тем, кто презентует цифры исключительно в процентах (включая такие метрики, как Awareness, Consideration, Intent).
1Б. Это правило работает и в обратную сторону, однако не так часто.
Если вы видите только абсолютные цифры, спросите про проценты и соотношения, чтобы получить точный контекст.
Выглядящая крупной цифра в 14 миллионов может запросто оказаться всего 2%.
АЦ: Наша кампания получила 187 000 кликов в этом месяце из Твиттера.
АЦ + %: Наша кампания получила 187 000 кликов в этом месяце из Твиттера. Это 10% от того, что генерит наша реклама на Фейсбуке каждый день.
Использование процентов помогает понять правильный контекст к громко звучащей цифре кликов из Твиттера.
1В: Во имя всего святого во вселенной... Никогда вообще не говорите «Проценты», когда вы подразумеваете Процентные Пункты!
Разница между 10% и 12% — не 2%.
Это 2pp (Процентных пункта). Или 20%.
Обычно, использование процентов вместо процентных пунктов — это ошибка новичков, так что если кто-то «опытный» делает такую ошибку — начинайте волноваться. Сильно.

2. Неотсортированные таблицы или графики

Лично меня эти моменты сильно бесят, потому что это часто оказывается великолепной, но упущенной возможностью дать толчок к принятию решений.
Я везде встречаю таблицы, в которых данные отсортированы в случайном порядке, потому что никто не потратил пять минут на то, чтобы подумать, что именно мы хотим сказать этими данными.
Я думаю об этом сценарии, как будто кто-то говорит мне — ну вот твой ХЛАМ!.. Как будто они передают тебе большую коробку с хламом, и вам самому предстоит разобраться, чтобы найти то, что вам хочется или нужно — если там вообще такое есть… Конечно, те, кто передают вам такие таблицы, на самом деле считают, что делятся с вами чем-то классным, интересным и имеющим смысл, а вы типа «Чееее? Где? Почемууу?».
Вот пример:
Неотсортированная таблица
Выбесило, правда?
Почему это так сильно разогнало наш пульс? Все просто. Столько много интересных путей, как можно использовать эти данные в таблице, чтобы запустить продуктивное обсуждение, но «аналитик» выбрал вариант дать лидеру перемешанную коробку с хламом.
«Аналитик» предполагает, что лидер сможет запомнить каждую строку, переорганизовать данные в своей голове и найти закономерность, которая может быть наиболее полезной. #хотелосьбыуметьтакдумать
Сортировать данные в таблицах — это ваша работа, как Аналитика. Сортировка таблиц — это на самом деле размышления о том, что именно вы хотите донести. Сортировка таблиц — это прямой путь к тому, чтобы сдвинуть процесс принятия решений вперед.
Когда я смотрю на таблицу, то моя цель — намеренно отсортировать данные таким образом, чтобы создать наиболее продуктивную адженду для бизнеса. В этом случае, по моей оценке сортировка по прибыльности быстро сориентирует лидеров о месте этих цифр во вселенной... Таким образом ускорив наступление так необходимого момента с «Агаааа!».
Таблица
БУМ!
Теперь вы создали своеобразный якорь, на котором останавливается взгляд читателя. Точно также стало ясно, что вам кажется важным в этих данных. Теперь появился момент для старта полезной бизнес-дискуссии.
С помощью простой, но осмысленной сортировки вы делаете наиболее важную часть вашей работы.
Что интересно, я могу сортировать Impressions (впечатления) и CTR или по Conversion rate в зависимости от предполагаемой цели обсуждения. Фишка в том, чтобы... ДУМАТЬ.
У меня буквально разбивается сердце, когда я вижу гистограммы или временные ряды (Бог простит вас, если вы решите игнорировать статзначимость) или пироги.
Но не делая нужную сортировку? вы нагружаете мозг получателя ненужной ерундой — это смертный грех.

3. Неправильное использование масштаба данных

Я уже говорил об этом в прошлом. Что не так с презентацией количества лайков и дизлайков на картинке ниже?
Неправильное использование масштаба данных
Видите? Масштаб разный.
Лайки описаны в тысячах, дизлайки — в сотнях.
Это приводит к ощущению, что дизлайки выглядят «больше», значимее, чем они есть на самом деле. И в данном случае это придает дизлайкам большую значимость, чем они того заслуживают. При всей текущей информационной перегрузке мы можем быстро просмотреть эту картинку и в спешке усвоить, что 140 КАЖЕТСЯ бОльшим, чем 5,7.
С подправленным масштабом это должно выглядеть, как 5.7К / 0.1К.
Заметили, какими маленькими дизлайки стали казаться относительно лайков?
Это то, как оно должно быть — буквально, тысячам людей это нравится, а не наоборот. Зачем нам придавать дизлайкерам бОльшую значимость, чем они заслуживают?
Масштаб — это очень маленькая деталь, которая, однако, значит очень много.
Вы увидите промахи с масштабом буквально везде. В дашбордах. В аналитических инструментах. В вашем отчете о производительности бизнеса для маркетинг-директора. В различных визуализациях данных.
Возьмите примеры выше.
Сравните картинку, где я нарушил масштаб, конвертнув количество показов в миллиарды и прибыльность в миллионы...
Конвертация количества показов в миллиарды и прибыльность в миллионы
Вот те вещи, которые вы сразу увидели в предыдущей версии таблицы, увидели ли вы их так же легко в этой?
На уровне ощущений, приводит ли гигантская разница между миллионами и миллиардами к такому же значимому эффекту «ОБОЖЕМОЙ», как и раньше?
Вот еще разок для сравнения табличка с оптимизированным масштабом:
Таблица
Покрутите вверх-вниз пару раз.
Оно ОЩУЩАЕТСЯ по-разному, правда? Вы чуть больше вовлекаетесь в историю, когда масштаб правильно скорректирован. Вы еще более тщательно изучаете гигантскую разницу между двумя подходами, да?
И в этом вся магия.
Так что... Сделайте человечеству одолжение: убедитесь что в процессе вашей работы вы подстраиваете масштаб цифр оптимальным образом (и поддерживаете тему, которую вы хотите донести).
Вместо послесловия.
Это не самое приятное, что можно сказать… Но вам нужно, чтобы вас выбешивали некоторые вещи. Не в смысле Я ВОТ СЕЙЧАС ЭМОЦИОНАЛЬНО ОБРУШУСЬ НА КОГО-НИБУДЬ. Скорее, в смысле Я МАКСИМАЛЬНО ЗАБОЧУСЬ О МЕЛОЧАХ ДО ТОЙ СТЕПЕНИ, ЧТО МЕНЯ ПОДБЕШИВАЕТ, КОГДА У МЕНЯ НЕ ВЫСТРАИВАЕТСЯ ВСЕ ИДЕАЛЬНО, ТАКИМ ОБРАЗОМ, ЧТОБЫ ПРОДЕМОНСТРИРОВАТЬ МАКСИМАЛЬНУЮ СТЕПЕНЬ ВНИМАНИЯ К МЕЛОЧАМ, ЧТО, В СВОЮ ОЧЕРЕДЬ, ПОКАЖЕТ, ЧТО ПОСЛЕ ВСЕХ ЭТИХ ЛЕТ ОПЫТА МНЕ ВСЕ ЕЩЕ ВАЖНА МОЯ РАБОТА.
Выбешивайтесь спокойно. Меняйтесь к лучшему.
Больше любви.
Авинаш.

Вас заинтересуют следующие материалы