Поиск стандартных имен потребителей и стандартных опечаток в них

27 октября ‘14

Не так давно мы провели большую работу, направленную на повышение качества данных на проектах наших клиентов — составили списки стандартных имен и отчеств, выделили типичные опечатки в именах и отчествах и, как следствие, смогли определять потребителей с невалидным полом (т. е. тех, у кого имя мужское, а пол в анкете указан женский и наоборот).

Таким образом у нас получилось:

— 1947 стандартных имени

— 2986 стандартных отчества

— 1023 стандартные опечатки в имени

— 1807 стандартных опечатки в отчествах

Соответственно, появились следующие условия в фильтрах по потребителю:

— Имя и отчество — опции «заполнен и стандартное» и «заполнен и нестандартное»

— Стандартная опечатка в имени и стандартная опечатка в отчестве

— Невалидный пол

Это позволяет строить, например, такие фильтры:

Фильтр по потребителям

Разумеется, это не значит, что имя (или отчество) обязательно некорректное, они могут быть просто очень редкими и не попасть в наш справочник.

Еще можно проверять пол:

Проверка пола потребителя
Пол потребителя

На основании этих данных, уже были успешно почищены базы данных некоторых крупных клиентов.

Практически такие же стандартные, как и наши списки, моаи с аху Тонгарики одобряют и надеются найти в них себя.

Tongariki