Поиск стандартных имен потребителей и стандартных опечаток в них

Не так давно мы провели большую работу, направленную на повышение качества данных на проектах наших клиентов — составили списки стандартных имен и отчеств, выделили типичные опечатки в именах и отчествах и, как следствие, смогли определять потребителей с невалидным полом (т. е. тех, у кого имя мужское, а пол в анкете указан женский и наоборот).
Таким образом у нас получилось:
— 1947 стандартных имени
— 2986 стандартных отчества
— 1023 стандартные опечатки в имени
— 1807 стандартных опечатки в отчествах
Соответственно, появились следующие условия в фильтрах по потребителю:
— Имя и отчество — опции «заполнен и стандартное» и «заполнен и нестандартное»
— Стандартная опечатка в имени и стандартная опечатка в отчестве
— Невалидный пол
Это позволяет строить, например, такие фильтры:
Фильтр по потребителям
Разумеется, это не значит, что имя (или отчество) обязательно некорректное, они могут быть просто очень редкими и не попасть в наш справочник.
Еще можно проверять пол:
Проверка пола потребителя
Пол потребителя
На основании этих данных, уже были успешно почищены базы данных некоторых крупных клиентов.
Практически такие же стандартные, как и наши списки, моаи с аху Тонгарики одобряют и надеются найти в них себя.
Tongariki

Вас заинтересуют следующие материалы