Не так давно мы провели большую работу, направленную на повышение качества данных на проектах наших клиентов — составили списки стандартных имен и отчеств, выделили типичные опечатки в именах и отчествах и, как следствие, смогли определять потребителей с невалидным полом.
27 октября 2014
Поиск стандартных имен потребителей и стандартных опечаток в них
Не так давно мы провели большую работу, направленную на повышение качества данных на проектах наших клиентов — составили списки стандартных имен и отчеств, выделили типичные опечатки в именах и отчествах и, как следствие, смогли определять потребителей с невалидным полом (т. е. тех, у кого имя мужское, а пол в анкете указан женский и наоборот).
Таким образом у нас получилось:
— 1947 стандартных имени
— 2986 стандартных отчества
— 1023 стандартные опечатки в имени
— 1807 стандартных опечатки в отчествах
Соответственно, появились следующие условия в фильтрах по потребителю:
— Имя и отчество — опции «заполнен и стандартное» и «заполнен и нестандартное»
— Стандартная опечатка в имени и стандартная опечатка в отчестве
— Невалидный пол
Это позволяет строить, например, такие фильтры:
![Фильтр по потребителям Фильтр по потребителям](https://image.mindbox.ru/draw/25d6c51b-574b-4990-89b0-cd065a2395e3.jpg/-/size/1600/webp/1)
Разумеется, это не значит, что имя (или отчество) обязательно некорректное, они могут быть просто очень редкими и не попасть в наш справочник.
Еще можно проверять пол:
![Проверка пола потребителя Проверка пола потребителя](https://image.mindbox.ru/draw/e268ae5d-7803-42bc-aaac-3ddb945eee4c.jpg/-/size/1600/webp/1)
![Пол потребителя Пол потребителя](https://image.mindbox.ru/draw/15f57287-a762-4e6c-9624-caec85914147.png/-/size/1600/webp/1)
На основании этих данных, уже были успешно почищены базы данных некоторых крупных клиентов.
Практически такие же стандартные, как и наши списки, моаи с аху Тонгарики одобряют и надеются найти в них себя.
![Tongariki Tongariki](https://image.mindbox.ru/draw/65f9b6b4-83d6-42d6-9f76-23c96b73ace2.jpg/-/size/1600/webp/1)