Содержание
- Введение 1
- Типы пропусков данных: классификация и механизмы 2
- - MCAR (Missing Completely at Random): свойства и примеры 2.1
- - MAR (Missing at Random): особенности и примеры 2.2
- - MNAR (Missing Not at Random): сложности и примеры 2.3
- Методы обработки пропусков: удаление и импутация 3
- - Удаление пропусков: плюсы и минусы 3.1
- - Импутация средним, медианой и модой 3.2
- - Продвинутые методы импутации: регрессионная импутация и k-NN 3.3
- Сравнение методов обработки пропусков: оценка и выбор 4
- - Критерии оценки: смещение, дисперсия и RMSE 4.1
- - Влияние выбора метода на результаты анализа 4.2
- - Рекомендации по выбору методов для разных типов пропусков 4.3
- Практическое применение методов обработки пропусков 5
- - Пример 1: Обработка пропусков в данных о продажах 5.1
- - Пример 2: Обработка пропусков в медицинских данных 5.2
- - Пример 3: Обработка пропусков в социальных опросах 5.3
- Заключение 6
- Список литературы 7