Python|机器学习之数据清洗
目录结构
1. 机器学习之数据清洗概念
1.1 机器学习
1.2 数据清洗
2. 数据清洗
2.1 实验目的
2.2 实验准备
2.3 实验原理
2.4 实验内容
2.4.1 获取数据,整体去重;
2.4.2 整体查看数据类型以及缺失情况;
2.4.3 删除缺失率过高的变量;
2.4.4 删除不需要入模的变量;
2.4.5 删除文本型变量,有缺失值行;
2.4.6 修复变量类型;
2.4.7 变量数据处理方式划分;
2.4.8 变量数据处理方式划分;
2.4.9 拼接数据处理流水线.
2.5 实验心得