目录结构 1. 机器学习之数据清洗概念 1.1 机器学习 1.2 数据清洗 2. 数据清洗 2.1 实验目的 2.2 实验准备 2.3 实验原理 2.4 实验内容 2.4.1 获取数据,整体去重; 2.4.2 整体查看数据类型以及缺失情况; 2.4.3 删除缺失率过高的变量; 2.4.4 删除不需要入模的变量; 2.4.5 删除文本型变量,有缺失值行; 2.4.6 修复变量类型; 2.4.7 变量数据处理方式划分; 2.4.8 变量数据处理方式划分; 2.4.9 拼接数据处理流水线. 2.5 实验心得