新数据处理缺失值结果
总共有440633个特征缺失,数据为109525×72,
暴力删除一些列效果不好,因为有些特征可能有区分性,暴力删除会去掉有区分性的特征,这时候应尽量考虑补全,应该选择有区分性的特征。
去除特定缺失值再补0。
前7列数据缺失值过万了。

缺失值小于10的列共33列距离2.9欧式角37

缺失值小于2600的列数44距离4.2,角度30

缺失值3500 60列距离2.79角度36

8列-44列欧式距离2.9,角度31

1-44列距离2.58欧式角30.3774

5-44列距离2.9角度31.1072

2-44列距离2.7角度31.5282

1-4 8-44列欧式距离2.7717角度30.3607
