新数据处理缺失值结果

祥瑞哈哈哈 / 2023-07-24 / 原文

总共有440633个特征缺失,数据为109525×72,


暴力删除一些列效果不好,因为有些特征可能有区分性,暴力删除会去掉有区分性的特征,这时候应尽量考虑补全,应该选择有区分性的特征。

去除特定缺失值再补0。

前7列数据缺失值过万了。

缺失值小于10的列共33列距离2.9欧式角37

 缺失值小于2600的列数44距离4.2,角度30

 缺失值3500 60列距离2.79角度36

 

8列-44列欧式距离2.9,角度31

 1-44列距离2.58欧式角30.3774

5-44列距离2.9角度31.1072

 2-44列距离2.7角度31.5282

1-4 8-44列欧式距离2.7717角度30.3607