【MT】Data anlysis
1 Pretreatment
- 缺失&异常
- 散点图
2 Anlaysis
2.1 Normal test
2.2.1 描述性统计/图示
直方/Quantile-quantile plot
2.2.2 code
gg <- ggplot(data = smp, mapping = aes(sample = norm)) + stat_qq_band() + stat_qq_line() + stat_qq_point() + labs(x = "Theoretical Quantiles", y = "Sample Quantiles") gg
2.2 Regression
2.2.1 一元
$x,y$必须连续,$y$或其残差必须服从正态分布
2.2.2 多元
$x,y$必须连续,$y$或其残差必须服从正态分布
3 Model
3.1 分类
分类模型:决策树,朴素贝叶斯分类,支持向量机(SVM),最近领分类(KNN)
聚类模型:K-Means
关联分析:Apriori
连接模型:PageRank
3.2 评价
层次分析法、灰色关联度分析、神经网络综合评价法
3.3 预测
朴素估计、简单平均、滑动平均、简单指数平滑
作者:TangBao~
-------------------------------------------
个性签名:啦啦啦~这是个勤快的作者呢~(っ•̀ω•́)っ✎⁾⁾!