西瓜与机器 | 《机器学习》 周志华

Fujisaki / 2023-07-21 / 原文

第一章

奥卡姆剃刀:如果有多个符合的假设,选择最简单的一个。

监督学习与无监督学习:训练数据是否有标注


第二章

评估方法

  • 留出法 (hold-out)

把数据集 \(D\) 划分为两个互斥的集合 \(S,T\),一个用来训练,一个用来测试。

\(S,T\) 的划分需要注意保持数据分布的一致性。

一般用 \(\dfrac{2}{3} \sim \dfrac{4}{5}\) 的数据用于训练,需要多次划分取均值。