1. 定位导航
前几篇我们解决了"如何训练一个模型"。但实际项目中真正决定成败的,往往不是模型本身,而是怎么调参和怎么评估。本篇覆盖:
- 超参数的本质(与参数的区别)
- 训练集 / 验证集 / 测试集三分法
- K 折交叉验证(小数据救命稻草)
- 点估计、偏差、方差的统计学定义
- 偏差-方差权衡——理解过拟合的统计视角
2. 超参数(Hyperparameters)
2.1 定义
超参数:在学习算法之外设定,不通过梯度下降学习的配置。
2.2 常见超参数(DL 场景)
| 类型 | 例子 |
|---|---|
| 架构 | 网络层数、每层宽度、注意力头数 |
| 优化 | 学习率 |