一句话定义

泛化是模型在未见数据上的性能,与模型容量、数据分布和正则化共同决定。

问题设定

  • 输入:训练误差与验证误差。
  • 输出:泛化误差估计。
  • 假设:训练/验证分布一致。
  • 边界:分布漂移导致泛化失效。

数学表述

泛化间隙: \(\Delta = R_{test}(f) - R_{train}(f)\)

算法解释

  • 过拟合意味着 $\Delta$ 大。
  • 通过正则化与数据增强降低 $\Delta$。

优化与实现细节

  • 数值要点:交叉验证与早停。

关联与边界

  • 与偏差-方差分解相关。
  • 边界:OOD 场景需域适应或不确定性估计。

失败模式

  • 训练过度导致泛化下降。
  • 过度调参导致验证集过拟合。

最小伪代码

Train model
Track train/val gap
Apply regularization if needed

决策清单

  • 训练/验证分布一致
  • 过拟合已检测
  • 正则化与数据增强有效

个人备注

TODO