正则化 Regularization
一句话定义
正则化通过加入惩罚项或约束控制模型复杂度,提高泛化能力与数值稳定性。
问题设定
- 输入:基础目标 $\mathcal{L}(\theta)$。
- 输出:正则化后的目标或约束形式。
- 假设:模型存在过拟合风险或病态问题。
- 边界:过强正则会导致欠拟合。
数学表述
一般形式: \(\min_{\theta} \; \mathcal{L}(\theta) + \lambda \Omega(\theta)\) 常见:$\ell_2$(ridge)与 $\ell_1$(lasso)。
算法解释
- $\ell_2$ 收缩参数,改善条件数。
- $\ell_1$ 产生稀疏解,执行特征选择。
优化与实现细节
- 目标来源:MAP(先验对应正则)。
- 选择:交叉验证调 $\lambda$。
- 数值要点:正则与特征缩放耦合。
关联与边界
- 对比早停:早停可视作隐式正则。
- 对比数据增强:通过扩展数据降低方差。
- 边界:正则不能修复数据偏差或标签错误。
失败模式
- 正则过强导致偏差增大。
- 不同特征尺度导致惩罚不均衡。
最小伪代码
Input: loss L(theta), penalty Omega
Choose lambda
Optimize L + lambda * Omega
决策清单
- 是否存在过拟合或病态
- 选择合适正则形式
- 正则强度有验证支持
个人备注
TODO