贝叶斯推断 Bayesian Inference

一句话定义

贝叶斯推断通过后验分布 $p(\theta\mid\mathcal{D})$ 量化参数不确定性，并用于预测。

问题设定

输入：数据 $\mathcal{D}$、先验 $p(\theta)$。
输出：后验 $p(\theta\mid\mathcal{D})$ 与预测分布。
假设：模型与先验可表达数据生成过程。
边界：复杂模型后验不可解析需近似。

数学表述

贝叶斯公式： $p(\theta\mid\mathcal{D}) = \frac{p(\mathcal{D}\mid\theta) p(\theta)}{p(\mathcal{D})}$ 预测分布： $p(y\mid x, \mathcal{D}) = \int p(y\mid x,\theta) p(\theta\mid\mathcal{D}) \, d\theta$

算法解释

后验整合先验与数据。
预测通过后验平均降低过拟合。

优化与实现细节

目标来源：后验推断。
求解器：共轭解析解、MCMC、变分推断。
数值要点：后验近似质量影响预测。

关联与边界

对比 MAP：贝叶斯给出分布而非点估计。
对比频率学派：频率学派以参数固定、样本随机为假设。
边界：先验敏感，小样本时影响更大。

失败模式

先验不合理导致后验偏差。
近似推断质量不足。
计算成本过高。

最小伪代码

Input: D, prior p(theta)
Compute posterior p(theta|D)
Predict by integrating over theta

决策清单

需要不确定性量化
先验可解释且可辩护
近似推断误差可接受

个人备注

TODO