变分自编码器 VAE
一句话定义
VAE 通过变分推断学习可生成的潜在变量模型。
问题设定
- 输入:样本 $x$。
- 输出:潜在分布 $q_\phi(z\mid x)$ 与生成模型 $p_\theta(x\mid z)$。
- 假设:潜在变量可解释数据生成过程。
- 边界:解码器过强时会忽略潜变量(posterior collapse)。
数学表述
ELBO: \(\mathcal{L} = \mathbb{E}_{q_\phi(z\mid x)}[\log p_\theta(x\mid z)] - \mathrm{KL}(q_\phi(z\mid x)\|p(z))\)
算法解释
- 第一项是重构质量。
- 第二项约束潜在分布接近先验。
优化与实现细节
- 目标来源:变分下界最大化。
- 数值要点:重参数化技巧 $z=\mu+\sigma\odot\epsilon$。
关联与边界
- 对比 AE:VAE 具备概率语义与生成能力。
- 对比 GAN:VAE 更稳定但样本质量可能较低。
失败模式
- 后验塌缩。
- KL 权重不平衡。
最小伪代码
Encode q(z|x), sample z
Decode x_hat = p(x|z)
Optimize ELBO
决策清单
- 需要生成式模型
- 采用 KL annealing 或 beta 调整
- 监控后验塌缩
个人备注
TODO