一句话定义

自编码器通过重构输入来学习紧凑的潜在表示。

问题设定

  • 输入:样本 $x \in \mathbb{R}^d$。
  • 输出:潜在表示 $z$ 与重构 $\hat{x}$。
  • 假设:低维表示可保留关键信息。
  • 边界:可能学到恒等映射或无用特征。

数学表述

编码与解码: \(z = f_\theta(x), \quad \hat{x} = g_\phi(z)\) 重构目标: \(\min_{\theta,\phi} \; \frac{1}{n} \sum_{i=1}^n \|x_i-\hat{x}_i\|_2^2\)

算法解释

  • 通过瓶颈约束迫使模型抽取有效特征。
  • 可用于降维、去噪或预训练。

优化与实现细节

  • 目标来源:重构误差最小化。
  • 数值要点:容量过大易学到恒等映射;用稀疏/降噪/正则化限制。

关联与边界

  • 对比 PCA:自编码器可建模非线性。
  • 对比 VAE:VAE 以概率建模并引入 KL 正则。
  • 边界:无监督表示可能不利于下游任务。

失败模式

  • 过拟合导致无泛化表示。
  • 潜在维度过高导致无约束。

最小伪代码

Encode z = f(x)
Decode x_hat = g(z)
Minimize reconstruction loss

决策清单

  • 需要无监督表示
  • 潜在维度与任务匹配
  • 有正则化或瓶颈约束

个人备注

TODO