自编码器 Autoencoders

一句话定义

自编码器通过重构输入来学习紧凑的潜在表示。

问题设定

输入：样本 $x \in \mathbb{R}^d$。
输出：潜在表示 $z$ 与重构 $\hat{x}$。
假设：低维表示可保留关键信息。
边界：可能学到恒等映射或无用特征。

数学表述

编码与解码： \(z = f_\theta(x), \quad \hat{x} = g_\phi(z)\) 重构目标： \(\min_{\theta,\phi} \; \frac{1}{n} \sum_{i=1}^n \|x_i-\hat{x}_i\|_2^2\)

算法解释

通过瓶颈约束迫使模型抽取有效特征。
可用于降维、去噪或预训练。

优化与实现细节

目标来源：重构误差最小化。
数值要点：容量过大易学到恒等映射；用稀疏/降噪/正则化限制。

关联与边界

对比 PCA：自编码器可建模非线性。
对比 VAE：VAE 以概率建模并引入 KL 正则。
边界：无监督表示可能不利于下游任务。

失败模式

过拟合导致无泛化表示。
潜在维度过高导致无约束。

最小伪代码

Encode z = f(x)
Decode x_hat = g(z)
Minimize reconstruction loss

决策清单

需要无监督表示
潜在维度与任务匹配
有正则化或瓶颈约束

个人备注

TODO