一句话定义

课程学习通过从易到难组织训练分布,提高学习稳定性与样本效率。

问题设定

  • 输入:任务难度维度与采样策略。
  • 输出:逐步提升的训练任务序列。
  • 假设:任务可分级。
  • 边界:不当课程导致策略偏差。

数学表述

课程可以表示为分布序列 $p_k(\mathcal{T})$: \(\mathcal{T}_1 \rightarrow \mathcal{T}_2 \rightarrow \cdots\)

算法解释

  • 先解决简单任务再扩展到复杂任务。

优化与实现细节

  • 数值要点:课程切换阈值与自动调度。

关联与边界

  • 与奖励设计、探索策略强相关。
  • 边界:训练分布与测试分布偏离。

失败模式

  • 课程过于保守导致泛化不足。
  • 课程过激导致训练崩溃。

最小伪代码

Initialize easy task distribution
Train until threshold
Increase difficulty

决策清单

  • 难度维度可控
  • 课程切换标准明确
  • 泛化评估充分

个人备注

TODO