World Model-based Perception for Visual Legged Locomotion
Title + 摘要 本文提出 World Model-based Perception (WMP),通过世界模型把高维视觉观测压缩为可用于控制的低维隐变量,从而避免“特权信息教师-学生”框架的性能上限和信息鸿沟。方法使用 RSSM 在仿真中学习可预测未来感知的隐状态,并把该隐状态输入到视觉 locomotion...
欢迎来到我的个人主页。我在这里记录机器人与智能系统的学习,也写技术笔记、论文阅读和项目复盘。
Title + 摘要 本文提出 World Model-based Perception (WMP),通过世界模型把高维视觉观测压缩为可用于控制的低维隐变量,从而避免“特权信息教师-学生”框架的性能上限和信息鸿沟。方法使用 RSSM 在仿真中学习可预测未来感知的隐状态,并把该隐状态输入到视觉 locomotion...
Title + 摘要 本文研究如何用机载 3D 激光雷达点云与 sim-to-real 强化学习,实现四旋翼在复杂障碍环境中的低时延自主飞行。作者提出一种任务相关的点云表示:将历史点云在机体坐标系下按角度分区,用“最近点距离/未知区域距离”作为每个分区的数值输入,既保留细障碍感知,又降低维度以支持 RL 训练。策...
Title + 摘要 本文提出 Diffusion Policy,将机器人 visuomotor policy 表示为条件去噪扩散过程,在动作空间中迭代采样生成动作序列。作者在 4 个基准、15 个任务上评估,平均提升 46.9%,并展示在真实机器人上的多任务操作能力。核心优势包括:对多模态动作分布的表达、适配高...
Title + 摘要 本文研究长程无地图导航的核心难题:在仅有前向深度观测的条件下,如何在动态视角变化中形成稳定的空间记忆,从而实现规划与避障。作者指出传统 RNN(LSTM/GRU)擅长时间记忆却不擅长空间配准,导致对历史观测的空间对齐能力不足,难以形成长期空间表征。为此提出 Spatially-Enhance...
Background Bin picking in a cluttered scene with partial observability.
Skill Tree Robot Learning: policy gradients, offline RL, model-based RL Motion Planning: sampling-based, optimization-based, constraints Control: PID,...
Key Concepts Randomize visual, dynamics, and sensor parameters. Use curriculum to expand ranges gradually.
Key Concepts Clip ratio and value loss balance. Advantage normalization and reward scaling. Early stopping based on KL divergence.