主页 - Jerry Zhu Home

欢迎来到我的个人主页。我在这里记录机器人与智能系统的学习，也写技术笔记、论文阅读和项目复盘。

World Model-based Perception for Visual Legged Locomotion

1 minute read

Title + 摘要本文提出 World Model-based Perception (WMP)，通过世界模型把高维视觉观测压缩为可用于控制的低维隐变量，从而避免“特权信息教师-学生”框架的性能上限和信息鸿沟。方法使用 RSSM 在仿真中学习可预测未来感知的隐状态，并把该隐状态输入到视觉 locomotion...

Flying on Point Clouds with Reinforcement Learning

1 minute read

Title + 摘要本文研究如何用机载 3D 激光雷达点云与 sim-to-real 强化学习，实现四旋翼在复杂障碍环境中的低时延自主飞行。作者提出一种任务相关的点云表示：将历史点云在机体坐标系下按角度分区，用“最近点距离/未知区域距离”作为每个分区的数值输入，既保留细障碍感知，又降低维度以支持 RL 训练。策...

Diffusion Policy: Visuomotor Policy Learning via Action Diffusion

1 minute read

Title + 摘要本文提出 Diffusion Policy，将机器人 visuomotor policy 表示为条件去噪扩散过程，在动作空间中迭代采样生成动作序列。作者在 4 个基准、15 个任务上评估，平均提升 46.9%，并展示在真实机器人上的多任务操作能力。核心优势包括：对多模态动作分布的表达、适配高...

Spatially-Enhanced Recurrent Memory for Long-Range Mapless Navigation

2 minute read

Title + 摘要本文研究长程无地图导航的核心难题：在仅有前向深度观测的条件下，如何在动态视角变化中形成稳定的空间记忆，从而实现规划与避障。作者指出传统 RNN（LSTM/GRU）擅长时间记忆却不擅长空间配准，导致对历史观测的空间对齐能力不足，难以形成长期空间表征。为此提出 Spatially-Enhance...

Project Retrospective: Grasping in Clutter

less than 1 minute read

Background Bin picking in a cluttered scene with partial observability.

Robot Learning Skill Tree and Roadmap

less than 1 minute read

Skill Tree Robot Learning: policy gradients, offline RL, model-based RL Motion Planning: sampling-based, optimization-based, constraints Control: PID,...

Domain Randomization for Sim2Real

less than 1 minute read

Key Concepts Randomize visual, dynamics, and sensor parameters. Use curriculum to expand ranges gradually.

PPO Tricks for Stable Training

less than 1 minute read

Key Concepts Clip ratio and value loss balance. Advantage normalization and reward scaling. Early stopping based on KL divergence.

主页

Recent Posts