[2019.11.13] DReCon: data-driven responsive control of physics-based characters
核心架构
1. 生成 = Motion Matching("传统版生成模型")
- Motion Matching 本质:从数据库里"生成"连续、自然、可控的参考轨迹
- 作用:给出高质量目标姿态/轨迹
2. RL = 训练策略,输出 PD 控制目标
- RL 不直接出力,而是输出:
- 目标角度
- 目标姿态
- 目标速度
- 让物理角色去追参考轨迹
- 奖励函数 = 跟踪准 + 站得稳 + 动作自然
3. PD = 底层执行器(关节马达)
- RL 给出目标
- PD 控制器真正输出力矩
- 稳定、平滑、仿真友好
4. 仿真 = 物理引擎闭环
- Mujoco / Bullet / PhysX
- 接受 PD 力矩 → 更新状态 → 反馈给 RL
- 形成闭环控制
整体结构
Motion Matching(生成) → RL(规划) → PD(执行) → 物理仿真(环境)
技术分析
架构特点
- 分层控制:高层规划(Motion Matching + RL)与底层执行(PD)分离
- 数据驱动:利用动作捕捉数据库生成参考轨迹
- 物理感知:通过物理仿真确保动作的可执行性和稳定性
- 响应式控制:能够实时响应用户输入和环境变化
与相关方法对比
| 方法 | 生成 | 规划 | 执行 | 仿真 |
|---|---|---|---|---|
| DReCon | Motion Matching | RL | PD | ✓ |
| CLOSD | 扩散模型 | 扩散规划器 | RL 跟踪 + PD | ✓ |
| PARC | 扩散模型 | - | RL 跟踪 + PD | ✓ |
关键贡献
- 将 Motion Matching 与 RL 结合,实现数据驱动的响应式控制
- RL 输出控制目标而非直接力矩,提高稳定性和可解释性
- 分层架构便于模块化设计和调试
标签
locomotion | 生成+RL+PD+仿真 | 强化学习 | Motion Matching
基本信息
- 作者: Kevin Bergamin, Simon Clavet, Daniel Holden, James Richard Forbes
- 会议/期刊: ACM SIGGRAPH Asia 2019 / ACM Transactions on Graphics (TOG)
- 年份: 2019
- 卷期: Vol. 38, No. 6, Article 206
- DOI: https://doi.org/10.1145/3355089.3356536
- 页面: 1-11