[2019.11.13] DReCon: data-driven responsive control of physics-based characters

核心架构

1. 生成 = Motion Matching("传统版生成模型")

  • Motion Matching 本质:从数据库里"生成"连续、自然、可控的参考轨迹
  • 作用:给出高质量目标姿态/轨迹

2. RL = 训练策略,输出 PD 控制目标

  • RL 不直接出力,而是输出:
    • 目标角度
    • 目标姿态
    • 目标速度
  • 让物理角色去追参考轨迹
  • 奖励函数 = 跟踪准 + 站得稳 + 动作自然

3. PD = 底层执行器(关节马达)

  • RL 给出目标
  • PD 控制器真正输出力矩
  • 稳定、平滑、仿真友好

4. 仿真 = 物理引擎闭环

  • Mujoco / Bullet / PhysX
  • 接受 PD 力矩 → 更新状态 → 反馈给 RL
  • 形成闭环控制

整体结构

Motion Matching(生成) → RL(规划) → PD(执行) → 物理仿真(环境)

技术分析

架构特点

  • 分层控制:高层规划(Motion Matching + RL)与底层执行(PD)分离
  • 数据驱动:利用动作捕捉数据库生成参考轨迹
  • 物理感知:通过物理仿真确保动作的可执行性和稳定性
  • 响应式控制:能够实时响应用户输入和环境变化

与相关方法对比

方法生成规划执行仿真
DReConMotion MatchingRLPD
CLOSD扩散模型扩散规划器RL 跟踪 + PD
PARC扩散模型-RL 跟踪 + PD

关键贡献

  1. 将 Motion Matching 与 RL 结合,实现数据驱动的响应式控制
  2. RL 输出控制目标而非直接力矩,提高稳定性和可解释性
  3. 分层架构便于模块化设计和调试

标签

locomotion | 生成+RL+PD+仿真 | 强化学习 | Motion Matching

基本信息

  • 作者: Kevin Bergamin, Simon Clavet, Daniel Holden, James Richard Forbes
  • 会议/期刊: ACM SIGGRAPH Asia 2019 / ACM Transactions on Graphics (TOG)
  • 年份: 2019
  • 卷期: Vol. 38, No. 6, Article 206
  • DOI: https://doi.org/10.1145/3355089.3356536
  • 页面: 1-11