[2019.11.13] DReCon: data-driven responsive control of physics-based characters

核心架构

1. 生成 = Motion Matching（"传统版生成模型"）

Motion Matching 本质：从数据库里"生成"连续、自然、可控的参考轨迹
作用：给出高质量目标姿态/轨迹

2. RL = 训练策略，输出 PD 控制目标

RL 不直接出力，而是输出：
- 目标角度
- 目标姿态
- 目标速度
让物理角色去追参考轨迹
奖励函数 = 跟踪准 + 站得稳 + 动作自然

3. PD = 底层执行器（关节马达）

RL 给出目标
PD 控制器真正输出力矩
稳定、平滑、仿真友好

4. 仿真 = 物理引擎闭环

Mujoco / Bullet / PhysX
接受 PD 力矩 → 更新状态 → 反馈给 RL
形成闭环控制

整体结构

Motion Matching（生成） → RL（规划） → PD（执行） → 物理仿真（环境）

技术分析

架构特点

分层控制：高层规划（Motion Matching + RL）与底层执行（PD）分离
数据驱动：利用动作捕捉数据库生成参考轨迹
物理感知：通过物理仿真确保动作的可执行性和稳定性
响应式控制：能够实时响应用户输入和环境变化

与相关方法对比

方法	生成	规划	执行	仿真
DReCon	Motion Matching	RL	PD	✓
CLOSD	扩散模型	扩散规划器	RL 跟踪 + PD	✓
PARC	扩散模型	-	RL 跟踪 + PD	✓

关键贡献

将 Motion Matching 与 RL 结合，实现数据驱动的响应式控制
RL 输出控制目标而非直接力矩，提高稳定性和可解释性
分层架构便于模块化设计和调试

标签

locomotion | 生成+RL+PD+仿真 | 强化学习 | Motion Matching

基本信息

作者: Kevin Bergamin, Simon Clavet, Daniel Holden, James Richard Forbes
会议/期刊: ACM SIGGRAPH Asia 2019 / ACM Transactions on Graphics (TOG)
年份: 2019
卷期: Vol. 38, No. 6, Article 206
DOI: https://doi.org/10.1145/3355089.3356536
页面: 1-11