[2023.5.2] Calm: Conditional Adversarial Latent Models for Directable Virtual Characters
摘要
CALM 提出了条件对抗潜模型,用于生成可定向的虚拟角色运动。该方法采用两阶段训练策略:首先预训练动作自编码器学习动作本身的结构,然后通过对抗训练加入控制条件,实现灵活的运动控制。
核心方法
两阶段训练流程
阶段 1:预训练动作自编码器(Motion AE)
- 只用运动捕捉数据,先不管控制条件 c
- 训练 Encoder + Decoder
- 目标:学会把动作 x 编码成 z,再重建回来
- 作用:先学会动作本身的结构
阶段 2:对抗训练,加入条件 c(CALM 核心)
- 加入控制条件 c(方向、速度、动作类型等)
- 加入 Discriminator(判别器)
- 条件生成:根据 c 生成对应的动作
- 对抗学习:判别器区分真假动作,生成器骗过判别器
技术架构
阶段 1: Motion AE
动作 x → Encoder → 潜变量 z → Decoder → 重建动作 x'
阶段 2: Conditional GAN
条件 c + 噪声 → Generator → 动作 x
动作 x → Discriminator → 真/假判断
核心优势
- 解耦表示:潜变量 z 编码动作结构,条件 c 控制运动属性
- 灵活控制:可以指定方向、速度、动作类型等
- 高质量生成:对抗训练保证生成动作的自然性
- 两阶段稳定:先学结构再学控制,训练更稳定
与相关方法对比
| 方法 | 生成模型 | 控制方式 | 训练策略 |
|---|---|---|---|
| CALM | GAN (对抗) | 条件 c | 两阶段 (AE+GAN) |
| DiffuseLoco | Diffusion | 多专家蒸馏 | 纯离线蒸馏 |
| Perpetual | ? | 视频/动捕 | 实时跟踪 |
| PARC | Diffusion | 地形 + 迭代 | 数据扩增 |
基本信息
- 论文: arXiv:2305.xxxx (2023.5.2)
- 会议: 待确认
- 领域: 角色动画,对抗生成,条件控制
启发
CALM 展示了对抗生成在角色动画中的应用,通过两阶段训练实现了稳定的条件控制。与扩散模型相比,GAN 的优势在于推理速度快,适合实时应用;劣势在于训练稳定性较差。CALM 的两阶段策略有效缓解了这一问题。
笔记来源: 滴答清单
创建时间: 2026-03-22