[2023.5.2] Calm: Conditional Adversarial Latent Models for Directable Virtual Characters

摘要

CALM 提出了条件对抗潜模型,用于生成可定向的虚拟角色运动。该方法采用两阶段训练策略:首先预训练动作自编码器学习动作本身的结构,然后通过对抗训练加入控制条件,实现灵活的运动控制。

核心方法

两阶段训练流程

阶段 1:预训练动作自编码器(Motion AE)

  • 只用运动捕捉数据,先不管控制条件 c
  • 训练 Encoder + Decoder
  • 目标:学会把动作 x 编码成 z,再重建回来
  • 作用:先学会动作本身的结构

阶段 2:对抗训练,加入条件 c(CALM 核心)

  • 加入控制条件 c(方向、速度、动作类型等)
  • 加入 Discriminator(判别器)
  • 条件生成:根据 c 生成对应的动作
  • 对抗学习:判别器区分真假动作,生成器骗过判别器

技术架构

阶段 1: Motion AE
动作 x → Encoder → 潜变量 z → Decoder → 重建动作 x'

阶段 2: Conditional GAN
条件 c + 噪声 → Generator → 动作 x
动作 x → Discriminator → 真/假判断

核心优势

  1. 解耦表示:潜变量 z 编码动作结构,条件 c 控制运动属性
  2. 灵活控制:可以指定方向、速度、动作类型等
  3. 高质量生成:对抗训练保证生成动作的自然性
  4. 两阶段稳定:先学结构再学控制,训练更稳定

与相关方法对比

方法生成模型控制方式训练策略
CALMGAN (对抗)条件 c两阶段 (AE+GAN)
DiffuseLocoDiffusion多专家蒸馏纯离线蒸馏
Perpetual视频/动捕实时跟踪
PARCDiffusion地形 + 迭代数据扩增

基本信息

  • 论文: arXiv:2305.xxxx (2023.5.2)
  • 会议: 待确认
  • 领域: 角色动画,对抗生成,条件控制

启发

CALM 展示了对抗生成在角色动画中的应用,通过两阶段训练实现了稳定的条件控制。与扩散模型相比,GAN 的优势在于推理速度快,适合实时应用;劣势在于训练稳定性较差。CALM 的两阶段策略有效缓解了这一问题。


笔记来源: 滴答清单
创建时间: 2026-03-22