GaussiAnimate: Rethinking Gaussian Splatting for Articulated Models via Skeleton-Aware Representation
研究背景与问题
目的
解决 3D Gaussian Splatting (3DGS) 用于关节模型(articulated models)时的三大核心痛点。
现有方法及局限性
- 骨骼绑定依赖 LBS — Linear Blend Skinning 对非线性形变表达差
- 高斯球分布冗余 — 缺乏结构感知,大量冗余高斯球
- 运动控制信号单一 — 难以处理复杂动作
本文方法
提出 GaussiAnimate,核心是 Scaffold-Skin Rigging System ("Skelebones"):
- Bones: 将变形高斯压缩为自由骨骼(free bones)
- Skeleton: 提取平均曲率骨架(mean curvature skeleton)
- Binding: 通过 PartMM(Part-aware Mixture Model)进行概率加权绑定
PSNR 比 LBS 提升 17.3%,比 BoB 提升 21.7%。
核心贡献
1. PartMM (Part-aware Mixture Model)
替代传统 LBS 的骨骼-高斯绑定方案。PartMM 用距离 softmax 概率替代人工皮肤权重,用 MLP 学习的非线性残差替代刚体变换,突破 LBS 的线性表达上限。
PartMM 详解
核心思想:每个高斯球对每个 part 计算一个部件亲和概率(part affinity probability),用这个概率对各 part 的非线性变换做加权混合,得到最终变形位置。
流程(4 步):
Step 1: Part Affinity Probability(概率混合分布)
每个高斯球 \(i\) 对每个 part \(j\) 计算亲和概率:
\[p_{ij} = \frac{\exp(-d(\mu_i, G_j)^2 / \sigma^2)}{\sum_k \exp(-d(\mu_i, G_k)^2 / \sigma^2)}\]
- \(\mu_i\):高斯球 \(i\) 的中心位置
- \(G_j\):part \(j\) 的质心
- \(d(\mu_i, G_j)\):高斯球到 part 质心的距离
- 所有 part 的概率加起来为 1,形成"概率混合分布"
- 距离 part 质心越近,概率越大
Step 2: Part 的非线性变换(与 LBS 的本质区别)
每个 part \(j\) 不是用刚体变换,而是用带残差的非线性变换:
\[T_j(x) = x + \Delta T_j(x)\]
其中 \(\Delta T_j(x)\) 由一个 MLP 残差网络 预测:
\[\Delta T_j(x) = \text{MLP}j(G, \theta, j, p{ij})\]
输入包括:骨架图 \(G\)、关节角度 \(\theta\)、part 索引 \(j\)、part affinity 概率 \(p_{ij}\)。
Step 3: 高斯球的最终变形
高斯球 \(i\) 的最终位置是所有 part 变换的概率加权和:
\[\mu'i = \sum_j p{ij} \cdot T_j(\mu_i)\]
形式上跟 LBS 的 \(\sum w_i (R_i v + t_i)\) 类似,但关键区别在于变换本身的表达能力。
Step 4: Affinity Loss(训练约束)
\[L_{\text{affinity}} = \sum_i \sum_j p_{ij} \cdot d(\mu_i, G_j)\]
促使高斯球倾向于靠近 part 质心,让概率分布更加集中,避免均匀分布。
和 LBS 的对比:
| LBS | PartMM | |
|---|---|---|
| 权重来源 | 人工绑定或手动指定 | 空间距离的 softmax(自动学习,可训练) |
| 每个骨骼/Part 的变换 | 刚体变换 \(R_i x + t_i\)(只能旋转+平移) | 非线性残差 \(x + \Delta T_j(x)\)(MLP 学习) |
| 混合方式 | 线性加权 | 非线性加权 |
| 关节处表现 | 面条臂伪影 | 自然形变(MLP 可学习任意复杂形变) |
效果:PSNR 比 LBS 高 17.3%,比 BoB 高 21.7%
2. Structure-Guided Initialization
基于提取的骨架结构来初始化高斯球的分布,消除冗余高斯球。
3. 多模态运动驱动
支持文本、视频、动作序列多种输入模态驱动角色动画。
4. Gaussian Splatting Skeleton Compression (GSSC)
高效压缩骨架表示。
技术特点
| 特征 | 描述 |
|---|---|
| 静态高斯模型 | SMPL / HumanML3D |
| 表达对象 | 人形角色 |
| 运动代理类型 | Skeleton Agent(骨骼) |
| 绑定方式 | PartMM(替代 LBS) |
| 驱动方式 | 多模态(文本/视频/动作序列) |
| vs LBS | +17.3% PSNR |
| vs BoB | +21.7% PSNR |
与知识库的关联
ImportantArticles — 3DGSAnimation
- 作为新建 "Skeleton Agent(骨骼/角色动画)" 类别的首篇条目
- 填补了 "无代理" 和 "物理仿真代理" 之间的空白地带
- PartMM 替代 LBS 的思路可作为该类别的方法论标杆
GAMES105 — Skinning
- 直接对比并超越 LBS(Skinning 章节核心内容 P31-P33)
- 应在 Advanced Skinning Methods 章节新增 Skelebones 条目
- 与 Learning-based.md 的 Motion Matching 章节互补
Reference
- arXiv: 2604.08547
- PDF: ReadPapers/220
- IA 知识库:
src/3DGSAnimation/3DGSAnimation.md→ Skeleton Agent 类别