EMDM: Efficient Motion Diffusion Model for Fast and High-Quality Motion Generation
本文提出高效运动扩散模型(EMDM),旨在实现快速、高质量的人体运动生成。当前最先进的生成式扩散模型虽能产生令人印象深刻的结果,但在保持质量的同时难以实现快速生成。一方面,诸如运动潜在扩散等方法为提升效率在潜在空间中进行扩散,但学习此类潜在空间本身需要大量计算资源;另一方面,若直接采用增大采样步长的方式(如DDIM)加速生成,则因难以逼近复杂的去噪分布往往导致质量下降。为解决这些问题,我们提出的EMDM模型能够在扩散模型的多步采样过程中有效捕捉复杂分布,从而大幅减少采样步骤并显著加速生成过程。该模型通过条件去噪扩散GAN技术,在任意(可能更大)步长条件下根据控制信号捕捉多模态数据分布,实现高保真度、多样化的少步数运动采样。为减少不良运动伪影,我们在网络学习过程中引入几何约束损失。实验表明,EMDM可实现实时运动生成,在保证高质量运动生成的同时,较现有方法显著提升了运动扩散模型的效率。研究成果发表后代码将开源发布。