数据集:HumanVid

HumanVid是第一个针对人体图像量身定制的大规模高质量数据集动画,结合了精心制作的现实世界和合成数据。

原始数据

  1. 现实世界的数据:从互联网上收集了大量无版权的现实世界视频。通过精心设计的基于规则的过滤策略,我们确保包含高质量视频,从而收集了 20K 个 1080P 分辨率的以人为中心的视频。
  2. 收集了 2,300 个无版权的 3D 头像资产,以扩充现有的可用 3D 资产。

合成数据

对原始数据2,使用一种基于规则的相机轨迹生成方法,使合成管道能够包含多样化且精确的相机运动注释,这在现实世界的数据中很少见。

人工标注

生成标注

  1. 人体和相机运动注释:使用 2D 位姿估计器和基于 SLAM 的方法完成的。