mindmap
新视角生成
    新视角生成
    相机轨迹控制的视频生成

新视角生成

首先,它们需要对大规模图像到图像(I2I)或视频到视频(V2V)扩散模型进行预训练,这会带来巨大的计算成本。
其次,虽然它们能够修复插值视角下的伪影,但无法恢复外推视角下的未观测区域,在此类视角下渲染结果常出现空洞。
第三,这些方法是为新视角合成量身定制的,生成的渲染结果视觉上看似合理,但缺乏一致的底层几何结构。

相机轨迹控制的视频生成

CameraCtrl[He等人2025a]将相机运动编码到U-Net骨干网络的注意力层中。 TrajectoryCrafter[Yu等人2025]沿预定义的相机路径对输入视图进行变形,以提供参考视频的条件信息。 CamTrol[Hou和Chen 2025]则利用点云渲染的逆过程为生成过程提供布局先验。