StereoPilot
Paper:StereoPilot: Learning Unified and Efficient Stereo Conversion zvia Generative Priors
论文依旧是从 2D 视频到 3D 视频。
多步去噪→单步生成
具体来说,模型将多步去噪转换为单步。
也就是模型
可学习领域切换器
在双目转换中,模拟左右眼观察世界的方式有两种模型:
- 平行格式:左右两个相机的光轴是严格平行的。
- 汇聚格式:3D 电影工业的标准,两个相机的光轴交汇于一点。
StereoPilot 提出了一个轻量级的方法,也就是设计一个 Switcher,这个直接加入到了时间嵌入中:
损失函数设计
模型设计了两种损失函数:
- Rec Loss:重建损失
- Cycle Loss:重建的右视图再变回左视图,必须与原左图一致。
StereoPilot
https://d4wnnn.github.io/2026/03/28/Notion/StereoPilot/