ReCamMaster
Paper:ReCamMaster: Camera-Controlled Generative Rendering from A Single Video
论文解决的核心问题:如何通过指定的相机轨迹,对一段视频进行重拍?比如修改运镜。
论文的核心框架如上。看图的最左侧,输入的
论文将源视频和目标视频在帧维度上进行拼接,
然后将相机外参(去掉了相机内参,因为真实视频很难获取内参)通过线性编码器加到了空间注意力的输出上。
什么是相机外参?
也就是图里面的
具体定义是一个
这个参数
什么是空间注意力?
视频生成模型通常处理的是 3D 数据(2D 的画面和 1D 的时间)。
空间注意力是指在同一帧画面内部找关系,而 3D/时间注意力是让模型跨越时间去对比。
ReCamMaster
https://d4wnnn.github.io/2026/03/17/Notion/ReCamMaster/