ReDirector
Paper:ReDirector: Creating Any-Length Video Retakes with Rotary Camera Encoding
论文解决的核心问题:如何让 AI 完成视频补拍?
现有的视频补拍技术存在 3 个痛点:
- 长度受限:不能处理长视频。
- 几何畸变:剧烈运镜下,动态物体会漂移。
- 对齐困难:难以在保留原相机质量的同时,精准遵循轨迹。
位置编码的修正
以往方法对输入和目标视频应用不同的位置编码,导致模型很难理解它们在物理空间上的对应关系。所以
ReDirector 提出对输入视频
论文提出了旋转相机编码 RoCE,通过 MLP 将相机参数
具体来说,论文首先根据相机参数
几何感知注意力
在标准的 Transformer 注意力中,
其中
ReDirector
https://d4wnnn.github.io/2026/03/28/Notion/ReDirector/