ChordEdit

Paper:ChordEdit: One-Step Low-Energy Transport for Image Editing,最佳学生论文提名。

image.png

论文解决的核心问题:如何在 Training-free 且 Inversion-free 的前提下,实现高质量的 One-step 文本引导图像编辑?

传统方法的失效: 如果直接套用传统的免训练微分编辑方法(即简单地将目标文本和源文本的漂移场做差:),在单步大步长积分下,会产生一个高能量、极不稳定的剧烈波动控制场 。这会导致编辑结果出现严重的物体畸变,以及非编辑区域(如背景)的彻底崩溃和解体 。

为了消除传统残差场的高能毒性,作者设计了一个时空平滑算子,通过在微小的全因果时间窗口 内进行时间加权平均,推导出了“和弦控制场”

意思就是(遵循代码的参数):

  • 先到 step = 0.9,然后 src prompt 和 target prompt 分别预测一遍,估计方向
  • 再从 step = 0.75,然后 src prompt 和 target prompt 分别预测一遍,估计方向

然后平滑:

最后,代码直接执行单步大跨步(步长 \lambda=1.00):


ChordEdit
https://d4wnnn.github.io/2026/06/21/Notion/ChordEdit/
作者
D4wn
发布于
2026年6月21日
许可协议