DiCache
Paper:DiCache: Let Diffusion Model Determine Its Own Cache
现有的扩散模型(尤其是基于 Transformer 架构的 DiT)生成速度慢、计算成本高 。虽然有许多基于缓存的加速方法,通过复用前后时间步的相似特征来减少计算 ,但它们都无法完美回答两个核心问题:“何时缓存” 和 “如何利用缓存”。
创新点1:在线探针剖析方案解决“何时缓存”
想知道整个模型(比如 50 层的 Transformer)在相邻两个时间步之间的输出差异有多大,不需要真的把 50 层全部算完 。作者发现,模型浅层(前几层)特征的变化趋势,和深层(最终输出)特征的变化趋势具有极强的样本相关性。
在每一个时间步
缓存决策:在运行时维护一个累积误差
。如果累积误差在设定的阈值
创新点二:动态缓存轨迹对齐
之前的方法即使缓存了特征,在 reuse(复用)阶段也是直接死板地拿过来用(零阶近似),或者用固定的泰勒展开去预测 。作者发现,虽然各层的具体特征不同,但它们在时间步演进中的“几何运动轨迹”是非常相似的 。
作者先在探针特征上,求解出当前步在历史轨迹中所处的相对位置系数
然后利用这个探针算出来的系数,直接去对完整残差做一阶线性插值预测 :
DiCache
https://d4wnnn.github.io/2026/06/15/Notion/DiCache/