DiCache

Paper：DiCache: Let Diffusion Model Determine Its Own Cache

现有的扩散模型（尤其是基于 Transformer 架构的 DiT）生成速度慢、计算成本高。虽然有许多基于缓存的加速方法，通过复用前后时间步的相似特征来减少计算，但它们都无法完美回答两个核心问题：“何时缓存” 和 “如何利用缓存”。

创新点1：在线探针剖析方案解决“何时缓存”

想知道整个模型（比如 50 层的 Transformer）在相邻两个时间步之间的输出差异有多大，不需要真的把 50 层全部算完。作者发现，模型浅层（前几层）特征的变化趋势，和深层（最终输出）特征的变化趋势具有极强的样本相关性。

在每一个时间步，模型只计算前层（极小，如）作为“探针”（Probe），计算这层特征在相邻步之间的相对距离，以此作为整体缓存误差的“平替”指标：

缓存决策：在运行时维护一个累积误差 。如果累积误差在设定的阈值之内，就直接复用上一阶段缓存的模型残差（Skip 掉后面大几十层的计算）；一旦累积误差超过，说明特征变化太剧烈了，就不能再用旧缓存了，此时模型会直接从第 层向后继续计算，刷新缓存，并重置累积误差。因为探针本身就是前层的计算，所以恢复完整计算时完全没有额外计算开销 。

创新点二：动态缓存轨迹对齐

之前的方法即使缓存了特征，在 reuse（复用）阶段也是直接死板地拿过来用（零阶近似），或者用固定的泰勒展开去预测。作者发现，虽然各层的具体特征不同，但它们在时间步演进中的“几何运动轨迹”是非常相似的 。

作者先在探针特征上，求解出当前步在历史轨迹中所处的相对位置系数 ：

然后利用这个探针算出来的系数，直接去对完整残差做一阶线性插值预测：

#Diffusion Efficiency

DiCache

https://d4wnnn.github.io/2026/06/15/Notion/DiCache/

作者

D4wn

发布于

2026年6月15日

许可协议

ZEUS 上一篇

Fast3DCache 下一篇