Fast3DCache

Paper:Fast3Dcache: Training-free 3D Geometry Synthesis Acceleration

论文是针对 Trellis 的 structure samping 过程进行的加速。

image.png

在 Step 时,拿到了当前的潜在特征网格 。他们没有等到 25 步全部走完,而是在这一步就直接调用 TRELLIS 的 VAE Decoder,将其转换到显式的 3D 空间中。作者把第 步和第 步的二值网格进行异或操作,得到改变了的体素数目。

发现 3D 物体在生成时具有明显的“三阶段稳定规律”:

  1. 阶段 1(粗糙骨架形成): 体素剧烈变化,物体轮廓刚开始捏造。
  2. 阶段 2(几何逐渐稳定): 变化的体素数量急剧减少,且在对数坐标系下呈现出完美的线性衰减趋势(即规律极度可预测)。
  3. 阶段 3(精细微调阶段): 整体结构完全定型,只剩细微调整。

于是可以在阶段 1 结束时设立一个 Anchor Step 进行一次校准,测出初始几何变化量 ,然后直接用一条对数线性公式预判 Forecast 后续所有步骤的变化量

通过对数线性趋势外推,直接计算出当前步骤可以直接扔进缓存的 Token 数量(即缓存预算)

宏观上知道了能偷懒多少(),微观上具体挑哪些 Token 进缓存呢?

作者精妙地引入了物理学中的速度(大小)加速度(方向与大小改变)概念来综合打分:

  • 速度大小 代表当前特征更新的烈度。

  • 加速度大小 ,代表前后两步速度向量的差,用来衡量如果直接用上一步的特征来代替当前步,会带来多大的方向偏离误差。

  • 时空融合打分 将两者归一化后加权求和:

另外作者引入了两个硬性约束:

  • 定期重置(Phase 2): 设置一个硬性步长间隔 ,每隔 步,就强制进行一次全量计算,把之前缓存的微小误差全部校准清零。
  • 全采样修正(Phase 3): 在最后最稳定的 refine 阶段(CFG-Free 阶段),虽然采用极度激进的固定高缓存率 ,但每隔 步做一次全采样修正,确保最终吐出的 3D 网格绝对闭合且无畸变。

Fast3DCache
https://d4wnnn.github.io/2026/06/12/Notion/Fast3DCache/
作者
D4wn
发布于
2026年6月12日
许可协议