Paper：One-Step Diffusion with Distribution Matching Distillation，CVPR 2024

传统的扩散模型虽然生成图像质量极高，但其核心痛点是慢。它们必须通过一个漫长、迭代的去噪过程才能将高斯噪声转化为图像。这极大地限制了其在实时交互、设计预览等高时效性场景中的应用。

虽然此前也有许多“蒸馏”方法（想把多步压缩到单步），但它们要么生成质量塌方，要么在蒸馏训练时需要完整跑完多步去噪轨迹，导致计算成本极其高昂 。

DMD 解决的核心问题就是：如何在几乎不损失图像质量、不增加荒谬训练成本的前提下，把多步扩散模型“脱胎换骨”成一个只需要单步前向传播的极速生成器。（最终实现 512x512 分辨率下 20 FPS 的实时生成）。

如何解决

核心思想：不强求“单步生成器”去精确模仿原模型每一步的降噪映射轨迹，而是强求它们生成的“图像分布”在统计上和原模型一模一样。

对于 student diffusion，最终 loss 可以分成两部分：

首先是 distribution matching loss，构造梯度：

其中：

然后是 regression loss。作者预先生成一些配对数据：

其中是噪声，是 teacher diffusion 多步采样得到的图。然后训练：

这里的用的是 LPIPS 感知损失。

#Diffusion

DMD

https://d4wnnn.github.io/2026/05/30/Notion/DMD/

作者

D4wn

发布于

2026年5月30日

许可协议