Flow Map 家族生成模型对比

1. 引言

2025-2026 年见证了生成建模理论的重要统一:以 Flow Map(两时间算子) 为视角,Diffusion、Flow Matching、Consistency Model、MeanFlow 这四大主流方法被纳入同一框架。

本文档系统对比四者的核心数学对象、训练范式、采样过程与适用场景。

2. 核心数学对象对比

2.1 四种方法的核心对象

方法核心数学对象时间参数类别
Diffusion (Score-based)Score 函数 连续 轨迹
Flow Matching瞬时速度场 连续 轨迹
Consistency Model映射 连续 算子
MeanFlow平均速度 二元 算子

关键观察:前两者学习轨迹(沿时间的瞬时变化率),后两者学习算子(两点间的转移)。

2.2 数学定义

Diffusion(Score-based, SDE 视角)

学习量:

Flow Matching

学习量:

Consistency Model

约束: 沿轨迹。一步生成

MeanFlow

一步生成

3. Flow Map 统一视角

3.1 两时间算子定义

Flow Map :将时间 的状态映射到时间 的状态:

这一定义可以统一所有方法

方法 的实现训练方式
Diffusion模拟 SDE/ODEscore matching
Flow Matching数值积分 ODEflow matching
Consistency Model 直接是 consistency loss
MeanFlowidentity loss

3.2 Flow Map 的代数性质

半群性质

即从 可以分解为从 、再从

恒等映射

与速度场的关系

3.3 从算子视角看采样

Diffusion / Flow Matching

Consistency Model

MeanFlow

后两者直接查询算子,无需积分。

4. 训练目标对比

4.1 Score Matching (Diffusion)

目标:预测 score 函数。

数据依赖:需要样本 和随机

4.2 Flow Matching

目标:预测从 的速度

最优性:在条件速度意义下,FM 损失是无条件回归目标的最优形式(无需加权重)。

4.3 Consistency Model

目标:相邻时间点输出一致。

依赖:从 FM 教师蒸馏或自洽训练(CT)。

4.4 MeanFlow

目标:满足平均速度恒等式。

依赖:无教师,仅需 JVP 计算

4.5 训练目标统一性

四个目标都形如:

方法预测目标目标构造方式
Diffusion$\nabla_x \log p(x_tx_0)$
FM解析
CM教师
MF恒等式右端自洽

5. 采样过程对比

5.1 采样器对比

Diffusion (DDPM/DDIM)

# 需要 ~100 步
for t in timesteps:
    x = step(x, model(x, t), t)
return x

Flow Matching (Euler)

# 需要 ~50 步
dt = (t_end - t_start) / n_steps
x = x_start
for _ in range(n_steps):
    v = model(x, t)
    x = x + dt * v
    t = t + dt
return x

Consistency Model

# 1 步
x0 = model(x1, t=1.0)
return x0

MeanFlow

# 1 步
x0 = x1 - model(x1, r=0.0, t=1.0)
return x0

5.2 推理复杂度

方法1 步 FID4 步 FID32 步 FID100 步 FID
Diffusion (EDM2)> 50~102.11.81
Flow Matching> 30~61.81.31
Consistency Model3.52.5--
MeanFlow1.93---

关键观察:在 1 步生成上,MeanFlow 显著优于 CM(1.93 vs 3.5 FID)。

6. 训练稳定性对比

6.1 训练挑战

方法主要挑战解决方案
DiffusionScore 函数奇异噪声条件化
Flow Matching边界行为边界损失项
Consistency Model自洽训练不稳定时间窗口、CT 技巧
MeanFlowJVP 计算成本functorch 高效实现

6.2 收敛速度

训练 FID 收敛曲线(ImageNet 256×256):

迭代步数 (K)     | Diffusion | FM | CM | MeanFlow
100K            | 50        | 30 | 8  | 5
200K            | 20        | 10 | 4  | 2.5
400K            | 5         | 3  | -  | 1.93

MeanFlow 收敛最快:因为目标函数更接近 L2 回归而非一致性约束。

7. 理论联系

7.1 MeanFlow 是 Consistency Model 的泛化

证明

Consistency Model 学 ,等价于平均速度

因此:

这正是 MeanFlow 在 的特例。

MeanFlow 推广 CM 到任意 对,提供了更大的灵活性。

7.2 FM + CM = MeanFlow

Claim:MeanFlow 是 FM 与 CM 的”插值”。

  • FM:学瞬时速度(轨迹)
  • CM:学 的算子
  • MeanFlow:学 的算子( 可任意)

从 MeanFlow 出发:

  • :退化为 FM(局部瞬时速度)
  • :退化为 CM

7.3 算子谱系

将四个方法按”算子记忆”排序:

                    记忆 = 0       记忆 = 1       记忆 = ∞
                    ↓               ↓               ↓
                    瞬时速度       短程记忆       全局记忆
                    FM             MeanFlow        CM (极限)
                                    ↑
                                    │
                              任意 r ∈ [0, t]

8. 实践选型指南

8.1 按场景选型

场景推荐方法原因
追求极致质量Diffusion (EDM2)多步质量最优
追求速度+质量平衡Flow Matching (50 步)经典平衡点
追求极致速度MeanFlow一步生成 + 高质量
训练资源受限Flow Matching训练稳定
需要任意步数控制Flow Matching / MeanFlow都可任意步数
需要 CFGFM 或 Diffusion成熟支持
无教师训练FM 或 MeanFlow都自包含

8.2 部署考虑

方法模型大小推理延迟显存
Diffusion675M (DiT-XL)~10s (100 步)8GB
FM675M~5s (50 步)4GB
CM675M~0.1s (1 步)2GB
MeanFlow675M~0.1s (1 步)2GB

MeanFlow 是边缘部署的最佳选择

8.3 多步退化能力

MeanFlow 不仅支持 1 步,也支持多步(用 多次查询):

def meanflow_multistep(model, x_start, n_steps):
    """MeanFlow 多步采样"""
    t_schedule = torch.linspace(1.0, 0.0, n_steps + 1)
    x = x_start
    for i in range(n_steps):
        t_high = t_schedule[i]
        t_low = t_schedule[i+1]
        u = model(x, t_low, t_high)
        x = x - (t_high - t_low) * u
    return x

多步可进一步提升质量,但单步已是 SOTA。

9. 最新研究前沿

9.1 2025-2026 新进展

论文来源核心贡献
MeanFlowNeurIPS 2025 Oral平均速度恒等式,一步 SOTA
How to build a consistency modelBoffi et al. 2025Flow Map 自蒸馏框架
Consistency Flow MatchingICLR 2025velocity consistency + FM
FACMPeng et al. 2025Flow Anchored CM,连续时间
Shortcut ModelsICML 2024CM 的多步扩展

9.2 共同的理论趋势

  1. 从轨迹到算子:CM、MeanFlow、Shortcut 都是算子视角
  2. 从瞬时到平均:MeanFlow 用平均速度替代瞬时速度
  3. 从多步到少步:NFE 持续下降
  4. 从蒸馏到自洽:MeanFlow 无需教师

10. 与现有 Wiki 文档的连接

11. 参考文献

引用论文

  • Lipman, Y., Chen, R. T. Q., Ben-Hamu, H., Nickel, M., & Le, M. (2023). Flow Matching for Generative Modeling. ICLR 2023.
  • Song, Y., Dhariwal, P., Chen, M., & Sutskever, I. (2023). Consistency Models. ICML 2023.
  • Karras, T., Aittala, M., Aila, T., & Laine, S. (2022). Elucidating the Design Space of Diffusion-Based Generative Models (EDM). NeurIPS 2022.
  • Peebles, W., & Xie, S. (2023). Scalable Diffusion Models with Transformers (DiT). ICCV 2023.

Last updated: 2026-06-21