1. 引言

Diffusion BridgeFlow Matching都是实现两个分布之间转换的生成建模框架1。尽管它们都表现出色,但:

  • 何时应该选择Diffusion Bridge?
  • 何时应该选择Flow Matching?
  • 两者之间有什么本质区别?

本文从随机最优控制最优传输两个视角提供统一理论,解答这些问题。


2. 方法回顾

2.1 Flow Matching

Flow Matching直接回归一个速度场

其中

损失函数为:

其中 是条件速度场(通常为线性插值)。

2.2 Diffusion Bridge

Diffusion Bridge使用条件随机微分方程:

其中


3. 随机最优控制视角

3.1 形式化

将生成过程视为随机最优控制问题

其中 是成本函数, 是控制(速度)场。

3.2 关键发现

定理:Diffusion Bridge的成本函数理论上更低,导致更稳定和自然的轨迹。

直觉:Diffusion Bridge通过随机性引入了”探索”,这有助于:

  • 避免陷入局部最优
  • 保持轨迹的自然性
  • 更好地探索数据流形

3.3 对比

方面Flow MatchingDiffusion Bridge
确定性完全确定随机
轨迹形状插值路径概率路径
稳定性可能不稳定更稳定

4. 最优传输视角

4.1 Flow Matching的问题

Flow Matching使用线性插值系数

问题:当训练数据规模减少时,这种固定插值变得低效

4.2 最优传输的洞见

最优传输(Optimal Transport, OT)理论告诉我们:

  • 最优的插值应该自适应数据分布
  • 固定插值无法捕捉数据的几何结构
  • Diffusion Bridge通过随机性隐式地实现了自适应

4.3 定理

定理:在训练数据减少的场景下,Diffusion Bridge的样本复杂度更低。

即:需要达到相同性能,Diffusion Bridge需要的训练数据更少。


5. 统一框架

5.1 框架结构

统一的视角将两种方法都视为条件生成器学习

其中:

  • Flow Matching: 是确定性期望
  • Diffusion Bridge: 是随机期望

5.2 统一损失

两种方法可以统一在以下损失框架下:

其中 是预测, 是目标(取决于方法)。


6. 实验验证

6.1 架构设计

使用Latent Transformer作为Diffusion Bridge的主干:

  • 编码器:将图像编码到latent空间
  • Latent Transformer:学习latent空间中的Diffusion Bridge
  • 解码器:重建图像

6.2 任务对比

任务Flow MatchingDiffusion Bridge胜者
Image Inpainting良好优秀Bridge
Super-Resolution优秀优秀持平
Deblurring良好优秀Bridge
Denoising优秀优秀持平
Translation一般优秀Bridge
Style Transfer良好优秀Bridge

6.3 数据规模影响

在训练数据规模减少时:

数据比例Flow MatchingDiffusion Bridge
100%1.001.00
50%0.950.98
25%0.850.95
10%0.700.90

Diffusion Bridge在高难度/低数据场景下优势明显。


7. 实践指导

7.1 选择指南

选择Flow Matching

  • 训练数据充足
  • 计算资源有限
  • 需要确定性采样

选择Diffusion Bridge

  • 训练数据有限
  • 任务难度高(inpainting、translation等)
  • 需要更稳定的轨迹

7.2 混合策略

可以结合两种方法:

  1. 初期阶段:使用Diffusion Bridge进行快速探索
  2. 后期阶段:切换到Flow Matching进行精细化

8. 结论

Diffusion Bridge和Flow Matching的统一理论揭示了:

  1. 随机最优控制视角:Diffusion Bridge的成本函数更低,轨迹更稳定
  2. 最优传输视角:Diffusion Bridge在数据稀缺时更高效
  3. 统一框架:两种方法可以形式化为条件生成器学习

实践建议:

  • 高数据场景:Flow Matching足够
  • 低数据/高难度场景:Diffusion Bridge更优
  • 混合策略:结合两者优势

参考文献

Footnotes

  1. “Diffusion Bridge or Flow Matching? A Unifying Framework and Comparative Analysis.” ICLR 2026. https://openreview.net/pdf/264512578ba744f1cb1d39d1ed514232ca8446c6.pdf