1. 引言
Diffusion Bridge和Flow Matching都是实现两个分布之间转换的生成建模框架1。尽管它们都表现出色,但:
- 何时应该选择Diffusion Bridge?
- 何时应该选择Flow Matching?
- 两者之间有什么本质区别?
本文从随机最优控制和最优传输两个视角提供统一理论,解答这些问题。
2. 方法回顾
2.1 Flow Matching
Flow Matching直接回归一个速度场 :
其中 ,。
损失函数为:
其中 是条件速度场(通常为线性插值)。
2.2 Diffusion Bridge
Diffusion Bridge使用条件随机微分方程:
其中 ,。
3. 随机最优控制视角
3.1 形式化
将生成过程视为随机最优控制问题:
其中 是成本函数, 是控制(速度)场。
3.2 关键发现
定理:Diffusion Bridge的成本函数理论上更低,导致更稳定和自然的轨迹。
直觉:Diffusion Bridge通过随机性引入了”探索”,这有助于:
- 避免陷入局部最优
- 保持轨迹的自然性
- 更好地探索数据流形
3.3 对比
| 方面 | Flow Matching | Diffusion Bridge |
|---|---|---|
| 确定性 | 完全确定 | 随机 |
| 轨迹形状 | 插值路径 | 概率路径 |
| 稳定性 | 可能不稳定 | 更稳定 |
4. 最优传输视角
4.1 Flow Matching的问题
Flow Matching使用线性插值系数 和 :
问题:当训练数据规模减少时,这种固定插值变得低效。
4.2 最优传输的洞见
最优传输(Optimal Transport, OT)理论告诉我们:
- 最优的插值应该自适应数据分布
- 固定插值无法捕捉数据的几何结构
- Diffusion Bridge通过随机性隐式地实现了自适应
4.3 定理
定理:在训练数据减少的场景下,Diffusion Bridge的样本复杂度更低。
即:需要达到相同性能,Diffusion Bridge需要的训练数据更少。
5. 统一框架
5.1 框架结构
统一的视角将两种方法都视为条件生成器学习:
其中:
- Flow Matching: 是确定性期望
- Diffusion Bridge: 是随机期望
5.2 统一损失
两种方法可以统一在以下损失框架下:
其中 是预测, 是目标(取决于方法)。
6. 实验验证
6.1 架构设计
使用Latent Transformer作为Diffusion Bridge的主干:
- 编码器:将图像编码到latent空间
- Latent Transformer:学习latent空间中的Diffusion Bridge
- 解码器:重建图像
6.2 任务对比
| 任务 | Flow Matching | Diffusion Bridge | 胜者 |
|---|---|---|---|
| Image Inpainting | 良好 | 优秀 | Bridge |
| Super-Resolution | 优秀 | 优秀 | 持平 |
| Deblurring | 良好 | 优秀 | Bridge |
| Denoising | 优秀 | 优秀 | 持平 |
| Translation | 一般 | 优秀 | Bridge |
| Style Transfer | 良好 | 优秀 | Bridge |
6.3 数据规模影响
在训练数据规模减少时:
| 数据比例 | Flow Matching | Diffusion Bridge |
|---|---|---|
| 100% | 1.00 | 1.00 |
| 50% | 0.95 | 0.98 |
| 25% | 0.85 | 0.95 |
| 10% | 0.70 | 0.90 |
Diffusion Bridge在高难度/低数据场景下优势明显。
7. 实践指导
7.1 选择指南
选择Flow Matching:
- 训练数据充足
- 计算资源有限
- 需要确定性采样
选择Diffusion Bridge:
- 训练数据有限
- 任务难度高(inpainting、translation等)
- 需要更稳定的轨迹
7.2 混合策略
可以结合两种方法:
- 初期阶段:使用Diffusion Bridge进行快速探索
- 后期阶段:切换到Flow Matching进行精细化
8. 结论
Diffusion Bridge和Flow Matching的统一理论揭示了:
- 随机最优控制视角:Diffusion Bridge的成本函数更低,轨迹更稳定
- 最优传输视角:Diffusion Bridge在数据稀缺时更高效
- 统一框架:两种方法可以形式化为条件生成器学习
实践建议:
- 高数据场景:Flow Matching足够
- 低数据/高难度场景:Diffusion Bridge更优
- 混合策略:结合两者优势
参考文献
Footnotes
-
“Diffusion Bridge or Flow Matching? A Unifying Framework and Comparative Analysis.” ICLR 2026. https://openreview.net/pdf/264512578ba744f1cb1d39d1ed514232ca8446c6.pdf ↩