1. 引言
连续时间生成建模已经演变为三种主要范式1:
| 范式 | 核心对象 | 采样特点 |
|---|---|---|
| Score-based Diffusion (SDEs) | Score函数 | 需要模拟反向SDE或ODE |
| Flow Matching (CNFs) | 速度场 | 模拟确定性ODE |
| Consistency Models (CMs) | 映射 | 直接投影到起点 |
这些方法都取得了成功,但它们之间的深层联系尚不清楚。Flow Map视角提供了一个统一的框架。
2. 从轨迹到算子的视角转变
2.1 传统视角:轨迹
传统上,生成模型被理解为学习轨迹(trajectories):
- Diffusion模型:学习从数据到噪声的轨迹,然后逆转
- Flow Matching:学习从噪声到数据的速度场
- Consistency Models:学习轨迹上的投影映射
2.2 新视角:算子
Flow Map将生成建模重新定义为学习两时间算子:
其中 是一个算子,将时间 的状态映射到时间 的状态。
这种算子视角的革命性在于:它将所有三种方法统一为Flow Map的不同参数化方式。
3. Flow Map的形式化
3.1 数学定义
Flow Map 满足以下性质:
- 身份性:(恒等映射)
- 半群性(Semigroup Property):
3.2 统一三种方法
| 方法 | Flow Map表示 |
|---|---|
| Diffusion (SDE) | |
| Flow Matching | (轨迹端点) |
| Consistency Models |
Consistency Models实际上是在学习Flow Map在 处的边界行为。
4. Semigroup-Consistent Jumps
4.1 核心概念
Semigroup-Consistent Jumps(半群一致性跳跃)是Flow Map框架的核心创新1。
给定Flow Map ,一个半群一致性跳跃满足:
这意味着跳跃是”一致”的,不会引入组合漂移。
4.2 为什么重要
- Step-robust generation:对步数变化不敏感
- Low compositional drift:多次组合后仍保持一致
- 中间时间插值:可以可靠地在任意时间点停止或跳跃
4.3 与传统方法对比
| 方法 | Semigroup一致性 | Step-robust |
|---|---|---|
| 标准Diffusion | 部分满足 | 较差 |
| 标准Flow Matching | 近似满足 | 一般 |
| Consistency Models | 锚定到固定点 | 较好 |
| Semigroup-Consistent | 严格满足 | 优秀 |
5. Eulerian vs Lagrangian蒸馏
5.1 Eulerian视角
Eulerian蒸馏关注固定时间点的属性:
- 学习在特定时间点的score或速度
- 时间局部,空间全局
- 适合multi-step生成
5.2 Lagrangian视角
Lagrangian蒸馏关注轨迹的属性:
- 学习轨迹的整体形状
- 时间全局,空间局部
- 适合few-step生成
5.3 Flow Map的统一性
Flow Map框架允许同时使用两种视角:
- Eulerian项:
- Lagrangian项:
组合使用可以获得最佳的表达力和效率。
6. 统一表达
6.1 Diffusion模型的Flow Map表示
对于反向扩散过程:
Flow Map满足半群性:
6.2 Flow Matching的Flow Map表示
对于CNF(连续归一化流):
Flow Map是ODE的解算子。
6.3 Consistency Models的Flow Map表示
一致性模型试图近似:
即从任意时间点直接投影到 。
7. 实验验证
7.1 Inpainting实验
Semigroup-Consistent Jump在inpainting任务上展现出:
- 步数鲁棒性:从10步到50步变化时,性能下降<2%
- 组合稳定性:多次inpainting后保持一致性
7.2 消融研究
| 方法 | Step-robust | Compositional |
|---|---|---|
| 标准Diffusion | 差 | 一般 |
| + Eulerian蒸馏 | 一般 | 改善 |
| + Lagrangian蒸馏 | 改善 | 差 |
| + Semigroup-Consistent | 优秀 | 优秀 |
8. 结论
Flow Map视角通过将生成建模重新定义为两时间算子学习,实现了对Diffusion、Flow Matching和Consistency Models的优雅统一。
关键贡献:
- 算子视角:从轨迹到算子的概念转变
- 半群一致性:揭示了组合一致性的重要性
- 统一蒸馏:Eulerian和Lagrangian的统一框架
- 实践验证:在inpainting等任务上验证了理论
这一框架为未来的生成模型研究提供了新的方向。
参考文献
Footnotes
-
“From Trajectories to Operators — A Unified Flow Map Perspective on Generative Modeling.” ICLR Blogposts 2026. https://iclr-blogposts.github.io/2026/blog/2026/flow-map-learning/ ↩ ↩2