1. 背景:曲线矫直目标
Rectified Flows(矫直流)是一种基于常微分方程(ODE)的生成模型框架,通过学习速度场将源分布 传输到目标分布 。1
给定一个耦合 ,其中 ,,我们考虑线性插值:
其中 是 的分布。通过最小化损失函数构建速度场 :
根据条件期望的最优预测性质,最优速度场为:
该速度场满足连续性方程:
**矫直(Rectification)**的思想是:从任意初始耦合出发,通过迭代”矫直”过程,使得传输路径逐渐变直,最终目标是获得最优传输映射。2
2. 不变性性质
2.1 仿射不变性
设 为 和 之间的耦合, 为损失函数 (1) 的最小化子。令 可逆,,。则有如下性质:1
(i) 平移+缩放不变性:速度场 满足:
(ii) 目标平移不变性: 满足:
(iii) 目标缩放不变性: 满足:
注:这些不变性(ii)(iii)同样适用于最优传输和 Benamou-Brenier 定理中的速度场。但性质(i)对最优传输不成立,当使用梯度约束损失函数时也不再成立。1
3. 高斯与高斯混合设置
3.1 高斯情况
假设 ,其中:
则最小化器 有显式表达式:
其中 。
关键结论:若 且 、 可联合对角化,则一步矫直后即得到最优耦合:
3.2 高斯混合情况
设 ,则最优速度场为各分量速度场的加权平均:
其中 , 为高斯密度, 为对应于第 个分量的速度场。1
4. 与最优传输的关系:梯度约束的局限
4.1 梯度约束矫直
原始 Rectified Flow 的损失为零并不意味着得到最优传输。Liu (2022) 观察到最优传输的速度场(Brenier 势函数的梯度)具有特殊性质,因此提出在 (1) 中加入梯度约束:4
记带梯度约束的矫直算子为 。Liu 声称存在如下等价链:
4.2 解的存在性
问题 (5) 的解是否存在并不显然。Hertrich 等人证明了解在弱形式下总是存在的:1
命题 8:设 和 分别为 (1) 和 (9) 的解,则:
- (i) 是 到梯度闭包 在 中的正交投影
- (ii) 存在光滑势函数序列 使得 ( 收敛)
- (iii) 是连续性方程 的最小范数解
- (iv) 若 (5) 的最小化子存在,则与 一致
关键洞察:Benamou-Brenier 定理同样优化最小范数速度场,但同时也对路径 进行优化。当 固定为线性插值分布时, 并不直接给出最优传输。1
5. 反例:揭示先前等价性声明的问题
5.1 反例一:不相连支撑集
设 为支撑在 内的任意概率测度。定义:
其中 为平移版本。构造两个不同的耦合 和 :
命题 10:两个耦合 和 都是 的固定点,且在 (7) 中损失为零。但 ,因此 不是最优耦合。1
问题根源:Liu 的证明在方向 ii) → iii) 中,只证明了速度场在 几乎处处有直线路径。但引理 5.9 要求速度场在处处有直线路径。当 的支撑不相连时,这一假设不成立。
修正后的定理 11:若额外假设 (即支撑集连通),则等价链 (6) 成立。1
5.2 反例二:非可矫直耦合
考虑 ,定义耦合 。
命题 13:
- (i) 最优速度场 ,其中
- (ii) ,但该耦合不是最优的(实际上是最差的耦合之一)
- (iii) 该耦合是非可矫直的:ODE 的解不唯一
几何直观:当 时,插值 几乎必然成立,所有样本汇聚到原点。此时条件期望定义不明确,导致 ODE 路径分叉。1
5.3 推论:损失为零 ≠ 最优
推论 17:设 为高斯非可矫直耦合。通过向 注入任意小的高斯噪声 可得到可矫直耦合 。则对任意 ,存在 使得:
但
即:损失函数任意小并不意味着接近最优耦合,甚至不意味着可矫直性。1
6. 实践意义
基于上述理论分析,我们得出以下实践建议:
6.1 生成模型 vs 最优传输计算
Rectified Flows 作为生成模型表现出色,能够高效地从噪声生成样本。但将其用于计算最优传输映射存在根本性限制:
| 问题类型 | 适用性 |
|---|---|
| 图像/语音生成 | ✅ 非常适合 |
| 域迁移 | ✅ 效果良好 |
| 最优传输映射计算 | ❌ 不推荐 |
6.2 噪声注入策略
为确保迭代过程中耦合保持可矫直,建议在每步注入少量噪声:
定理 18:该策略保持边缘分布不变,损失值以 速率收敛(其中 为注入噪声水平的平均)。但收敛目标仍是损失为零,而非最优耦合。1
6.3 数据不相连的情况
实际应用中,数据分布的支撑集往往不相连(如多模态分布)。在此情形下:
- 即使经过多次矫直迭代,仍可能收敛到非最优的固定点
- 最小化损失函数(即使达到零)不能保证获得最优传输
- 速度场的路径长度与耦合距离可能远离最优值
7. 总结
本文揭示了 Rectified Flows 与最优传输之间关系的若干关键发现:
-
不变性性质:Rectified Flows 具有与最优传输部分相似的仿射不变性,但并非完全等价
-
梯度约束的局限:仅施加梯度约束(势函数存在)不足以保证得到最优传输
-
反例的教训:
- 不相连支撑集 → 非最优固定点
- 非可矫直耦合 → 损失为零但非最优
- 小损失值 → 不意味着接近最优
-
核心结论: enforcing a gradient constraint on rectified flows is, in general, not a reliable method for computing optimal transport maps.
参考文献
Footnotes
-
Hertrich, J., Chambolle, A., & Delon, J. (2025). On the Relation between Rectified Flows and Optimal Transport. NeurIPS 2025. https://arxiv.org/abs/2505.19712 ↩ ↩2 ↩3 ↩4 ↩5 ↩6 ↩7 ↩8 ↩9 ↩10 ↩11 ↩12
-
Liu, X., Gong, C., & Liu, Q. (2023). Flow Straight and Fast: Learning to Generate and Transfer Data with Rectified Flow. ICLR 2023. ↩
-
Roy, S., et al. (2024). On the Wasserstein Convergence and Straightness of Rectified Flow. https://arxiv.org/abs/2410.14949 ↩
-
Liu, Q. (2022). Rectified Flow: A Marginal Preserving Approach to Optimal Transport. https://arxiv.org/abs/2209.14577 ↩