1. 背景:曲线矫直目标

Rectified Flows(矫直流)是一种基于常微分方程(ODE)的生成模型框架,通过学习速度场将源分布 传输到目标分布 1

给定一个耦合 ,其中 ,我们考虑线性插值:

其中 的分布。通过最小化损失函数构建速度场

根据条件期望的最优预测性质,最优速度场为:

该速度场满足连续性方程:

**矫直(Rectification)**的思想是:从任意初始耦合出发,通过迭代”矫直”过程,使得传输路径逐渐变直,最终目标是获得最优传输映射。2


2. 不变性性质

2.1 仿射不变性

之间的耦合, 为损失函数 (1) 的最小化子。令 可逆,。则有如下性质:1

(i) 平移+缩放不变性:速度场 满足:

(ii) 目标平移不变性 满足:

(iii) 目标缩放不变性 满足:

:这些不变性(ii)(iii)同样适用于最优传输和 Benamou-Brenier 定理中的速度场。但性质(i)对最优传输不成立,当使用梯度约束损失函数时也不再成立。1


3. 高斯与高斯混合设置

3.1 高斯情况

假设 ,其中:

则最小化器 有显式表达式:

其中

关键结论:若 可联合对角化,则一步矫直后即得到最优耦合:

是一维情形下 之间的唯一最优耦合。13

3.2 高斯混合情况

,则最优速度场为各分量速度场的加权平均:

其中 为高斯密度, 为对应于第 个分量的速度场。1


4. 与最优传输的关系:梯度约束的局限

4.1 梯度约束矫直

原始 Rectified Flow 的损失为零并不意味着得到最优传输。Liu (2022) 观察到最优传输的速度场(Brenier 势函数的梯度)具有特殊性质,因此提出在 (1) 中加入梯度约束:4

记带梯度约束的矫直算子为 。Liu 声称存在如下等价链:

4.2 解的存在性

问题 (5) 的解是否存在并不显然。Hertrich 等人证明了解在弱形式下总是存在的:1

命题 8:设 分别为 (1) 和 (9) 的解,则:

  • (i) 到梯度闭包 中的正交投影
  • (ii) 存在光滑势函数序列 使得 收敛)
  • (iii) 是连续性方程 最小范数解
  • (iv) 若 (5) 的最小化子存在,则与 一致

关键洞察:Benamou-Brenier 定理同样优化最小范数速度场,但同时也对路径 进行优化。当 固定为线性插值分布时, 并不直接给出最优传输。1


5. 反例:揭示先前等价性声明的问题

5.1 反例一:不相连支撑集

为支撑在 内的任意概率测度。定义:

其中 为平移版本。构造两个不同的耦合

命题 10:两个耦合 都是 固定点,且在 (7) 中损失为零。但 ,因此 不是最优耦合。1

问题根源:Liu 的证明在方向 ii) → iii) 中,只证明了速度场在 几乎处处有直线路径。但引理 5.9 要求速度场在处处有直线路径。当 的支撑不相连时,这一假设不成立。

修正后的定理 11:若额外假设 (即支撑集连通),则等价链 (6) 成立。1

5.2 反例二:非可矫直耦合

考虑 ,定义耦合

命题 13

  • (i) 最优速度场 ,其中
  • (ii) ,但该耦合不是最优的(实际上是最差的耦合之一)
  • (iii) 该耦合是非可矫直的:ODE 的解不唯一

几何直观:当 时,插值 几乎必然成立,所有样本汇聚到原点。此时条件期望定义不明确,导致 ODE 路径分叉。1

5.3 推论:损失为零 ≠ 最优

推论 17:设 为高斯非可矫直耦合。通过向 注入任意小的高斯噪声 可得到可矫直耦合 。则对任意 ,存在 使得:

即:损失函数任意小并不意味着接近最优耦合,甚至不意味着可矫直性。1


6. 实践意义

基于上述理论分析,我们得出以下实践建议:

6.1 生成模型 vs 最优传输计算

Rectified Flows 作为生成模型表现出色,能够高效地从噪声生成样本。但将其用于计算最优传输映射存在根本性限制:

问题类型适用性
图像/语音生成✅ 非常适合
域迁移✅ 效果良好
最优传输映射计算❌ 不推荐

6.2 噪声注入策略

为确保迭代过程中耦合保持可矫直,建议在每步注入少量噪声:

定理 18:该策略保持边缘分布不变,损失值以 速率收敛(其中 为注入噪声水平的平均)。但收敛目标仍是损失为零,而非最优耦合。1

6.3 数据不相连的情况

实际应用中,数据分布的支撑集往往不相连(如多模态分布)。在此情形下:

  1. 即使经过多次矫直迭代,仍可能收敛到非最优的固定点
  2. 最小化损失函数(即使达到零)不能保证获得最优传输
  3. 速度场的路径长度与耦合距离可能远离最优值

7. 总结

本文揭示了 Rectified Flows 与最优传输之间关系的若干关键发现:

  1. 不变性性质:Rectified Flows 具有与最优传输部分相似的仿射不变性,但并非完全等价

  2. 梯度约束的局限:仅施加梯度约束(势函数存在)不足以保证得到最优传输

  3. 反例的教训

    • 不相连支撑集 → 非最优固定点
    • 非可矫直耦合 → 损失为零但非最优
    • 小损失值 → 不意味着接近最优
  4. 核心结论: enforcing a gradient constraint on rectified flows is, in general, not a reliable method for computing optimal transport maps.


参考文献

Footnotes

  1. Hertrich, J., Chambolle, A., & Delon, J. (2025). On the Relation between Rectified Flows and Optimal Transport. NeurIPS 2025. https://arxiv.org/abs/2505.19712 2 3 4 5 6 7 8 9 10 11 12

  2. Liu, X., Gong, C., & Liu, Q. (2023). Flow Straight and Fast: Learning to Generate and Transfer Data with Rectified Flow. ICLR 2023.

  3. Roy, S., et al. (2024). On the Wasserstein Convergence and Straightness of Rectified Flow. https://arxiv.org/abs/2410.14949

  4. Liu, Q. (2022). Rectified Flow: A Marginal Preserving Approach to Optimal Transport. https://arxiv.org/abs/2209.14577