Rectified Flows与最优传输的关系

1. 背景：曲线矫直目标

Rectified Flows（矫直流）是一种基于常微分方程（ODE）的生成模型框架，通过学习速度场将源分布 $μ_{0}$ 传输到目标分布 $μ_{1}$ 。¹

给定一个耦合 $(X_{0}, X_{1})$ ，其中 $X_{0} \sim μ_{0}$ ， $X_{1} \sim μ_{1}$ ，我们考虑线性插值：

X_{t} = (1 - t) X_{0} + t X_{1}, t \in [0, 1]

其中 $μ_{t}$ 是 $X_{t}$ 的分布。通过最小化损失函数构建速度场 $v_{t}$ ：

v_{t} \in ar g w_{t} \in L^{2} (μ_{t}) min L (w_{t} ∣ X_{0}, X_{1})

L (w_{t} ∣ X_{0}, X_{1}) := \int_{0}^{1} E [∥ w_{t} (X_{t}) - (X_{1} - X_{0}) ∥^{2}] d t

根据条件期望的最优预测性质，最优速度场为：

v_{t} (x) = E [X_{1} - X_{0} ∣ X_{t} = x] (1)

该速度场满足连续性方程：

\partial_{t} μ_{t} + div (v_{t} μ_{t}) = 0 (2)

**矫直（Rectification）**的思想是：从任意初始耦合出发，通过迭代”矫直”过程，使得传输路径逐渐变直，最终目标是获得最优传输映射。²

2. 不变性性质

2.1 仿射不变性

设 $(X_{0}, X_{1})$ 为 $μ_{0}$ 和 $μ_{1}$ 之间的耦合， $v_{t}$ 为损失函数 (1) 的最小化子。令 $A \in R^{d \times d}$ 可逆， $b \in R^{d}$ ， $c \in R_{> 0}$ 。则有如下性质：¹

(i) 平移+缩放不变性：速度场 $v_{A, b}^{t} = ar g min L (w_{t} ∣ A X_{0} + b, A X_{1} + b)$ 满足：

v_{A, b}^{t} (x) = A v_{t} (A^{- 1} (x - b))

(ii) 目标平移不变性： $v_{b}^{t} = ar g min L (w_{t} ∣ X_{0}, X_{1} + b)$ 满足：

v_{b}^{t} (x) = v_{t} (x - t b) + b

(iii) 目标缩放不变性： $v_{c}^{t} = ar g min L (w_{t} ∣ X_{0}, c X_{1})$ 满足：

v_{c}^{t} = \frac{c}{1 - t + t c} v^{r} (\frac{x}{1 - t + t c}) + \frac{c - 1}{1 - t + t c} x, r = \frac{t c}{1 - t + t c}

注：这些不变性（ii）（iii）同样适用于最优传输和 Benamou-Brenier 定理中的速度场。但性质（i）对最优传输不成立，当使用梯度约束损失函数时也不再成立。¹

3. 高斯与高斯混合设置

3.1 高斯情况

假设 $(X_{0}, X_{1}) \sim N (0, Σ)$ ，其中：

Σ = (Σ_{0} Σ_{01} Σ_{10} Σ_{1}), Σ_{0}, Σ_{1} 正定

则最小化器 $v_{t}$ 有显式表达式：

v_{t} (x) = \frac{1}{1 - t} ((1 - t) Σ_{01} + t Σ_{1}) Σ_{t}^{- 1} x - x (3)

其中 $Σ_{t} = Cov (X_{t}) = (1 - t)^{2} Σ_{0} + (1 - t) t (Σ_{01} + Σ_{10}) + t^{2} Σ_{1}$ 。

关键结论：若 $Σ_{01} = Σ_{10} = 0$ 且 $Σ_{0}$ 、 $Σ_{1}$ 可联合对角化，则一步矫直后即得到最优耦合：

(Z_{0}, Z_{1}) := R (X_{0}, X_{1})

是一维情形下 $μ_{0}$ 和 $μ_{1}$ 之间的唯一最优耦合。¹³

3.2 高斯混合情况

设 $(X_{0}, X_{1}) \sim \sum_{k = 1}^{K} π_{k} N (m^{k}, Σ^{k})$ ，则最优速度场为各分量速度场的加权平均：

v_{t} (x) = k = 1 \sum K α_{k} (x) w_{k}^{t} (x) (4)

其中 $α_{k} (x) = \frac{π _{k} p _{k}^{t} ( x )}{\sum _{j} π _{j} p _{j}^{t} ( x )}$ ， $p_{k}^{t}$ 为高斯密度， $w_{k}^{t}$ 为对应于第 $k$ 个分量的速度场。¹

4. 与最优传输的关系：梯度约束的局限

4.1 梯度约束矫直

原始 Rectified Flow 的损失为零并不意味着得到最优传输。Liu (2022) 观察到最优传输的速度场（Brenier 势函数的梯度）具有特殊性质，因此提出在 (1) 中加入梯度约束：⁴

v_{t} \in ar g w_{t} \in L^{2} (μ_{t}) min L (w_{t} ∣ X_{0}, X_{1}) s.t. w_{t} = \nabla φ_{t} 对某 φ_{t} : R^{d} \to R (5)

记带梯度约束的矫直算子为 $R_{p}$ 。Liu 声称存在如下等价链：

(X_{0}, X_{1}) = R_{p} ((X_{0}, X_{1})) ⟺ \exists v_{t} = \nabla φ_{t} : L (v_{t} ∣ X_{0}, X_{1}) = 0 ⟺ (X_{0}, X_{1}) 是最优耦合 (6)

4.2 解的存在性

问题 (5) 的解是否存在并不显然。Hertrich 等人证明了解在弱形式下总是存在的：¹

命题 8：设 $v_{t}$ 和 $v_{p}^{t}$ 分别为 (1) 和 (9) 的解，则：

(i) $v_{p}^{t}$ 是 $v_{t}$ 到梯度闭包 $\overline{\nabla ϕ}$ 在 $L^{2} (μ_{t})$ 中的正交投影
(ii) 存在光滑势函数序列 $φ_{n}$ 使得 $\nabla φ_{n} \to v_{p}$ （ $L^{2}$ 收敛）
(iii) $v_{p}^{t}$ 是连续性方程 $\partial_{t} μ_{t} + div (v_{p}^{t} μ_{t}) = 0$ 的最小范数解
(iv) 若 (5) 的最小化子存在，则与 $v_{p}^{t}$ 一致

关键洞察：Benamou-Brenier 定理同样优化最小范数速度场，但同时也对路径 $μ_{t}$ 进行优化。当 $μ_{t}$ 固定为线性插值分布时， $v_{p}^{t}$ 并不直接给出最优传输。¹

5. 反例：揭示先前等价性声明的问题

5.1 反例一：不相连支撑集

设 $η \in P (R^{2})$ 为支撑在 $∥ x ∥ \leq 0.3$ 内的任意概率测度。定义：

μ_{0} = \frac{1}{2} (η_{(- 2, 1)} + η_{(2, - 1)}), μ_{1} = \frac{1}{2} (η_{(- 2, - 1)} + η_{(2, 1)}) (7)

其中 $η_{b} = (\cdot + b)_{#} η$ 为平移版本。构造两个不同的耦合 $(X_{0}, X_{1})$ 和 $(\tilde{X}_{0}, \tilde{X}_{1})$ ：

X_{1} = {X_{0} - (0, 2) X_{0} + (0, 2) if (X_{0})_{1} < - 1 if (X_{0})_{1} > 1, \tilde{X}_{1} = {X_{0} - (4, 0) X_{0} + (4, 0) if (X_{0})_{2} < - 0.5 if (X_{0})_{2} > 0.5

命题 10：两个耦合 $(X_{0}, X_{1})$ 和 $(\tilde{X}_{0}, \tilde{X}_{1})$ 都是 $R_{p}$ 的固定点，且在 (7) 中损失为零。但 $E [∥ \tilde{X}_{1} - \tilde{X}_{0} ∥^{2}] > E [∥ X_{1} - X_{0} ∥^{2}]$ ，因此 $(\tilde{X}_{0}, \tilde{X}_{1})$ 不是最优耦合。¹

问题根源：Liu 的证明在方向 ii) → iii) 中，只证明了速度场在 $X_{t}$ 几乎处处有直线路径。但引理 5.9 要求速度场在处处有直线路径。当 $μ_{t}$ 的支撑不相连时，这一假设不成立。

修正后的定理 11：若额外假设 $supp (X_{t}) = R^{d}$ （即支撑集连通），则等价链 (6) 成立。¹

5.2 反例二：非可矫直耦合

考虑 $μ_{0} = μ_{1} = N (0, I_{d})$ ，定义耦合 $X_{1} = - X_{0}$ 。

命题 13：

(i) 最优速度场 $v_{t} (x) = - \frac{2}{1 - 2 t} x = \nabla φ_{t} (x)$ ，其中 $φ_{t} (x) = - \frac{1}{1 - 2 t} ∥ x ∥^{2}$
(ii) $L (v_{t} ∣ X_{0}, X_{1}) = 0$ ，但该耦合不是最优的（实际上是最差的耦合之一）
(iii) 该耦合是非可矫直的：ODE $\dot{Z}_{t} = v_{t} (Z_{t})$ 的解不唯一

几何直观：当 $t = \frac{1}{2}$ 时，插值 $X_{1/2} = 0$ 几乎必然成立，所有样本汇聚到原点。此时条件期望定义不明确，导致 ODE 路径分叉。¹

5.3 推论：损失为零 ≠ 最优

推论 17：设 $(X_{0}, X_{1})$ 为高斯非可矫直耦合。通过向 $X_{0}$ 注入任意小的高斯噪声 $N (0, c^{2} I)$ 可得到可矫直耦合 $(X_{c}^{0}, X_{c}^{1})$ 。则对任意 $ϵ > 0$ ，存在 $c > 0$ 使得：

L (v_{c}^{t} ∣ X_{c}^{0}, X_{c}^{1}) < ϵ, W_{2}^{2} (μ_{c}^{0}, μ_{1}) < ϵ

但

\int_{0}^{1} E [∥ v_{c}^{t} (X_{c}^{t}) ∥^{2}] d t > 4 - ϵ, E [∥ X_{c}^{1} - X_{c}^{0} ∥^{2}] > 4 - ϵ

即：损失函数任意小并不意味着接近最优耦合，甚至不意味着可矫直性。¹

6. 实践意义

基于上述理论分析，我们得出以下实践建议：

6.1 生成模型 vs 最优传输计算

Rectified Flows 作为生成模型表现出色，能够高效地从噪声生成样本。但将其用于计算最优传输映射存在根本性限制：

问题类型	适用性
图像/语音生成	✅ 非常适合
域迁移	✅ 效果良好
最优传输映射计算	❌ 不推荐

6.2 噪声注入策略

为确保迭代过程中耦合保持可矫直，建议在每步注入少量噪声：

X_{0}^{(i + 1)} = 1 - c_{i} Z_{0}^{(i)} + c_{i} W^{(i)}, W^{(i)} \sim N (0, I)

定理 18：该策略保持边缘分布不变，损失值以 $O (1/ K + \overset{c}{ˉ}_{K})$ 速率收敛（其中 $\overset{c}{ˉ}_{K}$ 为注入噪声水平的平均）。但收敛目标仍是损失为零，而非最优耦合。¹

6.3 数据不相连的情况

实际应用中，数据分布的支撑集往往不相连（如多模态分布）。在此情形下：

即使经过多次矫直迭代，仍可能收敛到非最优的固定点
最小化损失函数（即使达到零）不能保证获得最优传输
速度场的路径长度与耦合距离可能远离最优值

7. 总结

本文揭示了 Rectified Flows 与最优传输之间关系的若干关键发现：

不变性性质：Rectified Flows 具有与最优传输部分相似的仿射不变性，但并非完全等价
梯度约束的局限：仅施加梯度约束（势函数存在）不足以保证得到最优传输
反例的教训：
- 不相连支撑集 → 非最优固定点
- 非可矫直耦合 → 损失为零但非最优
- 小损失值 → 不意味着接近最优
核心结论： enforcing a gradient constraint on rectified flows is, in general, not a reliable method for computing optimal transport maps.

参考文献

Hertrich, J., Chambolle, A., & Delon, J. (2025). On the Relation between Rectified Flows and Optimal Transport. NeurIPS 2025. https://arxiv.org/abs/2505.19712 ↩ ↩² ↩³ ↩⁴ ↩⁵ ↩⁶ ↩⁷ ↩⁸ ↩⁹ ↩¹⁰ ↩¹¹ ↩¹²
Liu, X., Gong, C., & Liu, Q. (2023). Flow Straight and Fast: Learning to Generate and Transfer Data with Rectified Flow. ICLR 2023. ↩
Roy, S., et al. (2024). On the Wasserstein Convergence and Straightness of Rectified Flow. https://arxiv.org/abs/2410.14949 ↩
Liu, Q. (2022). Rectified Flow: A Marginal Preserving Approach to Optimal Transport. https://arxiv.org/abs/2209.14577 ↩

Metaphor

探索

Rectified Flows与最优传输的关系

1. 背景：曲线矫直目标

2. 不变性性质

2.1 仿射不变性

3. 高斯与高斯混合设置

3.1 高斯情况

3.2 高斯混合情况

4. 与最优传输的关系：梯度约束的局限

4.1 梯度约束矫直

4.2 解的存在性

5. 反例：揭示先前等价性声明的问题

5.1 反例一：不相连支撑集

5.2 反例二：非可矫直耦合

5.3 推论：损失为零 ≠ 最优

6. 实践意义

6.1 生成模型 vs 最优传输计算

6.2 噪声注入策略

6.3 数据不相连的情况

7. 总结

参考文献

关系图谱

目录

Metaphor

探索

Rectified Flows与最优传输的关系

1. 背景：曲线矫直目标

2. 不变性性质

2.1 仿射不变性

3. 高斯与高斯混合设置

3.1 高斯情况

3.2 高斯混合情况

4. 与最优传输的关系：梯度约束的局限

4.1 梯度约束矫直

4.2 解的存在性

5. 反例：揭示先前等价性声明的问题

5.1 反例一：不相连支撑集

5.2 反例二：非可矫直耦合

5.3 推论：损失为零 ≠ 最优

6. 实践意义

6.1 生成模型 vs 最优传输计算

6.2 噪声注入策略

6.3 数据不相连的情况

7. 总结

参考文献

Footnotes

关系图谱

目录