OOD泛化速查表

核心定义

OOD泛化：在训练分布 $P_{t r} (X, Y) \neq =$ 测试分布 $P_{t e} (X, Y)$ 的情况下学习可泛化模型。

核心挑战：快捷学习（Shortcut Learning）—— 模型依赖虚假相关而非因果特征。

方法分类速查

方法	核心思想	适用场景
IRM	在所有环境中寻找最优不变的分类器	多环境训练
Group DRO	优化最坏情况组性能	有组/域标签
LISA	选择性Mixup：同标签不同域或同域不同标签	数据增强
DRO	min-max优化最坏情况分布	理论保证
因果学习	分离因果特征和虚假特征	结构已知

IRM公式

$min_{Φ, w} \sum_{e} R^{e} (w \circ Φ) s.t. w \in ar g min_{w^{'}} R^{e} (w^{'} \circ Φ)$

DRO公式

$min_{f \in F} sup_{Q \in P} E_{Q} [ℓ (f (X), Y)]$

关键论文

年份	论文	arXiv
2019	Invariant Risk Minimization	1907.02893
2022	LISA (NeurIPS)	2201.00299
2024	Shortcuts & Spurious Correlations Survey	2412.05152
2024	DRO Survey	2411.02549
2025	DRO Python Library	2505.23565
2025	Time Series OOD Survey	2503.13868

常用数据集

ColoredMNIST（合成）
PACS（图像）
DomainNet（多域）
Waterbirds（虚假相关）
NICO++（上下文）

实现资源

DRO库：pip install dro
IRM实现：github.com/reiinakano/invariant-risk-minimization
完整综述：/research/ood-generalization.md