OOD泛化速查表

核心定义

OOD泛化:在训练分布 测试分布 的情况下学习可泛化模型。

核心挑战:快捷学习(Shortcut Learning)—— 模型依赖虚假相关而非因果特征。

方法分类速查

方法核心思想适用场景
IRM在所有环境中寻找最优不变的分类器多环境训练
Group DRO优化最坏情况组性能有组/域标签
LISA选择性Mixup:同标签不同域 或 同域不同标签数据增强
DROmin-max优化最坏情况分布理论保证
因果学习分离因果特征和虚假特征结构已知

IRM公式

DRO公式

关键论文

年份论文arXiv
2019Invariant Risk Minimization1907.02893
2022LISA (NeurIPS)2201.00299
2024Shortcuts & Spurious Correlations Survey2412.05152
2024DRO Survey2411.02549
2025DRO Python Library2505.23565
2025Time Series OOD Survey2503.13868

常用数据集

  • ColoredMNIST(合成)
  • PACS(图像)
  • DomainNet(多域)
  • Waterbirds(虚假相关)
  • NICO++(上下文)

实现资源

  • DRO库:pip install dro
  • IRM实现:github.com/reiinakano/invariant-risk-minimization
  • 完整综述:/research/ood-generalization.md