因果强化学习专题索引
专题概述
因果强化学习(Causal Reinforcement Learning, CRL)是将因果推断与强化学习深度融合的新兴研究领域,旨在解决传统RL面临的三大核心挑战:
| 挑战 | 传统RL | 因果RL |
|---|
| 可解释性 | 黑盒决策 | 因果链条透明 |
| 鲁棒性 | 分布偏移敏感 | 跨环境泛化 |
| 泛化能力 | 相关性驱动 | 因果机制迁移 |
本专题系统梳理因果强化学习的理论基础、核心算法与前沿应用。
核心内容导航
基础理论
核心算法
前沿应用
| 文档 | 内容概览 |
|---|
| 因果世界模型 | 因果世界模型构建、因果规划、跨环境迁移 |
学习路径建议
入门路径(推荐)
1. crl-fundamentals → 2. causal-mdp-cmdp → 3. causal-exploration
进阶路径
1. crl-fundamentals → 2. causal-mdp-cmdp → 3. causal-irl-constraint-inference → 4. causal-world-models
实践路径
1. causal-mdp-cmdp → 2. causal-exploration → 3. causal-world-models
与其他专题的关联
相关专题
交叉引用
- 因果强化学习 ← 强化学习(基础框架)
- 因果强化学习 ← 因果推断(理论基础)
- 因果强化学习 → Agent安全(安全约束推断)
- 因果强化学习 → 世界模型(因果世界建模)
关键论文与参考文献
经典论文
- Causal Reinforcement Learning: A Primer - CRL Tutorial, crl.causalai.net
- Unifying Causal Reinforcement Learning: Survey, Taxonomy, Algorithms (arXiv:2512.18135, 2025)
- Causal Discovery and Inference through Next-Token Prediction (NeurIPS 2025)
进阶论文
- Inverse Reinforcement Learning with Just Classification (arXiv:2509.21172, 2025)
- AgentRL: Scaling Agentic RL (arXiv:2510.04206, 2025)
- Constrained IRL (arXiv:2409.07569, 2025)
实践资源
代码库
开源环境
- CausalBandits - 因果多臂老虎机环境
- CausalGym - 因果强化学习基准
最后更新: 2026-05-14