World Models 知识体系
世界模型(World Models)是人工智能领域的重要研究方向,旨在学习环境的通用表示,使智能体能够「想象」未来状态并进行规划。本知识体系涵盖从理论基础到最新前沿进展的完整内容。
目录结构
├── 理论基础
│ ├── [[./introduction|世界模型概论]]
│ ├── [[./model-based-rl|基于模型的强化学习]]
│ └── [[./world-model-architectures|世界模型架构]]
│
├── 核心算法
│ ├── [[./dreamer-algorithm|Dreamer 系列算法]]
│ ├── [[./video-prediction-world-models|视频生成世界模型]]
│ └── (MuZero - 规划中)
│
├── 应用场景
│ └── [[./world-models-applications|世界模型应用]]
│
└── 前沿进展
└── [[./world-models-frontier-2026|2025-2026 最新进展]]
核心概念图
┌─────────────────────────────────────────────────────────────┐
│ World Model │
├─────────────────────────────────────────────────────────────┤
│ ┌──────────────┐ ┌──────────────┐ ┌──────────────┐ │
│ │ Encoder │───▶│ Dynamics │───▶│ Policy │ │
│ │ E(oₜ)→zₜ │ │ Model │ │ Player │ │
│ └──────────────┘ │ p(zₜ₊₁|zₜ,aₜ)│ └──────┬───────┘ │
│ ▲ └──────────────┘ │ │
│ │ ▲ ▼ │
│ ┌──────────────┐ ┌──────────────┐ ┌──────────────┐ │
│ │ Decoder │ │ Reward │ │ Value │ │
│ │ D(zₜ)→ôₜ │ │ Predictor │ │ Critic │ │
│ └──────────────┘ └──────────────┘ └──────────────┘ │
└─────────────────────────────────────────────────────────────┘
│
▼
┌─────────────────────────┐
│ Imagination Rollout │
│ 在潜在空间中进行规划 │
└─────────────────────────┘
知识领域关联
与强化学习的关系
世界模型是 强化学习 的重要分支,属于**基于模型的强化学习(Model-Based RL)**范畴。
与深度学习的融合
与多模态学习的关系
学习路径建议
入门路径
进阶路径
前沿路径
参考资源
论文
| 论文 | 年份 | 重要性 |
|---|---|---|
| Ha & Schmidhuber - World Models | 2018 | ⭐⭐⭐ 开创性工作 |
| Hafner et al. - Dreamer V1 | 2020 | ⭐⭐⭐ 里程碑 |
| Hafner et al. - Dreamer V2 | 2021 | ⭐⭐⭐ 改进 |
| Hafner et al. - Dreamer V3 | 2023 | ⭐⭐⭐ 通用性 |
| Seq et al. - Dreamer V4 (Nature) | 2025 | ⭐⭐⭐ 最新突破 |
开源项目
- DreamerV3 官方实现
- World Models Atlas - 论文索引
外部链接
- World Models Atlas - 4000+ 论文资源
- DeepMind MuZero
贡献者
本知识体系基于以下来源构建:
- Ha & Schmidhuber. “World Models”. 2018.
- Hafner et al. Dreamer series papers. 2020-2025.
- Video Generation Models as World Models. arXiv:2603.28489. 2026.
- World Models Atlas. https://worldmodelsatlas.site/