概述
马尔可夫链(Markov Chain)是一种特殊的随机过程,具有”无记忆性”(Memorylessness)的特点——当前状态只与上一状态有关,与更早的历史无关。1
马尔可夫链在搜索引擎(PageRank)、语音识别、自然语言处理、推荐系统等领域都有广泛应用。
马尔可夫性质
定义
设 为一个离散时间随机过程,若对任意时刻 和任意状态序列 ,满足:
则称该过程具有马尔可夫性质(Markov Property)。
直观理解
未来只与现在有关,与过去无关。
这意味着,如果我们知道当前状态 ,那么关于过去的任何信息都不会帮助我们更好地预测 。
马尔可夫链的定义
基本要素
一个马尔可夫链由以下要素定义:
| 要素 | 符号 | 说明 |
|---|---|---|
| 状态空间 | 所有可能状态的集合 | |
| 转移概率矩阵 | ||
| 初始分布 |
转移概率矩阵
转移概率矩阵 是一个 的行随机矩阵(每行和为1):
其中 且 。
n步转移概率
Chapman-Kolmogorov方程
从状态 经过 步到达状态 的概率记为 。根据Chapman-Kolmogorov方程:
这意味着我们可以利用矩阵乘法来计算多步转移概率:
即 步转移概率矩阵等于转移概率矩阵的 次方。
稳态分布
平稳分布的定义
若一个概率分布 满足:
则称 为该马尔可夫链的平稳分布(Stationary Distribution)。
极限分布
对于许多马尔可夫链,当 时, 步转移概率 趋向于一个与初始状态无关的极限分布 。
遍历定理
遍历定理(Ergodic Theorem)指出:对于不可约、非周期、正常返的马尔可夫链,时间平均趋向于空间平均。
状态分类
可达与互通
- 可达:若存在 使得 ,则称 可从 可达,记为
- 互通:若 且 ,则称 与 互通,记为
周期性
状态 的周期 定义为:
- 若 ,则状态是非周期的
- 若 ,则状态是周期的
常返与瞬态
- 常返(Recurrent):从状态 出发,以概率1返回
- 瞬态(Transient):从状态 出发,存在正概率永不返回
马尔可夫链蒙特卡洛方法(MCMC)
马尔可夫链的一个强大应用是马尔可夫链蒙特卡洛方法,用于从复杂分布中采样。
Metropolis-Hastings算法
- 从当前状态 出发
- 从提议分布 采样候选状态
- 计算接受率:
- 以概率 接受 ,否则保持
Gibbs采样
Gibbs采样是Metropolis-Hastings的特殊情况,每次只更新一个变量:
应用实例:PageRank
Google的PageRank算法本质上就是一个马尔可夫链。
基本思想
- 网页的重要性取决于指向它的网页数量和质量
- 用户随机浏览网页的行为可以用马尔可夫链建模
- PageRank值就是该马尔可夫链的平稳分布
数学表述
设网页 的PageRank为 , 为页面 的出链数,则:
其中 是阻尼因子(通常取0.85), 是指向 的页面集合。
应用实例:天气模型
考虑一个简化的天气模型:
| 状态 | 晴 | 雨 |
|---|---|---|
| 晴 | 0.7 | 0.3 |
| 雨 | 0.4 | 0.6 |
转移概率矩阵:
稳态分布计算
设稳态分布为 ,满足:
解得:,
这意味着长期来看,约57.1%的时间是晴天,42.9%的时间是雨天。
与其他模型的关系
隐马尔可夫模型(HMM)
隐马尔可夫模型是马尔可夫链的扩展,其中状态是”隐藏”的,只能通过观测序列来推断。详见 隐马尔可夫模型。
条件随机场(CRF)
条件随机场是一种判别式模型,用于序列标注任务。相比HMM,CRF可以建模更复杂的依赖关系。详见后续的概率图模型文档。
参考
Footnotes
-
本文档参考了《概率论与数理统计》相关章节和斯坦福CS228课程材料 ↩