概述

马尔可夫链(Markov Chain)是一种特殊的随机过程,具有”无记忆性”(Memorylessness)的特点——当前状态只与上一状态有关,与更早的历史无关。1

马尔可夫链在搜索引擎(PageRank)、语音识别、自然语言处理、推荐系统等领域都有广泛应用。


马尔可夫性质

定义

为一个离散时间随机过程,若对任意时刻 和任意状态序列 ,满足:

则称该过程具有马尔可夫性质(Markov Property)。

直观理解

未来只与现在有关,与过去无关。

这意味着,如果我们知道当前状态 ,那么关于过去的任何信息都不会帮助我们更好地预测


马尔可夫链的定义

基本要素

一个马尔可夫链由以下要素定义:

要素符号说明
状态空间所有可能状态的集合
转移概率矩阵
初始分布

转移概率矩阵

转移概率矩阵 是一个 行随机矩阵(每行和为1):

其中


n步转移概率

Chapman-Kolmogorov方程

从状态 经过 步到达状态 的概率记为 。根据Chapman-Kolmogorov方程

这意味着我们可以利用矩阵乘法来计算多步转移概率:

步转移概率矩阵等于转移概率矩阵的 次方。


稳态分布

平稳分布的定义

若一个概率分布 满足:

则称 为该马尔可夫链的平稳分布(Stationary Distribution)。

极限分布

对于许多马尔可夫链,当 时, 步转移概率 趋向于一个与初始状态无关的极限分布

遍历定理

遍历定理(Ergodic Theorem)指出:对于不可约、非周期、正常返的马尔可夫链,时间平均趋向于空间平均。


状态分类

可达与互通

  • 可达:若存在 使得 ,则称 可从 可达,记为
  • 互通:若 ,则称 互通,记为

周期性

状态 周期 定义为:

  • ,则状态是非周期的
  • ,则状态是周期的

常返与瞬态

  • 常返(Recurrent):从状态 出发,以概率1返回
  • 瞬态(Transient):从状态 出发,存在正概率永不返回

马尔可夫链蒙特卡洛方法(MCMC)

马尔可夫链的一个强大应用是马尔可夫链蒙特卡洛方法,用于从复杂分布中采样。

Metropolis-Hastings算法

  1. 从当前状态 出发
  2. 从提议分布 采样候选状态
  3. 计算接受率:
  4. 以概率 接受 ,否则保持

Gibbs采样

Gibbs采样是Metropolis-Hastings的特殊情况,每次只更新一个变量:


应用实例:PageRank

Google的PageRank算法本质上就是一个马尔可夫链。

基本思想

  • 网页的重要性取决于指向它的网页数量和质量
  • 用户随机浏览网页的行为可以用马尔可夫链建模
  • PageRank值就是该马尔可夫链的平稳分布

数学表述

设网页 的PageRank为 为页面 的出链数,则:

其中 是阻尼因子(通常取0.85), 是指向 的页面集合。


应用实例:天气模型

考虑一个简化的天气模型:

状态
0.70.3
0.40.6

转移概率矩阵:

稳态分布计算

设稳态分布为 ,满足:

解得:

这意味着长期来看,约57.1%的时间是晴天,42.9%的时间是雨天。


与其他模型的关系

隐马尔可夫模型(HMM)

隐马尔可夫模型是马尔可夫链的扩展,其中状态是”隐藏”的,只能通过观测序列来推断。详见 隐马尔可夫模型

条件随机场(CRF)

条件随机场是一种判别式模型,用于序列标注任务。相比HMM,CRF可以建模更复杂的依赖关系。详见后续的概率图模型文档。


参考

Footnotes

  1. 本文档参考了《概率论与数理统计》相关章节和斯坦福CS228课程材料