马尔可夫链(Markov Chain)的平稳分布与收敛性分析
题目描述
马尔可夫链是一种具有马尔可夫性质的随机过程,其未来状态的条件概率分布仅依赖于当前状态,与过去状态无关。平稳分布是马尔可夫链的重要性质,指当链达到某一状态分布后,后续状态分布保持不变。本题要求:
- 解释马尔可夫链的基本定义与转移矩阵;
- 推导平稳分布的存在条件与计算方法;
- 分析链的收敛性(即从任意初始分布能否收敛到平稳分布)。
解题过程
1. 马尔可夫链的定义与转移矩阵
- 定义:设随机过程 \(\{X_t, t=0,1,2,...\}\) 的状态空间为有限集 \(S = \{s_1, s_2, ..., s_n\}\)。若满足:
\[ P(X_{t+1} = s_j \mid X_t = s_i, X_{t-1}, ..., X_0) = P(X_{t+1} = s_j \mid X_t = s_i), \]
则称该过程为离散时间马尔可夫链。
- 转移矩阵:定义转移概率 \(P_{ij} = P(X_{t+1} = s_j \mid X_t = s_i)\),则转移矩阵 \(P\) 是一个 \(n \times n\) 矩阵,满足:
- \(P_{ij} \geq 0\)(非负性);
- 每行元素之和为 1(即 \(\sum_j P_{ij} = 1\))。
- 示例:假设天气状态为{晴, 雨},转移矩阵为:
\[ P = \begin{bmatrix} 0.8 & 0.2 \\ 0.3 & 0.7 \end{bmatrix}, \]
表示晴天转雨天的概率为 0.2,雨天转晴天的概率为 0.3。
2. 平稳分布的定义与计算
- 定义:概率分布 \(\pi = (\pi_1, \pi_2, ..., \pi_n)\) 称为平稳分布,若满足:
\[ \pi P = \pi \quad \text{且} \quad \sum_i \pi_i = 1, \ \pi_i \geq 0. \]
这意味着一旦状态分布为 \(\pi\),后续分布保持不变。
- 计算方法:
- 解线性方程组 \(\pi P = \pi\)(即 \(\pi (P - I) = 0\),其中 \(I\) 为单位矩阵);
- 结合归一化条件 \(\sum_i \pi_i = 1\) 求解。
- 示例:对上述天气模型,解方程:
\[ \begin{cases} \pi_1 = 0.8\pi_1 + 0.3\pi_2 \\ \pi_2 = 0.2\pi_1 + 0.7\pi_2 \\ \pi_1 + \pi_2 = 1 \end{cases} \]
解得 \(\pi_1 = 0.6, \pi_2 = 0.4\)。即长期下,晴天概率为 60%,雨天为 40%。
3. 收敛性分析
- 不可约性:若从任意状态可到达另一状态(即状态间互通),则链不可约。
- 非周期性:若所有状态的最大公约循环长度为 1,则链非周期。
- 收敛定理:若有限状态马尔可夫链不可约且非周期,则存在唯一平稳分布 \(\pi\),且对任意初始分布 \(\mu^{(0)}\):
\[ \lim_{t \to \infty} \mu^{(0)} P^t = \pi. \]
- 直观理解:不可约性保证所有状态被频繁访问,非周期性避免振荡,从而确保收敛。
- 示例验证:天气模型中,\(P\) 的所有元素为正,显然不可约且非周期。计算 \(P^t\)(如 \(t=10\))可验证各行收敛到 \((0.6, 0.4)\)。
总结
平稳分布是马尔可夫链的长期行为描述,通过线性方程组求解。收敛性需满足不可约性和非周期性条件,保证从任意起点均趋近平稳分布。此性质广泛应用于蒙特卡洛方法、排队论等领域。