🏂Markov Process
⚡ 问题背景
在离散时间的 Markov 过程(Discrete-Time Markov Chains, DTMC)中,我们可以通过幂运算计算转移矩阵 Pn 来得到状态之间的转移概率。然而,在连续时间 Markov 过程(Continuous-Time Markov Chains, CTMC)中,这种方法不再适用。
因为在连续时间下,我们关注状态之间在非常短的时间 t 内的转移概率,通常记为 pjk(t)。这里的 pjk(t) 表示从状态 j 转移到状态 k 的概率。
如果状态空间 S 是无限的,分析会变得非常复杂。因此,我们常假设状态空间 ∣S∣ 是有限的,即 ∣S∣<∞。
⛺定理1:转移率(Transition Rate)
定义:对于 j=k∈S,有
qjk=qjrjk(1)
其中:
- qjk 表示从状态 j 到状态 k 的转移率(transition rate)。
- qj 是从状态 j 出发的总体转移率(总转移到其他状态的速率)。
- rjk 是条件概率,即假设转移发生的情况下,从 j 转移到 k 的概率。
📝举例解释
假设你在超市里购物,每分钟会随机决定是否从一个货架走到另一个货架(这就是转移率 qj)。如果你选择转移,你可能会按某种概率走向特定的货架(对应 rjk)。
比如:
- 你每分钟离开水果区的概率是 qj=0.5。
- 如果你离开水果区,你有 80% 的概率去零食区,20% 的概率去饮料区。
因此:
- 从水果区到零食区的转移率是 qjk=0.5×0.8=0.4。
- 从水果区到饮料区的转移率是 qjk=0.5×0.2=0.1。
接下来在讲解新定理之前我们来了解以下几个知识点:
- Notation o(h) 的定义
如果满足以下条件:
hg(h)→0当 h→0。
则函数 g(h) 是 o(h)。这意味着,当 h 变得非常小时,g(h) 的增长速度比 h 快速趋于 0。
🌰例子:
- h2+3h3 是 o(h),因为 hh2+3h3=h+3h2,当 h→0 时,趋于 0。
- 2h+h2 不是 o(h),因为 h2h+h2=2+h,当 h→0 时,不趋于 0。
- e−ah 的近似
通过泰勒展开,我们有:
e−ah=1−ah+o(h)
这表示在 h 很小时,指数函数可以用 1−ah 来近似。
🌰例子:
想象你有一个非常小的时间间隔 h,假设你在 h 时间内完成某事件的概率可以通过指数分布建模。通过这个近似,可以快速估计转移概率。
- 概率 P(T≤h)
如果 T∼exp(α),即 T 遵循参数为 α 的指数分布,则有:
P(T≤h)=1−e−αh=αh+o(h)
这表明,在非常短的时间间隔 h 内,事件发生的概率接近于 αh。
🍻生活中的例子:
假设你观察公交车到站的时间间隔(符合指数分布),如果平均每分钟有 1 辆车到达(α=1),那么在非常短的时间 h=0.1 分钟内车到达的概率大约是 αh=0.1(即 10%)。
好了,了解之后咱们来看一下这个定理
⛺定理2
假设状态空间 ∣S∣=N<∞,以下成立:
1.
pjj(h)=1−qjh+o(h)
pjk(h)=qjkh+o(h),∀j=k
其中:
- pjj(h) 是状态 j 在时间 h 内保持不变的概率。
- pjk(h) 是在时间 h 内从状态 j 转移到状态 k 的概率。
我们称 qjkh 和 1−qjh 为无限小转移概率(infinitesimal transition probabilities)。
证明部分
-
定义事件
- A(h):在时间间隔 (0,h] 内没有发生转移。
- B(h):在时间间隔 (0,h] 内发生至少两次转移。
-
计算 pjj(h)
pjj(h)=P(X(h)=j,A(h)∣X(0)=j)+P(X(h)=j,B(h)∣X(0)=j)
对于第一项,根据指数分布的性质,有:
P(A(h)∣X(0)=j)=e−qjh=1−qjh+o(h)
第二项是 P(B(h)∣X(0)=j),可以证明其为 o(h),因为事件 B(h) 表示发生至少两次转移,其概率随着 h 减小时更快趋于 0。
所以,结合两项:
pjj(h)=1−qjh+o(h)
-
计算 pjk(h) (j=k) 从状态 j 跳转到状态 k 的概率满足:
pjk(h)=P(从 j 直接跳到 k 在时间 h 内)+P(B(h)∣X(0)=j)
第一项是 qjkh+o(h),第二项同样为 o(h),因此:
pjk(h)=qjkh+o(h)
生成矩阵 Q
定义生成矩阵 Q:
Q=(qjk),qjj=−qj,qjk=qjrjk,∀j=k
生成矩阵的性质:
-
每一行的元素和为 0:
k∈S∑qjk=0
证明如下:
k∈S∑qjk=qjj+k=j∑qjk=−qj+qjk=j∑rjk=−qj+qj=0
-
qjj<0,qjk≥0(j=k)。
⛺定理3:Forward Equations
对于有限状态空间 ∣S∣<∞,转移概率矩阵 P(t) 满足:
P′(t)=P(t)Q(3)
其中:
- P′(t) 表示转移矩阵 P(t) 中每个元素对时间 t 的导数。
- Q 是生成矩阵。
这个公式被称为正向方程(Forward Equations)。
证明部分
-
目标
我们需要证明每个元素 pjk(t) 满足:
pjk′(t)=r∈S∑pjr(t)qrk.
-
右导数的计算
利用 2.5 中的结果,对任意 j,k:
h↓0limhpjk(t+h)−pjk(t)
由转移概率的定义:
pjk(t+h)=r∈S∑pjr(t)prk(h)
因此:
h↓0limhpjk(t+h)−pjk(t)=h↓0limh∑r∈Spjr(t)prk(h)−pjk(t)
-
分解计算
将 r=k 和 r=k 的部分拆分:
=h↓0limh∑r=kpjr(t)prk(h)+pjk(t)pkk(h)−pjk(t).
使用 定理2 的结果:
-
化简
将 h 提取出来:
=h↓0limr=k∑pjr(t)qrk+pjk(t)(−qk)+o(h).
当 h→0 时,o(h) 消失,最终得到:
pjk′(t)=r∈S∑pjr(t)qrk.
-
左导数的计算
同理,对于左导数:
h↓0limhpjk(t)−pjk(t−h)
可使用类似的方法计算,最终也得到:
pjk′(t)=r∈S∑pjr(t)qrk.
-
导数的存在性
由于左导数和右导数相等,因此 pjk(t) 的导数存在,并且满足:
pjk′(t)=r∈S∑pjr(t)qrk.
💡总结
通过以上证明,我们验证了转移概率矩阵的导数满足:
P′(t)=P(t)Q,
其中,生成矩阵 Q 表示每个状态之间的转移速率。
🪐Example: Flip-Flop Circuit
我们分析一个简单的两状态 Markov 过程,它的生成矩阵 Q 和转移概率矩阵 P(t) 满足 P′(t)=P(t)Q。
以下是他的推导过程:
🍦 定义生成矩阵 Q
根据题意:
- q00=−q0=−λ
- q01=1⋅λ=λ
- q10=1⋅μ=μ
- q11=−q1=−μ
因此生成矩阵为:
Q=(−λμλ−μ)
🍦求解 P′(t)=P(t)Q
假设转移概率矩阵 P(t) 的形式为:
P(t)=(p00(t)p10(t)p01(t)p11(t)).
由 P′(t)=P(t)Q 可得:
(p00′(t)p10′(t)p01′(t)p11′(t))=(p00(t)p10(t)p01(t)p11(t))(−λμλ−μ).
通过矩阵乘法,对每个元素的导数进行计算,例如,取矩阵第一行第一列(row 1 × col 1):
p00′(t)=−λp00(t)+μp01(t).
同理,其它导数公式可以分别计算得出。
🍦替换 p01(t)=1−p00(t)
注意到 p00(t)+p01(t)=1,所以 p01(t)=1−p00(t)。代入上述导数表达式:
p00′(t)=−λp00(t)+μ(1−p00(t)).
展开化简:
p00′(t)=−(λ+μ)p00(t)+μ.
🍦求解微分方程
该方程为一阶线性微分方程,可以通过变量分离或积分因子法求解。设初始条件:
p00(0)=P(X(0)=0∣X(0)=0)=1.
解得:
p00(t)=λ+μ1{μ+λe−(λ+μ)t}.
🍦求 p01(t)
由 p01(t)=1−p00(t),代入 p00(t):
p01(t)=1−λ+μ1{μ+λe−(λ+μ)t}.
化简后:
p01(t)=λ+μ1{λ−λe−(λ+μ)t}.
🍦对称性与其他元素
类似地,可以求得:
p10(t)=λ+μ1{μ−μe−(λ+μ)t},
p11(t)=λ+μ1{λ+μe−(λ+μ)t}.
🍦长时间的极限行为
当 t→∞,指数项 e−(λ+μ)t→0,此时:
p00(∞)=λ+μμ,p01(∞)=λ+μλ.
这说明,系统达到平稳状态时,转移概率只依赖于生成矩阵的参数 λ 和 μ,与初始状态无关。
以上文档的pdf可以用以下链接下载:
下载文档