🏂Markov Process

问题背景

开始观看

在离散时间的 Markov 过程(Discrete-Time Markov Chains, DTMC)中,我们可以通过幂运算计算转移矩阵 PnP^n 来得到状态之间的转移概率。然而,在连续时间 Markov 过程(Continuous-Time Markov Chains, CTMC)中,这种方法不再适用。

因为在连续时间下,我们关注状态之间在非常短的时间 tt 内的转移概率,通常记为 pjk(t)p_{jk}(t)。这里的 pjk(t)p_{jk}(t) 表示从状态 jj 转移到状态 kk 的概率。

如果状态空间 SS 是无限的,分析会变得非常复杂。因此,我们常假设状态空间 S|S| 是有限的,即 S<|S| < \infty


定理1:转移率(Transition Rate)

定义:对于 jkSj \neq k \in S,有

qjk=qjrjk(1)q_{jk} = q_j r_{jk}\tag{1}

其中:

  • qjkq_{jk} 表示从状态 jj 到状态 kk转移率(transition rate)。
  • qjq_j 是从状态 jj 出发的总体转移率(总转移到其他状态的速率)。
  • rjkr_{jk} 是条件概率,即假设转移发生的情况下,从 jj 转移到 kk 的概率。

📝举例解释

假设你在超市里购物,每分钟会随机决定是否从一个货架走到另一个货架(这就是转移率 qjq_j)。如果你选择转移,你可能会按某种概率走向特定的货架(对应 rjkr_{jk})。
比如:

  • 你每分钟离开水果区的概率是 qj=0.5q_j = 0.5
  • 如果你离开水果区,你有 80% 的概率去零食区,20% 的概率去饮料区。
    因此:
  • 从水果区到零食区的转移率是 qjk=0.5×0.8=0.4q_{jk} = 0.5 \times 0.8 = 0.4
  • 从水果区到饮料区的转移率是 qjk=0.5×0.2=0.1q_{jk} = 0.5 \times 0.2 = 0.1

接下来在讲解新定理之前我们来了解以下几个知识点:

  1. Notation o(h)o(h) 的定义

如果满足以下条件:

g(h)h0当 h0\frac{g(h)}{h} \to 0 \quad \text{当 } h \to 0。

则函数 g(h)g(h)o(h)o(h)。这意味着,当 hh 变得非常小时,g(h)g(h) 的增长速度比 hh 快速趋于 0。

🌰例子:

  • h2+3h3h^2 + 3h^3o(h)o(h),因为 h2+3h3h=h+3h2\frac{h^2 + 3h^3}{h} = h + 3h^2,当 h0h \to 0 时,趋于 0。
  • 2h+h22h + h^2 不是 o(h)o(h),因为 2h+h2h=2+h\frac{2h + h^2}{h} = 2 + h,当 h0h \to 0 时,不趋于 0。

  1. eahe^{-ah} 的近似

通过泰勒展开,我们有:

eah=1ah+o(h)e^{-ah} = 1 - ah + o(h)

这表示在 hh 很小时,指数函数可以用 1ah1 - ah 来近似。

🌰例子:
想象你有一个非常小的时间间隔 hh,假设你在 hh 时间内完成某事件的概率可以通过指数分布建模。通过这个近似,可以快速估计转移概率。


  1. 概率 P(Th)P(T \leq h)

如果 Texp(α)T \sim \text{exp}(\alpha),即 TT 遵循参数为 α\alpha 的指数分布,则有:

P(Th)=1eαh=αh+o(h)P(T \leq h) = 1 - e^{-\alpha h} = \alpha h + o(h)

这表明,在非常短的时间间隔 hh 内,事件发生的概率接近于 αh\alpha h

🍻生活中的例子:
假设你观察公交车到站的时间间隔(符合指数分布),如果平均每分钟有 1 辆车到达(α=1\alpha = 1),那么在非常短的时间 h=0.1h = 0.1 分钟内车到达的概率大约是 αh=0.1\alpha h = 0.1(即 10%)。


好了,了解之后咱们来看一下这个定理

定理2

假设状态空间 S=N<|S| = N < \infty,以下成立:
1.

pjj(h)=1qjh+o(h)p_{jj}(h) = 1 - q_j h + o(h)

pjk(h)=qjkh+o(h),jkp_{jk}(h) = q_{jk} h + o(h), \quad \forall j \neq k

其中:

  • pjj(h)p_{jj}(h) 是状态 jj 在时间 hh 内保持不变的概率。
  • pjk(h)p_{jk}(h) 是在时间 hh 内从状态 jj 转移到状态 kk 的概率。

我们称 qjkhq_{jk}h1qjh1 - q_jh无限小转移概率(infinitesimal transition probabilities)


证明部分
  1. 定义事件

    • A(h)A(h):在时间间隔 (0,h](0, h] 内没有发生转移。
    • B(h)B(h):在时间间隔 (0,h](0, h] 内发生至少两次转移。
  2. 计算 pjj(h)p_{jj}(h)

    pjj(h)=P(X(h)=j,A(h)X(0)=j)+P(X(h)=j,B(h)X(0)=j)p_{jj}(h) = P(X(h) = j, A(h) \mid X(0) = j) + P(X(h) = j, B(h) \mid X(0) = j)

    对于第一项,根据指数分布的性质,有:

    P(A(h)X(0)=j)=eqjh=1qjh+o(h)P(A(h) \mid X(0) = j) = e^{-q_j h} = 1 - q_j h + o(h)

    第二项是 P(B(h)X(0)=j)P(B(h) \mid X(0) = j),可以证明其为 o(h)o(h),因为事件 B(h)B(h) 表示发生至少两次转移,其概率随着 hh 减小时更快趋于 0。

    所以,结合两项:

    pjj(h)=1qjh+o(h)p_{jj}(h) = 1 - q_j h + o(h)

  3. 计算 pjk(h)p_{jk}(h)jkj \neq k 从状态 jj 跳转到状态 kk 的概率满足:

    pjk(h)=P(从 j 直接跳到 k 在时间 h 内)+P(B(h)X(0)=j)p_{jk}(h) = P(\text{从 $j$ 直接跳到 $k$ 在时间 $h$ 内}) + P(B(h) \mid X(0) = j)

    第一项是 qjkh+o(h)q_{jk} h + o(h),第二项同样为 o(h)o(h),因此:

    pjk(h)=qjkh+o(h)p_{jk}(h) = q_{jk} h + o(h)


生成矩阵 QQ

定义生成矩阵 QQ

Q=(qjk),qjj=qj,qjk=qjrjk,jkQ = (q_{jk}), \quad q_{jj} = -q_j, \quad q_{jk} = q_j r_{jk}, \quad \forall j \neq k

生成矩阵的性质:

  • 每一行的元素和为 0:

    kSqjk=0\sum_{k \in S} q_{jk} = 0

    证明如下:

    kSqjk=qjj+kjqjk=qj+qjkjrjk=qj+qj=0\sum_{k \in S} q_{jk} = q_{jj} + \sum_{k \neq j} q_{jk} = -q_j + q_j \sum_{k \neq j} r_{jk} = -q_j + q_j = 0

  • qjj<0q_{jj} < 0qjk0(jk)q_{jk} \geq 0 \, (j \neq k)

定理3:Forward Equations

对于有限状态空间 S<|S| < \infty,转移概率矩阵 P(t)P(t) 满足:

P(t)=P(t)Q(3)P'(t) = P(t)Q \tag{3}

其中:

  • P(t)P'(t) 表示转移矩阵 P(t)P(t) 中每个元素对时间 tt 的导数。
  • QQ 是生成矩阵。

这个公式被称为正向方程(Forward Equations)。

证明部分
  1. 目标
    我们需要证明每个元素 pjk(t)p_{jk}(t) 满足:

    pjk(t)=rSpjr(t)qrk.p'_{jk}(t) = \sum_{r \in S} p_{jr}(t)q_{rk}.

  2. 右导数的计算
    利用 2.5 中的结果,对任意 j,kj, k

    limh0pjk(t+h)pjk(t)h\lim_{h \downarrow 0} \frac{p_{jk}(t+h) - p_{jk}(t)}{h}

    由转移概率的定义:

    pjk(t+h)=rSpjr(t)prk(h)p_{jk}(t+h) = \sum_{r \in S} p_{jr}(t) p_{rk}(h)

    因此:

    limh0pjk(t+h)pjk(t)h=limh0rSpjr(t)prk(h)pjk(t)h\lim_{h \downarrow 0} \frac{p_{jk}(t+h) - p_{jk}(t)}{h} = \lim_{h \downarrow 0} \frac{\sum_{r \in S} p_{jr}(t)p_{rk}(h) - p_{jk}(t)}{h}

  3. 分解计算
    r=kr = krkr \neq k 的部分拆分:

    =limh0rkpjr(t)prk(h)+pjk(t)pkk(h)pjk(t)h.= \lim_{h \downarrow 0} \frac{\sum_{r \neq k} p_{jr}(t)p_{rk}(h) + p_{jk}(t)p_{kk}(h) - p_{jk}(t)}{h}.

    使用 定理2 的结果:

    • 对于 rkr \neq kprk(h)=qrkh+o(h)p_{rk}(h) = q_{rk}h + o(h)
    • 对于 r=kr = kpkk(h)=1qkh+o(h)p_{kk}(h) = 1 - q_k h + o(h)
      替换后得到:

      =limh0rkpjr(t)(qrkh+o(h))+pjk(t)(1qkh+o(h))pjk(t)h.= \lim_{h \downarrow 0} \frac{\sum_{r \neq k} p_{jr}(t)(q_{rk}h + o(h)) + p_{jk}(t)(1 - q_k h + o(h)) - p_{jk}(t)}{h}.

  4. 化简
    hh 提取出来:

    =limh0rkpjr(t)qrk+pjk(t)(qk)+o(h).= \lim_{h \downarrow 0} \sum_{r \neq k} p_{jr}(t)q_{rk} + p_{jk}(t)(-q_k) + o(h).

    h0h \to 0 时,o(h)o(h) 消失,最终得到:

    pjk(t)=rSpjr(t)qrk.p'_{jk}(t) = \sum_{r \in S} p_{jr}(t)q_{rk}.

  5. 左导数的计算
    同理,对于左导数:

    limh0pjk(t)pjk(th)h\lim_{h \downarrow 0} \frac{p_{jk}(t) - p_{jk}(t-h)}{h}

    可使用类似的方法计算,最终也得到:

    pjk(t)=rSpjr(t)qrk.p'_{jk}(t) = \sum_{r \in S} p_{jr}(t)q_{rk}.

  6. 导数的存在性
    由于左导数和右导数相等,因此 pjk(t)p_{jk}(t) 的导数存在,并且满足:

    pjk(t)=rSpjr(t)qrk.p'_{jk}(t) = \sum_{r \in S} p_{jr}(t)q_{rk}.


💡总结
通过以上证明,我们验证了转移概率矩阵的导数满足:

P(t)=P(t)Q,P'(t) = P(t)Q,

其中,生成矩阵 QQ 表示每个状态之间的转移速率。

🪐Example: Flip-Flop Circuit

我们分析一个简单的两状态 Markov 过程,它的生成矩阵 QQ 和转移概率矩阵 P(t)P(t) 满足 P(t)=P(t)QP'(t) = P(t)Q

以下是他的推导过程:

🍦 定义生成矩阵 QQ

根据题意:

  • q00=q0=λq_{00} = -q_0 = -\lambda
  • q01=1λ=λq_{01} = 1 \cdot \lambda = \lambda
  • q10=1μ=μq_{10} = 1 \cdot \mu = \mu
  • q11=q1=μq_{11} = -q_1 = -\mu

因此生成矩阵为:

Q=(λλμμ)Q = \begin{pmatrix} -\lambda & \lambda \\ \mu & -\mu \end{pmatrix}


🍦求解 P(t)=P(t)QP'(t) = P(t)Q

假设转移概率矩阵 P(t)P(t) 的形式为:

P(t)=(p00(t)p01(t)p10(t)p11(t)).P(t) = \begin{pmatrix} p_{00}(t) & p_{01}(t) \\ p_{10}(t) & p_{11}(t) \end{pmatrix}.

P(t)=P(t)QP'(t) = P(t)Q 可得:

(p00(t)p01(t)p10(t)p11(t))=(p00(t)p01(t)p10(t)p11(t))(λλμμ).\begin{pmatrix} p'_{00}(t) & p'_{01}(t) \\ p'_{10}(t) & p'_{11}(t) \end{pmatrix} = \begin{pmatrix} p_{00}(t) & p_{01}(t) \\ p_{10}(t) & p_{11}(t) \end{pmatrix} \begin{pmatrix} -\lambda & \lambda \\ \mu & -\mu \end{pmatrix}.

通过矩阵乘法,对每个元素的导数进行计算,例如,取矩阵第一行第一列(row 1 × col 1):

p00(t)=λp00(t)+μp01(t).p'_{00}(t) = -\lambda p_{00}(t) + \mu p_{01}(t).

同理,其它导数公式可以分别计算得出。


🍦替换 p01(t)=1p00(t)p_{01}(t) = 1 - p_{00}(t)

注意到 p00(t)+p01(t)=1p_{00}(t) + p_{01}(t) = 1,所以 p01(t)=1p00(t)p_{01}(t) = 1 - p_{00}(t)。代入上述导数表达式:

p00(t)=λp00(t)+μ(1p00(t)).p'_{00}(t) = -\lambda p_{00}(t) + \mu (1 - p_{00}(t)).

展开化简:

p00(t)=(λ+μ)p00(t)+μ.p'_{00}(t) = -(\lambda + \mu)p_{00}(t) + \mu.


🍦求解微分方程

该方程为一阶线性微分方程,可以通过变量分离或积分因子法求解。设初始条件:

p00(0)=P(X(0)=0X(0)=0)=1.p_{00}(0) = P(X(0) = 0 \mid X(0) = 0) = 1.

解得:

p00(t)=1λ+μ{μ+λe(λ+μ)t}.p_{00}(t) = \frac{1}{\lambda + \mu}\{\mu + \lambda e^{-(\lambda + \mu)t}\}.


🍦求 p01(t)p_{01}(t)

p01(t)=1p00(t)p_{01}(t) = 1 - p_{00}(t),代入 p00(t)p_{00}(t)

p01(t)=11λ+μ{μ+λe(λ+μ)t}.p_{01}(t) = 1 - \frac{1}{\lambda + \mu}\{\mu + \lambda e^{-(\lambda + \mu)t}\}.

化简后:

p01(t)=1λ+μ{λλe(λ+μ)t}.p_{01}(t) = \frac{1}{\lambda + \mu}\{\lambda - \lambda e^{-(\lambda + \mu)t}\}.


🍦对称性与其他元素

类似地,可以求得:

p10(t)=1λ+μ{μμe(λ+μ)t},p_{10}(t) = \frac{1}{\lambda + \mu}\{\mu - \mu e^{-(\lambda + \mu)t}\},

p11(t)=1λ+μ{λ+μe(λ+μ)t}.p_{11}(t) = \frac{1}{\lambda + \mu}\{\lambda + \mu e^{-(\lambda + \mu)t}\}.


🍦长时间的极限行为

tt \to \infty,指数项 e(λ+μ)t0e^{-(\lambda + \mu)t} \to 0,此时:

p00()=μλ+μ,p01()=λλ+μ.p_{00}(\infty) = \frac{\mu}{\lambda + \mu}, \quad p_{01}(\infty) = \frac{\lambda}{\lambda + \mu}.

这说明,系统达到平稳状态时,转移概率只依赖于生成矩阵的参数 λ\lambdaμ\mu,与初始状态无关。

以上文档的pdf可以用以下链接下载:

下载文档

观看结束,感谢观看