Time Series

开始观看

什么是时间序列?

  1. 时间序列的定义
    时间序列是一个随机过程,可以记作 {xt,tT}\{x_t, t \in T\},其中 tt 表示时间, xtx_t 表示观测数据。
  2. 离散参数时间序列
    T=ZT = \mathbb{Z}(整数集)时,时间序列称为离散参数时间序列:
    • 时间点是等间隔的,比如每小时、每天、每周、每年等。
    • 通常假设时间序列可以追溯到无限过去。
  3. 连续参数时间序列
    如果 T=RT = \mathbb{R}(实数集),时间序列就是连续参数的。例如,时间可以是任意实数值。
  4. 连续转离散
    有些情况下,连续时间序列可以通过采样变成离散序列,比如每天中午的温度(如果我们要记录每时每刻温度的变化,那么此时就是连续时间序列,但如果我们每天只记录中午12点的气温。这种记录方式就相当于对连续序列进行了采样,时间点变成离散的)现实中这种采样例子有很多,比如说从股票的每秒变动记录中提取每天的收盘价。

Finite realization and learning from historical data

The set of observations {xt,t=1,...,n}\{x_t, t = 1, . . . , n\} is called a realization(实现或一条轨迹) of the time series {xt,tZ}\{x_t, t ∈ Z\}

  1. 有限观测
    在实际中,我们无法观察到时间序列的无限过去,只能观测到有限时间点的数据 {x1,x2,,xn}\{x_1, x_2, \dots, x_n\},其中 n>0n > 0 是有限的。
  2. 理解依赖关系
    我们的目标是从数据中理解 xtx_t 如何依赖于过去的值,比如 xt1,xt2x_{t-1}, x_{t-2} 等。
  3. 平稳性假设
    理解 xtx_t 依赖关系的难度可以降低,如果假设:
    • xtx_t 的均值相同。
    • 对过去值的依赖关系一致。

[!Tip]

时间序列分析的主要任务就是根据观测数据的特点为数据建立尽可能合理的统计模型,然后利用模型的统计特性去解释数据的统计规律,以其达到控制或者预报的目的,

时间序列是按时间次序排列的随机变量序列,任何时间序列经过合理的函数变换后都可以被认为是由三个部分叠加而成. 这三个部分是趋势项部分、周期项部分和随机噪声项部分

Stationarity(平稳序列)

Strict Stationarity

  1. 严格平稳性的定义
    时间序列 {xt}\{x_t\} 被称为严格平稳(strictly stationary),如果任意时间点的联合分布不随时间平移而变化。具体来说,对于任意 n1n \geq 1 和任意时间点 t1,t2,,tnZt_1, t_2, \dots, t_n \in \mathbb{Z} 以及 sZs \in \mathbb{Z}

    (xt1,xt2,,xtn)(xt1+s,xt2+s,,xtn+s).(x_{t_1}, x_{t_2}, \dots, x_{t_n}) \sim (x_{t_1+s}, x_{t_2+s}, \dots, x_{t_n+s}).

    这意味着无论时间点如何移动,联合分布保持相同。

  2. 特殊情况

    • n=1n = 1:单个随机变量的分布不随时间平移而变化,即 xtxt+sx_t \sim x_{t+s}
    • n=2n = 2:两个随机变量的联合分布不随时间平移而变化,即 (xt1,xt2)(xt1+s,xt2+s)(x_{t_1}, x_{t_2}) \sim (x_{t_1+s}, x_{t_2+s})
    • 类似地,对于任意 nn,所有变量的联合分布不随时间移动而变化。
  3. 结论
    严格平稳性表示时间序列的分布特性不依赖于时间,而只依赖于时间点之间的相对位置。这是时间序列分析中最强的平稳性条件。


An i.i.d Sequence

  1. 独立同分布序列
    假设时间序列 {xt}\{x_t\} 是一个独立同分布(i.i.d.)的随机序列,其均值和方差分别为 μ\muσ2\sigma^2

    {xt}IID(μ,σ2).\{x_t\} \sim IID(\mu, \sigma^2).

  2. 联合分布证明严格平稳性

    • 任意 t1,t2,,tnt_1, t_2, \dots, t_n,联合分布函数是:

      P(xt1x1,,xtnxn)=P(xt1x1)P(xt2x2)P(xtnxn).P(x_{t_1} \leq x_1, \dots, x_{t_n} \leq x_n) = P(x_{t_1} \leq x_1) \cdot P(x_{t_2} \leq x_2) \cdot \dots \cdot P(x_{t_n} \leq x_n).

      因为 {xt}\{x_t\} 是独立的。
    • 经过时间平移后的联合分布是:

      P(xt1+sx1,,xtn+sxn)=P(xt1+sx1)P(xt2+sx2)P(xtn+sxn).P(x_{t_1+s} \leq x_1, \dots, x_{t_n+s} \leq x_n) = P(x_{t_1+s} \leq x_1) \cdot P(x_{t_2+s} \leq x_2) \cdot \dots \cdot P(x_{t_n+s} \leq x_n).

      因为每个随机变量的分布相同(同分布),这等于原分布。

    结论 : 因此,i.i.d. 序列是严格平稳的,因为无论如何平移时间点,联合分布都保持不变。

Weak Stationarity

  1. 一阶和二阶矩的回顾

    • 方差:对于单个随机变量 XX,其方差定义为 Var{X}=E[(XE[X])2]Var\{X\} = \mathbb{E}[(X - \mathbb{E}[X])^2],表示其波动的程度。
    • 协方差:对于两个随机变量 XXYY,协方差定义为 Cov{X,Y}=E[(XE[X])(YE[Y])]Cov\{X, Y\} = \mathbb{E}[(X - \mathbb{E}[X])(Y - \mathbb{E}[Y])]。如果 X=YX = Y,协方差就是方差。
  2. 弱平稳性的定义
    如果满足以下条件,则时间序列 {xt}\{x_t\}弱平稳(weakly stationary)的:

    • E[xt]=E[xt+s]\mathbb{E}[x_t] = \mathbb{E}[x_{t+s}],即 xtx_t 的均值不随时间 tt 变化。
    • 对于任意的 t1,t2t_1, t_2ss,协方差 Cov{xt1,xt2}Cov\{x_{t_1}, x_{t_2}\} 仅与时间差 s=t2t1s = t_2 - t_1 有关,不依赖于具体的时间点。

    [!CAUTION]

    弱平稳的两个重要性质

    • 均值 μt=E[xt]\mu_t = \mathbb{E}[x_t] 是一个常数(不依赖于 tt)。
    • 协方差 Rt(s)=Cov{xt,xt+s}R_t(s) = Cov\{x_t, x_{t+s}\} 是仅依赖于时间差 ss 的函数。
  3. 自协方差函数
    函数 R(s)=Cov{xt,xt+s}R(s) = Cov\{x_t, x_{t+s}\} 称为自协方差函数(autocovariance function)。其中 ss滞后(lag),即两个时间点之间的间隔。
    特别地,当 s=0s = 0 时:

    R(0)=Cov{xt,xt}=Var{xt}R(0) = Cov\{x_t, x_t\} = Var\{x_t\}

    因此,时间序列的方差是一个常量。


White Noise

  1. 白噪声的定义
    白噪声是均值相同、方差相同且不相关的一组随机变量 {xt}\{x_t\}。它用以下形式表示:

    {xt}WN(μ,σ2)\{x_t\} \sim WN(\mu, \sigma^2)

    通常,我们假设 μ=0\mu = 0

  2. 白噪声的弱平稳性

    • 均值 E[xt]=μ\mathbb{E}[x_t] = \mu 是常数。
    • 任意时间点之间的协方差满足:

      Cov{xt,xt+s}={σ2,if s=0,0,if s0.Cov\{x_t, x_{t+s}\} = \begin{cases} \sigma^2, & \text{if } s = 0, \\ 0, & \text{if } s \neq 0. \end{cases}

      这说明,白噪声的协方差只与滞后 ss 有关。
  3. 自协方差函数
    白噪声的自协方差函数可以用 Kronecker delta 函数 δs\delta_s 表示:

    R(s)=σ2δs,sZ.R(s) = \sigma^2 \delta_s, \quad s \in \mathbb{Z}.

    其中 δs=1\delta_s = 1s=0s = 0,否则 δs=0\delta_s = 0
    这反映了白噪声的独立性:只有 s=0s = 0 时有协方差,其余滞后时为零。

Connection between Strict and Weak Stationarity

  1. 严格平稳与弱平稳的关系

    • 严格平稳性意味着联合分布在时间平移后保持不变。

      • 如果均值和方差存在,严格平稳性也会带来相同的均值和方差。这排除了像柯西分布(Cauchy distribution)这样均值不存在的分布。

        f(x)=π1(1+x2)1,x(,)f(x) = \pi^{-1}(1 + x^2)^{-1}, \quad x \in (-\infty, \infty)

        对于柯西分布,xf(x)x f(x) 不可积,因此均值不存在。
      • 如果二元联合分布相同,则协方差也是相同的(如果协方差存在)。
    • 严格平稳 ⇒ 弱平稳
      当一阶矩(均值)和二阶矩(方差和协方差)都存在时,严格平稳性必然意味着弱平稳性。

  2. 弱平稳性的定义回顾
    弱平稳性只要求均值、方差和协方差在时间平移后保持不变, 不需要完整的联合分布不变。


  1. 定义 1.3: 高斯性(Gaussianity)

    • 一个时间序列 {xt}\{x_t\} 被称为高斯时间序列,如果任意时间点 t1,,tnt_1, \dots, t_n 的联合分布是多元正态分布
    • 多元正态分布的性质
      多元正态分布完全由其均值向量协方差矩阵决定。
      联合概率密度函数只依赖于这两个统计量。
  2. 高斯性与平稳性结合

    • 如果一个时间序列是弱平稳且高斯分布,那么它也是严格平稳的。
      原因是对于高斯分布,联合分布完全由一阶矩和二阶矩决定。

[!Tip]

  1. 严格平稳性是指联合分布不会随着时间点的平移而发生相同的变化。

  2. 弱平稳性是指均值、方差和协方差具有平移不变性。

  3. 严格平稳性和有限的一阶和二阶矩的存在 ⇒ 弱平稳性。

  4. 弱平稳性和高斯性 ⇒ 严格平稳性。

  5. 具有有限均值和有限方差的 iid 序列是白噪声过程。

  6. 高斯白噪声过程是 iid 序列。

Examples of time series

Example: Simulated Data

Image

[!Question]

问题:协方差是什么?

  • 白噪声的协方差:对于白噪声 {ϵt}\{\epsilon_t\},协方差为 0,因为序列的各项独立。
  • 构造序列的协方差{xt}\{x_t\} 中的协方差会受到 ϵt1\epsilon_{t-1} 的滞后效应影响。可以通过计算 Cov{xt,xt+s}Cov\{x_t, x_{t+s}\} 确定不同滞后下的协方差。

Lag Plots(滞后图)

lag=1

Image

  1. 线性趋势
    在这些图中,可以通过散点画出一条具有正斜率的直线。这说明 {xt}\{x_t\}{xt1}\{x_{t-1}\} 之间存在稳定的线性相关性。

  2. 意义
    滞后图是用来检查时间序列中是否存在自相关的常用工具:

    • 如果图中点分布随机,说明没有自相关。
    • 如果存在明显的线性关系(如正斜率的直线),说明存在自相关性。

[!SUCCESS]

  • 白噪声序列独立且无自相关,而 {xt}\{x_t\} 通过引入滞后项 ϵt1\epsilon_{t-1},显示了线性相关性。
  • 滞后图提供了直观的方式来判断时间序列的相关性。

Real Data - Air Passenger Dataset

这是一个经典的时间序列数据集,表示1949年1月到1960年12月期间(共144个月)美国航空客运量(单位:千人)

Image

[!Tip]

原始序列和对数变换后的序列均显示增长趋势和周期性季节模式。

对数变换是处理非平稳性(如变化幅度随时间增大)的一种常用方法。


Differencing

计算相邻观测值之间的差值,这种方法被称为差分

差分是将时间序列转化为平稳序列的另一种常用方法。通过消除趋势或季节性成分,可以使序列满足平稳性假设。

Image

Properties of the Autocovariance Function

定理 1

自协方差函数 R(s)R(s) 的性质

对于一个(弱)平稳时间序列 {xt}\{x_t\} 的自协方差函数 R(s)R(s),满足以下性质:

  1. 有界性

    R(s)R(0),sZ,|R(s)| \leq R(0), \quad s \in \mathbb{Z},

    其中 R(0)=Var{xt}R(0) = Var\{x_t\} 表示时间序列的方差。
    这意味着滞后 ss 处的协方差不会超过方差本身。

  2. 偶函数

    R(s)=R(s),sZ.R(s) = R(-s), \quad s \in \mathbb{Z}.

    自协方差函数是关于 ss 的偶函数,即对于任意滞后,协方差是对称的。

  3. 正半定性

    i=1nj=1naiR(titj)aj0,t1,t2,,tnZ,a1,a2,,anR.\sum_{i=1}^n \sum_{j=1}^n a_i R(t_i - t_j) a_j \geq 0, \quad \forall t_1, t_2, \dots, t_n \in \mathbb{Z}, \, \forall a_1, a_2, \dots, a_n \in \mathbb{R}.

    这个性质表明,对于任意线性组合的随机变量,其方差非负。


协方差作为内积

协方差在处理随机变量的线性组合时,可以看作是一种“内积”:

  1. 它在每个参数上是线性的。
  2. 例如: Cov{aX+bY,Z}=aCov{X,Z}+bCov{Y,Z}.Cov\{aX + bY, Z\} = aCov\{X, Z\} + bCov\{Y, Z\}.
    这种线性性质可以扩展到更复杂的随机变量组合。

[!Quote]

[定理1的证明](#定理 1)

(a) 有界性

由定义:

R(s)=Cov{xt,xt+s},R(0)=Var{xt}.R(s) = Cov\{x_t, x_{t+s}\}, \quad R(0) = Var\{x_t\}.

根据柯西-施瓦兹不等式(Cauchy-Schwarz Inequality):

R(s)=Cov{xt,xt+s}Var{xt}Var{xt+s}=R(0).|R(s)| = |Cov\{x_t, x_{t+s}\}| \leq \sqrt{Var\{x_t\}Var\{x_{t+s}\}} = R(0).

因此 R(s)R(s) 的绝对值被方差限制。


(b) 偶函数

由协方差的对称性:

R(s)=Cov{xt,xt+s}=Cov{xt+s,xt}=R(s).R(s) = Cov\{x_t, x_{t+s}\} = Cov\{x_{t+s}, x_t\} = R(-s).

这证明了 R(s)R(s) 是偶函数。


© 正半定性

对任意 t1,t2,,tnZt_1, t_2, \dots, t_n \in \mathbb{Z}a1,a2,,anRa_1, a_2, \dots, a_n \in \mathbb{R},考虑如下和:

i=1nj=1naiR(titj)aj.\sum_{i=1}^n \sum_{j=1}^n a_i R(t_i - t_j) a_j.

R(titj)R(t_i - t_j) 替换为协方差:

i=1nj=1naiCov{xti,xtj}aj.\sum_{i=1}^n \sum_{j=1}^n a_i Cov\{x_{t_i}, x_{t_j}\} a_j.

这可以看作随机变量 i=1naixti\sum_{i=1}^n a_i x_{t_i} 的方差:

Var(i=1naixti)0.Var\left(\sum_{i=1}^n a_i x_{t_i}\right) \geq 0.

因此,R(s)R(s) 是正半定的。


Autocovariance Matrix and Autocorrelation Function

  1. 自协方差矩阵 RnR_n
    自协方差矩阵描述了时间序列 {xt}\{x_t\} 在不同时间点之间的协方差关系:

    Rn=[R(0)R(1)R(n1)R(1)R(0)R(n2)R(n1)R(n2)R(0)]R_n = \begin{bmatrix} R(0) & R(1) & \cdots & R(n-1) \\ R(1) & R(0) & \cdots & R(n-2) \\ \vdots & \vdots & \ddots & \vdots \\ R(n-1) & R(n-2) & \cdots & R(0) \end{bmatrix}

    • 矩阵的元素是 R(ij)R(|i-j|),表示滞后为 ij|i-j| 时的协方差。
    • 它是一个 Toeplitz 矩阵(对角线元素相同)。
  2. 正半定性与性质 ©

    • 矩阵 RnR_n 是正半定的,这来源于自协方差函数的正半定性质。
    • 任何线性组合的方差总是非负的,保证了正半定性。
  3. 自相关函数 r(s)r(s)

    • 自相关函数是协方差的标准化形式:

      r(s)=Corr{xt,xt+s}=Cov{xt,xt+s}Var{xt}Var{xt+s}=R(s)R(0)r(s) = Corr\{x_t, x_{t+s}\} = \frac{Cov\{x_t, x_{t+s}\}}{\sqrt{Var\{x_t\}Var\{x_{t+s}\}}} = \frac{R(s)}{R(0)}

    • 它具有与自协方差函数相同的性质 (a)-©。
    • 特别地:r(0)=1r(0) = 1,表示与自身完全相关。

Linear Filtering of Time Series

在数字信号分析中,时间序列{X}\{X\}被称为信号过程。信号过程的频率是单位时间内该信号过程的振动次数振动次数越大,频率就越高,在一些通讯工程问题里,常常需要设计线性滤波器来滤掉信号过程中的高频噪声

  1. 线性滤波的定义
    假设 {xt}\{x_t\} 是一个平稳时间序列,定义输出序列 {yt}\{y_t\} 为:

    yt=i=aixti,tZy_t = \sum_{i=-\infty}^\infty a_i x_{t-i}, \quad t \in \mathbb{Z}

    其中 i=ai<\sum_{i=-\infty}^\infty |a_i| < \infty 保证收敛。

    • {yt}\{y_t\} 被称为 {xt}\{x_t\}滑动平均(moving average)
    • {xt}\{x_t\}{yt}\{y_t\} 的变换被称为线性滤波(linear filter)
  2. 线性滤波的例子

    • 差分yt=xtxt1y_t = x_t - x_{t-1},用于去除趋势。
    • 插值yt=(xt1+xt+1)/2y_t = (x_{t-1} + x_{t+1}) / 2,用于平滑序列。
    • 加权平均yt=xt12+xt24+xt38+y_t = \frac{x_{t-1}}{2} + \frac{x_{t-2}}{4} + \frac{x_{t-3}}{8} + \cdots,权重随时间滞后减小。
  3. 滤波过程

    • 滤波器将输入序列 {xt}\{x_t\} 与系数 {ai}\{a_i\} 进行加权和,生成输出序列 {yt}\{y_t\}
    • 系数 {ai}\{a_i\} 可以是对称的(如加权平均)或非对称的(如差分)。

Properties of {yt}\{y_t\} from {xt}\{x_t\}

定理 2:线性滤波序列的弱平稳性

假设时间序列 {xt}\{x_t\} 是弱平稳的,其自协方差函数为 Rx(s)R_x(s)。经过线性滤波生成的序列 {yt}\{y_t\} 定义为:

yt=i=aixti.y_t = \sum_{i=-\infty}^\infty a_i x_{t-i}.

那么 {yt}\{y_t\} 也是弱平稳的,其自协方差函数为:

Ry(s)=i=j=aiajRx(s+ij),sZ.R_y(s) = \sum_{i=-\infty}^\infty \sum_{j=-\infty}^\infty a_i a_j R_x(s + i - j), \quad s \in \mathbb{Z}.


证明:

  1. 均值的平稳性

    E[yt]=i=aiE[xti]=μxi=ai.\mathbb{E}[y_t] = \sum_{i=-\infty}^\infty a_i \mathbb{E}[x_{t-i}] = \mu_x \sum_{i=-\infty}^\infty a_i.

    均值不依赖于时间 tt,因此满足均值平稳。

  2. 协方差的平稳性

    Cov{yt,yt+s}=Cov{i=aixti,j=ajxt+sj}.Cov\{y_t, y_{t+s}\} = Cov\left\{\sum_{i=-\infty}^\infty a_i x_{t-i}, \sum_{j=-\infty}^\infty a_j x_{t+s-j}\right\}.

    利用线性组合的协方差公式:

    Cov{yt,yt+s}=i=j=aiajCov{xti,xt+sj}.Cov\{y_t, y_{t+s}\} = \sum_{i=-\infty}^\infty \sum_{j=-\infty}^\infty a_i a_j Cov\{x_{t-i}, x_{t+s-j}\}.

    由于 {xt}\{x_t\} 是弱平稳的:

    Cov{xti,xt+sj}=Rx(s+ij).Cov\{x_{t-i}, x_{t+s-j}\} = R_x(s + i - j).

    代入后得到:

    Ry(s)=i=j=aiajRx(s+ij).R_y(s) = \sum_{i=-\infty}^\infty \sum_{j=-\infty}^\infty a_i a_j R_x(s + i - j).

    这是 Ry(s)R_y(s) 的定义,说明协方差仅依赖于滞后 ss,从而 {yt}\{y_t\} 是弱平稳的。


[!Example]

A Special Case

特殊情况:{xt}\{x_t\} 是白噪声

假设 {xt}\{x_t\} 是白噪声 {ϵt}\{\epsilon_t\},满足 Rx(s)=σ2R_x(s) = \sigma^2s=0s = 0,否则 Rx(s)=0R_x(s) = 0。此时,{yt}\{y_t\} 的自协方差函数为:

Ry(s)=σx2i=aiai+s.R_y(s) = \sigma_x^2 \sum_{i=-\infty}^\infty a_i a_{i+s}.

例子 1.2

定义 {xt}\{x_t\} 如下:

xt=ϵt+aϵt1,{ϵt}WN(0,σ2).x_t = \epsilon_t + a\epsilon_{t-1}, \quad \{\epsilon_t\} \sim WN(0, \sigma^2).

这是一个移动平均模型(Moving Average Model, MA(1)):

  • 系数 a0=1a_0 = 1a1=aa_1 = a,其余系数为 0。

根据定理 2,自协方差函数为:

Rx(s)=σ2(a0as+a1as+1).R_x(s) = \sigma^2(a_0a_s + a_1a_{s+1}).

通过具体计算:

  • s=0s = 0Rx(0)=σ2(1+a2)R_x(0) = \sigma^2(1 + a^2),包含 ϵt\epsilon_tϵt1\epsilon_{t-1} 的影响。
  • s=1s = 1s=1s = -1Rx(1)=Rx(1)=σ2aR_x(1) = R_x(-1) = \sigma^2 a,仅与 ϵt\epsilon_tϵt1\epsilon_{t-1} 之间的相关性有关。
  • s>1|s| > 1Rx(s)=0R_x(s) = 0,因为 ϵt\epsilon_tϵts\epsilon_{t-s} 独立。

以上文档的pdf可以用以下链接下载:

下载文档

这周tutorial sheet可以用以下链接下载:

下载tutorial sheet

观看结束,感谢观看