时间序列回归的渐进性 --潘登同学的计量经济学笔记
平稳与弱相关
平稳过程
简单来说,对于某个时间序列(随机过程),如果我们从这个序列中任取一个随机变量集,并把这个序列向前移动$h$个时期,那么其联合概率分布仍保持不变。 其规范定义如下
平稳随机过程
对于随机过程${x_t:t=1,2,\ldots}$,如果对于每一个时间指标集$1\leq t_1
不平稳的随机过程称为非平稳过程,因为平稳性是基础的随机过程的一个方面而不是可以单独实现的,所以我们很难判断所搜集到的数据是否由一个平稳过程生成。 但是,要指出某些序列不是平稳却比较容易。
协方差平稳
对于一个具有有限二阶矩$[E(x^2_t)<\infty]$的随机过程,${x_t:t=1,2,\cdots}$,若
- $E(x_t)$为常数
- $Var(x_t)$为常数
- 对任何$t$,$h\geq 1$,$Cov(x_t,x_{t+1})$仅取决于$h$,而不取决于$t$ 则称他为协方差平稳
平稳性有什么用?
在技术层面上,平稳性简化了大树定律和中心极限定理的表述。在操作层面上,如果我们想通过回归分析掌握两个或多个变量之间的关系,就需要假定某种跨时期的平稳性。如果允许两个变量之间的关系在不同时期随意变化,那么,在只能得到时间序列的单个实现的情况下,我们就无法知道一个变量的变化如何影响另一个变量。
弱相关时间序列
弱相关则是关心随着$h$的增大,$x_k$与$x_{k+h}$多大程度的相关。
弱相关
粗略地讲,对于一个平稳时间序列过程${x_t:t=1,2,3,\ldots}$,若随着 $h$的无限增大,$x_k$与$x_{k+h}$“近乎独立”,则称之为若相关
渐进无关
对于协方差平稳序列来说,随着$h\to\infty,Corr(x_t,x_{t+h})\to 0$,被称为渐进无关的
考虑如下随机过程 $$ x_t = e_t + \alpha_1e_{t-1} $$ 其中${e_t:t=0,1,\ldots}$是均值为0和方差为$\sigma^2_e$的独立同分布序列。该过程也被称为一阶移动平均过程MA(1)
观察一期内的变化 $$ Cov(x_t,x_{t+1}) = \alpha_1 Var(e_t) = \alpha_1 \sigma^2_e \ \because Var(x_t) = (1 + \alpha_1^2)\sigma^2_e \ \therefore Corr(x_t,x_{t+1}) = \frac{\alpha_1}{1 + \alpha_1^2} $$ 而一旦到达两期及以上时,这些变量都是无关的。因此MA(1)是平稳的弱相关序列
考虑如下一阶自回归过程 $$ y_t = \rho_1y_{t-1} + e_t $$ 其中${e_t:t=0,1,\ldots}$是均值为0和方差为$\sigma^2_e$的独立同分布序列,同时还假定$e_t$独立于$y_0$和$E(y_0)=0$。该过程也被称为一阶自回归过程AR(1)
AR(1)过程弱相关的IG关键假定是稳定性条件$|\rho_1|<1$。一旦满足条件,我们称${y_t}$是一个稳定的AR(1)过程
观察稳定的AR(1)过程一期内的变化($\because E(y_t)=0,E(y_t)=E(y_{t-1}); \rho_1\neq 1$) $$ Var(y_t) = \rho_1^2 Var(y_{t-1}) + Var(e_t) \ \therefore \sigma_y^2 = \frac{\sigma^2_e}{1-\rho_1^2} $$ 利用反复迭代,可以得到$y_t与y_{t+h}$的协方差 $$ y_{t+h} = \rho_1^h y_t + \rho_1^{h-1} e_{t+1} + \cdots + \rho_1 e_{t+h-1} + e_{t+h} \ \quad\ \begin{aligned} Cov(y_t,y_{t+h}) &= E(y_t,y_{t+h}) = \rho_1^h E(y_t^2) + \rho_1^{h-1} E(y_t e_{t+1}) + \cdots + \rho_1 E(y_t e_{t+h-1}) + E(y_t e_{t+h}) \ &= \rho_1^h E(y_t^2) = \rho_1^h \sigma_y^2 \end{aligned}\ \quad\ Corr(y_t.y_{t+h}) = \frac{Cov(y_t,y_{t+h})}{\sigma_y^2} = \rho_1^h $$ 随着$h\to\infty, \rho_1^h\to\infty$,所以稳定的AR(1)过程是弱相关的
平稳与弱相关的误区
前面的两个例子中,两个都是协方差平稳的,随后推导出了弱相关; 但并非意味着协方差平稳是弱相关的必要条件; 对于之前的趋势序列,如$y_t = \alpha_1 t + e_t$,他显然是非平稳的(均值方差不固定),但也可能是弱相关的。
如果一个序列是弱相关的,而且围绕着其时间趋势是平稳的,我们就称之为趋势——平稳过程
OLS的渐进性
与之前推导横截面的渐进性作用相似,我们要借助OLS的大样本性质,来更一般地证明OLS的合理性。
假定TS.1'
线性与弱相关
除了增加假定${(X_t,y_t): t=1,2,\ldots}$是平稳和弱相关的之外,假定TS.1'与Ts.1完全相同。具体而言,大数定律和中心极限定理可适用于样本均值
假定TS.2'
无完全共线性
与假定TS.2'相同
假定TS.3'
零条件均值
解释变量$X_t = {x_{t1},x_{t2},\ldots,x_{tk}}$是同期外生的: $E(u_t|X_t)=0$
这个假定比TS.3弱得多,因为这个假定不像TS.3对$u_t$与其他时期解释变量之间的关系做任何限制。但是根据平稳性,若同期外生性对某一时期成立,则对所有时期都成立。这个假定没有控制严格外生,借助于OLS大样本性质,能一定程度上解决被解释变量对未来解释变量的反馈作用
OLS的一致性
在假定TS.1'-3'成立时,OLS估计量是一致的(不一定无偏): $$ plim \hat{\beta_j} = \beta_j, j=0,1,2,\ldots,k $$
举个例子
考虑AR(1)模型 $$ y_t = \beta_0 + \beta_1 y_{t-1} + u_t $$ 其中,在给定y的所有过去值时,误差$u_t$的期望值为0 $$ E(u_t|y_{t-1},y_{t-2},\cdots) = 0 $$ 将上面两个方程结合起来,意味着 $$ E(y_t|y_{t-1},y_{t-2},\ldots) = E(y_t|y_{t-1}) = \beta_0 + \beta_1 y_{t-1} $$ 该结论非常重要,它意味着,一旦控制了y的一期滞后,y的更高阶滞后都不会影响y的期望值。 既然$X_t只包含y_{t-1}$,方程便意味着假定TS.3’成立,而无偏性所需的严格外生假定却不成立,因为所有时期的解释变量集包含除了最后一期之外的所有y值$(y_0,y_1,\ldots,y_{n-1})$,而TS.3要求所有的时期t,$u_t$都与$y_0,y_1,\cdots,y_{n-1}$之中任意的一个无关,而AR(1)模型满足不了这个要求。
因为在AR(1)模型中,$y_t与u_t$一定相关,$Cov(y_t,u_t) = Var(u_t) > 0$。 为了使弱相关条件成立,我们必须假定$|\beta_1|<1$,如果这个条件成立,根据OLS的一致性,那么模型得到的OLS估计量便是$\beta_0和\beta_1$的一致估计量。不幸的是,$\hat{\beta_1}$是右偏的。而且,若样本容量比较小,或者$\beta_1$接近1,则偏误可能会很大。 对大样本来说,$\hat{\beta_1}$应该是$\beta_1$的一个较好估计值
假定TS.4'
同方差
误差是同期同方差的,即对所有的t,都有$Var(u_t|X_t)=\sigma^2$
假定TS.5'
无序列相关
对所有的$t\neq s$,有$E(u_tu_s|X_t,X_s) = 0$
序列相关通常是静态和有限分布滞后回归中遇到的问题: 无法保证不同时期的无法观测因素$u_t$是无关的。而对于AR(1)模型,TS.5'确实成立,给出证明(假设$s
OLS的渐近正态性
在假定TS.1'到TS.5'下,OLS估计量是渐近正态分布的。而且,通常的OLS标准误,t统计量、F统计量和LM统计量都是渐近有效的
强相关时间序列
上面的都是在弱相关时间序列下,常见的OLS推断程序比经典线性模型假定都成立,那么强相关呢?
高度持续性时间序列
在简单的AR(1)模型中,设$\rho_1 = 1$ $$ y_t = y_{t-1} + e_t \qquad (*) $$ 其中${e_t:t=0,1,\ldots}$是均值为0和方差为$\sigma^2_e$的独立同分布序列,同时还假定$e_t$独立于$y_0$和$E(y_0)=0$
该过程被称为一个随机游走,很好理解,$t$时期的$y_t$等于上一期的$y_{t-1}$加上一个独立于$y_{t-1}$的零均值随机变量。 求出$y_t$的均值 $$ E(y_t) = E(e_t) + E(e_{t-1}) + \cdots + E(e_1) + E(y_0) = E(y_0), \forall t \geq 1 $$ 因此,随机游走的期望不取决于t; 然而,随机游走的方差却随着时间的推移而变化,假设$Var(y_0)=0$ $$ Var(y_t) = Var(e_t) + Var(e_{t-1}) + \cdots + Var(e_1) = \sigma^2_e t $$ 随机游走的方差是时间的线性函数,其显然是不平稳的...
更重要的是,随机游走表现出了高度持续性的行为,这是因为现在的y值对于决定遥远未来的y值都有非常重要的作用 $$ y_{t+h} = e_{t+h} + e_{t+h-1} + \cdots + e_{t+1} + y_t \ E(y_{t+h}|y_t) = y_t, \forall h \geq 1 $$ 这意味着,无论我们展望多远,$y_{t+h}$的最好预测值总是今天的$y_t$值。(回想到: 半强有效市场假说, 最好的预期就是当下的价格)
当${y_t}$服从随机游走模式,对于$t$很大的情形,$y_t与y_{t+h}$的相关性接近于1。如果$Var(y_0)=0$,可以证明 $$ Corr(y_t,y_{t+h}) = \sqrt{\frac{t}{t+h}} $$ 他们的相关程度取决于$t$,也说明这不是平稳过程;
- 固定t,当h趋于无穷时,相关性趋于0
- t越大,这种相关性随着h变大而趋于0的速度会越慢
单位根过程
随机游走是单位根过程的一个特例,因为$\rho_1=1$所以称为单位根...
更一般的单位根过程可以由$(*)$生成,其中的${e_t}$可以是一个普通的弱相关序列。而当${e_t}$不是一个独立同分布序列的时候,前面推导的随机游走性质就不成立;
从政策角度来看,知道一个经济时间序列是否具有高度持续性往往很重要。 以GDP为例,如果GDP是渐近无关的,那么下一年的GDP水平最多与很多年前(如30年前的GDP)有弱相关关系。这意味着一项很久以前作用于GDP的政策,在现在几乎没有什么持续影响。 相反,如果GDP是强相关的,那么明年的GDP可以与很多年前的GDP都高度相关。于是,我们应该认识到,一项造成GDP离散变化的政策也可能具有持久的影响
带截距的随机游走
重要一点,不要混淆趋势行为与高度持续性行为。 有趋势行为不一定是高度持续性的。 而高度持续性的序列往往包含了明显的趋势,描述这一情形的模型是带截距的随机游走 $$ y_t = \alpha_0 + y_{t-1} + e_t $$ 以下是其一个实现
高度持续时间序列的变换
可以用单位根过程表示一类高度持续性的时间序列,我们可以做一些变化,使其变为弱相关
- 弱相关过程为称为零阶单整(integrated of order zero)或$I(0)$
- 随机游走被称为一阶单整(integrated of order one)或$I(1)$
$I(0)$表明无需处理,这个序列的均值就已经满足标准的极限定理; 而$I(1)$意味着这个过程的一阶差分便是弱相关的(通常是平稳的)。$I(1)$也被称为差分平稳过程
$$ \triangle y_t = y_t - y_{t-1} = e_t $$ 一阶差分后的序列${\triangle y_t: t=2,3,\ldots}$实际上一个独立同分布序列,因为${e_t}$是一个弱相关过程,则${\triangle y_t}$也是弱相关的。 在方程中一般不写$\triangle$,而是用cy或dy来表示,如y表示价格,那么就是cprice或dprice
判断时间序列是否为I(1)
简单的方法就是去计算别解释变量的一阶自相关系数 $$ \rho_1 = Corr(y_t,y_{t-1}) $$ 当$\rho_1>0.9$,就需要进行差分
更一般的检验方法,以后再说...
动态完备模型和无序列相关
前面说到,AR(1)其实是满足序列无关的: 而假定不存在序列相关,实际上等同于假定$E(y_t|y_{t-1},y_{t-2},\ldots)$中只包含y的一期滞后(注意:这不是普遍性结论,这只是针对$y_t = \beta_0 + \beta_1 y_{t-1} + u_t$,因为模型中解释变量只有一个)
进而我们可以证明: 模型只要设定合理,就是序列无关的
动态完备模型
动态完备模型可以理解成设定合理的模型
- 考虑一个简单情形 $$ y_t = \beta_0 + \beta_1 z_t +u_t $$ 如果存在 $$ E(y_t|z_t,y_{t-1},z_{t-1},\cdots) = E(y_t|z_t) = \beta_0 + \beta_1 z_t $$ 上式的第一个等式很重要: 一旦控制了$z_t$, $y或z$的滞后项无助于解释当前的y,当满足这个条件,这么模型就是动态完备模型。上式其实包含了一个重要假定 $$ E(u_t|z_t,y_{t-1},z_{t-1},\cdots) = 0 $$
- 考虑一般情形 $$ y = \beta_0 + \beta_1 x_{t1} + \cdots + \beta_k x_{tk} + u_t $$ 其中,解释变量$X_t = (x_{t1},\cdots,x_{tk})$可能包含也可能不包含$y或z$的滞后项。 当满足 $$ E(y_t|X_t,y_{t-1},X_{t-1},\cdots) = E(y_t|X_t) \ \Leftrightarrow E(u_t|X_t,u_{t-1},X_{t-1},\cdots) = 0 $$ 这个模型就是一个动态完备模型
动态完备模型是无序列相关
动态完备模型一定满足TS.5'(无序列相关),具体起见,假设$s
动态完备模型是无序列相关
动态完备模型一定满足TS.5'(无序列相关),具体起见,假设$s