联立方程模型 -- 潘登同学的计量经济学笔记
IV估计法与2SLS解决了两种内生性的问题--遗漏变量和测量误差问题,而联立方程模型则是解决联立性问题,就是互相决定问题(如:供求模型,价格与数量互相决定),而估计联立方程模型的估计方法还是工具变量法;
联立方程模型(SEM)
考虑如下劳动供给方程,$h$表示农业工人提供的年劳动小时数,$w$表示这类工人的平均小时工资 $$ h_s = \alpha_1 w + \beta_1 z_1 + u_1 \qquad (1) $$ 其中,$z_1$为某个可以影响劳动供给的可观测变量,如本县制造业的平均工资;
- 上式称为结构方程,之所以这样叫是因为劳动供给函数可以从经济理论中推导出来并能够进行因果解释。
- 系数$\alpha$度量了劳动供给如何随工资的变化而变化,如果变;量都是对数形式,则表示劳动供给弹性,一般预期为正;
- 系数$\beta$预期为负,因为制造业的工资对于农业工人来说可以理解为机会成本;
根据不同的(小时,工资)可以画出供给曲线,如果$z,u$会变化,那么曲线会移动,每个$(z,u)$对应一条曲线,
注意: 我们收集到的数据,都是在劳动力市场出清的条件下,观测到了均衡工资水平和工作小时数;
所以我们要引入劳动力的需求函数 $$ h_d = \alpha_2 w + \beta_2 z_2 + u_2 \qquad (2) $$ 其中,$z_2$是可观测的需求移动因子,可以是农地面积,因为农地越多需要的工人越多;
- 上式也称为结构方程,$\alpha$的符号预期为负,$\beta$的符号预期为正;
注意:
- 方程$(1)$劳动力供给方程是农业工人的一个行为方程;
- 方程$(2)$劳动力需求方程是农场主的一个行为方程;
而在每一个城市中,所观测到的小时数$h_i$和所观测到的工资水平$w_i$由下式的均衡条件 $$ h_{is} = h+{id} $$
将$(1),(2)$联立 $$ \begin{cases} h_i = \alpha_1 w_i + \beta_1 z_{i1} + u_{i1} \ h_i = \alpha_2 w_i + \beta_2 z_{i2} + u_{i2} \ \end{cases} $$ 这就是一个SEM(联立方程模型)
- 给定$z_{i1}、z_{i2}、u_{i1}、u_{i2}$那么方程就决定了一个$h_i、w_i$
- $h_i、w_i$是这个SEM的内生变量,而$z_{i1}、z_{i2}$是外生变量
- $z_{i1}、z_{i2}$与误差无关,而误差称为结构误差
- 如果方程中没有$z_{i1}、z_{i2}$,就无法辨别哪个是供给方程哪个是需求方程
一个合适的列子
一个不合适的例子
联立性偏误
当解释变量与因变量被联立决定时,它通常与误差项相关,这就导致OLS估计中存在偏误和不一致性 $$ y_1 = \alpha_1 y_2 + \beta_1 z_1 + u_1 \ y_2 = \alpha_2 y_1 + \beta_2 z_2 + u_2 \ $$
我们重点关注第一个方程,这是待估方程;为了证明$y_2与u_1$相关,将上式带入下式 $$ (1-\alpha_1 \alpha_2)y_2 = \alpha_2 \beta_1 z_1 + \beta_2 z_2 + \alpha_2 u_1 + u_2 \qquad (*) $$ 为了能得出$y_2$,我们必须假设 $$ \alpha_1 \alpha_2 \neq 1 $$ 进而将上式化简 $$ y_2 = \pi_{21} z_1 + \pi_{22}z_2 + v_2 $$ $$ \begin{cases} \pi_{21}=\frac{\alpha_2\beta_1}{1-\alpha_2\alpha_1} \ \pi_{22}=\frac{\beta_2}{1-\alpha_2\alpha_1} \ v_{2}=\frac{\alpha_2u_1 + u_2}{1-\alpha_2\alpha_1} \ \end{cases} $$ 用外生变量和误差项表示$y_2$的方程,成为约简型方程;$\pi_{21}和\pi_{22}$被称为约简型参数;
- 上式中,$v_2$是结构型误差$u_1和u_2$的线性函数,其与$z_1和z_2$都无关,所以可以用OLS一致地估计$\pi_{21}和\pi_{22}$
- 回到$(*)$式,除非$\alpha_2=0$, 否则$y_2与u_1$就相关;而如果$\alpha_2=0$,那么$y_1,y_2$就不是互相决定的,没必要用联立方程模型,直接OLS估计即可;
- 当$y_2与u_1$因联立而相关时,我们就说OLS法存在联立性偏误
结构方程的识别与估计
考虑如下方程 $$ \begin{cases} q = \alpha_1 p + \beta_1 z_1 + u_1 \qquad (3)\ q = \alpha_2 p + u_2 \qquad (4) \ \end{cases} $$ 其中,$q$表示县级水平的人均牛奶消费量,$p$表示该县牛奶的平均价格,$z_1$表示牛饲料的价格,并假定其外生与牛奶的供给与需求;
- 很显然$(3)$是需求方程,因为牛饲料的价格会影响供给而不会直接影响需求;
- 给定$(q,p,z_1)$的一组样本,而我们可以估计的方程是$(4)$,又称$(4)$为可识别方程,因为根据IV估计法,$z_1$影响供给方程而不影响需求方程,所以$z_1$可以作为$(4)$中的一个工具变量;
考虑一般情况 $$ \begin{cases} y_1 = \beta_{10} + \alpha_1 y_2 + Z_1\beta_1 + u_1 \qquad (5) \ y_2 = \beta_{20} + \alpha_2 y_1 + Z_2\beta_2 + u_2 \qquad (6) \ \end{cases} $$
- $y_1,y_2$是内生变量,而$u_1,u_2$是结构误差项,$\beta_{10},\beta_{20}$是截距项,$Z_1,Z_2$分别表示$k_1,k_2$个外生变量的集合,$Z_1 = {z_{11},...,z_{1k_1}}$,而$\beta_1,\beta_2$则是与$Z_1,Z_2$对应的系数;
- $Z_1,Z_2$一般都包含着不同外生变量的事实意味着,我们对模型施加了排除性约束,有一些外生变量只会出现在第一个式子中,有一些只会出现在第二个式子中,这样我们就能区分两个结构方程;
- 当满足假设$\alpha_1\alpha_2\neq 1$时,$y_1,y_2$的约简型存在
识别问题
- 秩条件:识别联立方程模型中第一个方程的充要条件是: 第二个方程中至少包含一个并不出现在第一个方程的外生解释变量且该变量具有非零系数
估计问题
- 用所有外生变量当作识别方程中内生解释变量的工具变量,采用2SLS法进行估计
已婚工作妇女的劳动供给
通货膨胀与开放度
多于两个方程的系统
$$ \begin{cases} y_1 = \alpha_{12}y_2 + \alpha_{13}y_3 + \beta_{11} z_1 + u_1 \qquad (7)\ y_2 = \alpha_{21}y_1 + \beta_{21}z_1 + \beta_{22}z_2 + \beta_{23} z_3 + u_2 \qquad (8) \ y_3 = \alpha_{32}y_2 + \beta_{31}z_1 + \beta_{32}z_2 + \beta_{33} z_3 + \beta_{34} z_4 + u_3 \qquad (9) \ \end{cases} $$
对比$(7)和(9)$,$(9)$是无法识别的,$(7)和(8)$,$(8)$是无法识别的,而对比$(8)和(9)$,$(9)$是无法识别的;
一般规则: 对任何一个额SEM中的方程,如果它排除的外生变量数不少于其右端包含的内生变量数,那么就满足识别的阶条件;
注意: 阶条件只是可识别的必要条件,还要满足系数不为零才是秩条件,但是我们不能确切的知道系数是否为0。所以一般来说,只要不是明显的不可识别,只要满足阶条件就认为可识别了;
- 过度识别方程: $(7)$ 内生变量数少于排除的外生变量数
- 恰好识别方程: $(8)$ 内生变量数等于排除的外生变量数
- 不可识别方程: $(9)$ 内生变量数多于排除的外生变量数
与前面的类似,估计多于两个方程的系统也是用2SLS法;
时间序列的联立方程模型
对SEM最早的应用之一就是,估计一个用于描述国家经济体系的大型联立方程系统。总需求的一个简单凯恩斯模型是 $$ \begin{aligned} C_t &= \beta_0 + \beta_1(Y_t - T_t) + \beta_2 r_t + u_{t1} \qquad (11)\ I_t &= \gamma_0 + \gamma_1r_t + u_{t2} \qquad (12)\ Y_t &= C_t + I_t + G_t \qquad (13) \end{aligned} $$ 其中,$C_t$表示消费,$Y_t$表示收入,$T_t$表示税收收入,$r_t$表示利率,$I_t$表示投资,$G_t$表示政府支出
- $(11)$是总消费函数,其中消费取决于可支配收入,利率和观测不到的结构性误差
- $(12)$是投资函数,取决于利率
- $(13)$则是一个恒等式,没啥意义,但是为了保持完整;
因为是三个方程,那么一定有3个内生变量
- $C_t,I_t,Y_t$是内生变量,而$T_t,r_t,G_t$是外生变量
估计过程
- 由于$r_t$是外生变量,所以直接用OLS估计$(12)$
- 选择$(T_t,G_t,r_t)$作为$Y_t$的工具变量,使用2SLS估计$(11)$
注意:
- 现在很少有上例这样的模型了,因为税收、利率、政府支出都不是外生的,税收取决于收入,政府支出也取决与收入,利率又由消费、投资和收入联合决定;
- 而且上例的模型是完全静态的,通常要有预期的时滞调整 $$ I_t = \gamma_0 + \gamma_1r_t + \gamma_1Y_{t-1} + u_{t2} \qquad (12)\ $$ 我们在投资方程中增加了一个滞后内生变量,我们通常将一个SEM中的滞后内生变量专门称为前定变量,如果我们假定$u_{t2}$与当前的外生变量、过去所有时刻的内生和外生变量都无关,你们前定变量就是外生变量;
但是将SEM中加入时间序列还会面临时间序列数据的经典问题:
- 对于总消费、收入、投资、利率等数据不一定满足弱相关假定;
- 有些序列还有指数趋势;
但是仍然可以解决,就是使用一阶差分或增长率的方式来回避这些问题