本文是卡特·希尔《计量经济学原理》的学习笔记,旨在整理、归纳和补充重要定理和公式的数学推导,感谢@磁场转动提供的诚挚建议。
一、检验参数的显著性
1. 检验单个 OLS 参数的显著性
单个参数小样本情况下使用 t 检验,大样本情况下使用正态检验:
\dfrac{b_{i}-\beta_{K}}{se(b_{K})} \sim t(N-K) 或者 \dfrac{b_{i}-\beta_{K}}{se(b_{K})} \sim N(0,1)
2. 检验多个 OLS 参数的显著性
多个参数情况下使用 F 检验:
\dfrac{(SSE_{R}-SSE_{U})/(J)}{SSE_{U}/(N-K)} \sim F(J, N-K)
其中, J 是约束的数量(等号的数量)。
如果要检验整个模型,检验假设 H_{0}: \beta_{2}=0, \beta-{3}=0, \beta_{K} = 0 ,约束数量 J = K-1 .
3. 检验虚拟变量:Chow Test
Chow Test 用于检验某一指示变量对因变量是否由影响。例如已有回归模型
y = \beta_{1} +\beta_{2}x_{2}+\delta_{1}D_{1}+\delta_{2}D_{2}+e
希望检验指示变量 D_{3} 对因变量 y 是否由影响,考虑如下的回归方程
$$ \begin{aligned} y = &\text{ }\beta_{1}x_{1} +\beta_{2}x_{2}+\delta_{1}D_{1}+\delta_{2}D_{2}\\ +&\theta_{1} D_{3}+\theta_{2}(x_{2}\times D_{3})+\theta_{3}(D_{1}\times D_{3})+\theta_{4}(D_{2}\times D_{3})+e \end{aligned} $$
用 F 统计量检验联合假设: H_{0}: \theta_{1}=\theta_{2}=\theta_{3}=\theta_{4}=0, \quad H_{1}: \lnot H_{0}
二、检验假设一:模型
1. 检验是否存在遗漏变量:RESET
使用 RESET (REgression Specification Error Test) 检验是否存在遗漏变量或者模型函数形式是否正确,例如:
原模型: y = \beta_{1} + \beta_{2}x_{2} + e , 得到 \hat{y} = b_{1}+ b_{2}x 。考虑模型:
y = \beta_{1} + \beta_{2}y + \beta_{3}\hat{y}^{2} + \beta_{4}\hat{y}^{3}+e
检验假设:
H_{0}: \beta_{3} = \beta_{4}=0, H_{1}: \beta_{3} \neq 0 \text{ or } \beta_{4} \neq 0
若原假设被拒绝,则模型应当改进为二次或三次函数的形式,并说明可能遗漏了与 $x^{2}$ 或 $x_{3}$ 相关的变量。
2. 检验随机效应: Hausman Test
如果只有一个估计量 b_{2} ,可以使用 t 检验,检验两个模型得到的估计量是否相等:
H_{0}: b_{FE, 2} = b_{RE, 2}, H_{1}: b_{FE,2}\neq b_{RE, 2}
统计量: t = \dfrac{b_{FE, 2}-b_{RE, 2}}{\sqrt{{var}(b_{FE, 2})-{var}(b_{RE, 2})}}
若拒绝原假设,说明两个模型得出的估计值有显著差异,不可以使用随机效应模型。另外,当存在多个估计值时,改用 \chi^{2} 检验。
三、检验假设二:内生性
使用工具变量解决内生性问题时,一般要进行一下三个检验:
1. 检验工具变量的强度
使用 2SLS 的第一阶段回归结果检验 z 是否是弱工具变量:
x_{K} = \gamma_{1}x_{1}+\gamma_{2}x_{2}+\dots +\gamma_{K-1}x_{K-1} + \theta_{1} z_{1} +\theta_{2}z_{2}+\dots +\theta_{S}z_{S}+v
检验假设: H_{0}: \theta_{1}=\theta_{2}=\dots=\theta_{S} = 0 ,若F统计量的值大于10(经验值),则拒绝原假设,认为 z 是强工具变量。
2. 检验是否存在内生性: Hausman Test
使用 Hausman Test 检验是否存在内生性问题,这需要借助 2SLS 第一步得到的残差:
1)首先,令有内生型问题的解释变量 x 对工具变量 z_{1}, z_{2} 回归:
x=\gamma + \theta_{1}z_{1}+\theta_{2}z_{2}+v
得到残差 \hat{v}=x-\hat{\gamma}-\hat{\theta}_{1}z_{1}-\hat{\theta}_{2}z_{2} ;
2)然后,令因变量 y 对解释变量 x 和残差 \hat{v} 回归:
y=\beta_{1}+\beta_{2}x+\delta \hat{v}+e
检验假设: H_{0}: \delta = 0, H_{1}: \delta \neq 0
若拒绝原假设,则说明存在内生性问题;如无法拒绝原假设,则说明不存在内生性问题,不应当使用工具变量。
3. 检测工具变量是否多余
如果工具变量的数目多于内生变量的数目,即 L>B ,可以检验是否存在多余的工具变量,具体步骤如下:
1)利用 2SLS 计算出回归系数 \hat{\beta}_{1}, \dots, \hat{\beta}_{G},\hat{\beta}_{G+1},\dots,\hat{\beta}_{G+B} ,再计算出残差
e_{IV}=y-\hat{\beta}_{1}x_{1}+\dots-\hat{\beta}_{G}x_{G}-\hat{\beta}_{G+1}x_{G+1}-\dots-\hat{\beta}_{G+B}x_{G+B} ;
2)令残差对 L 个工具变量回归:
e_{IV}=\theta_{1}z_{1}+\theta_{2}z_{2}+\dots+\theta_{L}z_{L}+v
得到拟合优度 R^{2} ;
3)检验假设 H_{0}: \theta_{1}=\theta_{2}=\dots=\theta_{L}=0 ,检验的统计量为 NR^{2}\sim \chi^{2}_{L-B} ,若拒绝原假设,说明至少有一个工具变量是无效的;否则,所有工具变量都是有效的。
四、检验假设三:异方差
1. 残差图
2. GQ Test
如果有两个样本容量分别为 N_{1}, N_{2} 的子样本, 需要判断其对模型 y = \beta_{1} + \beta_{2}x_{1}+\dots+\beta_{K}x_{K}+e 的残差是否相等,检验假设:
H_{0}: \sigma_{1}^{2}=\sigma_{2}^{2}, \quad H_{1}: \sigma_{1}^{2}\neq \sigma_{2}^{2}
构造统计量 GQ = \dfrac{\hat{\sigma_{1}}^{2}}{\hat{\sigma_{2}}^{2}}\sim F(N_{1}-K, N_{2}-K) ,其中 \hat{\sigma_{1}}^{2}, \hat{\sigma_{2}}^{2} 是两个样本回归后的均方误。
3. BP Test
这个检验实际上是基于 BP test 的改进版本
对于回归模型 y = \beta_{1} + \beta_{2}x_{1}+\dots+\beta_{K}x_{K}+e ,如果我们认为随机误差可能与解释变量 z_{1}, z_{2}, \dots,z_{S} 有关,可以进行如下检验:
1)通过 y = \beta_{1} + \beta_{2}x_{1}+\dots+\beta_{K}x_{K}+e 得到残差 \hat{e} ;
2)令残差的平方对解释变量 z_{1}, z_{2}, \dots,z_{S} 回归: \hat{e}^{2}=\alpha_{1}z_{1}+\alpha_{2}z_{2}+ \dots+\alpha_{S}z_{S}+v
得到回归的拟合优度 R^{2} ;
3)检验假设
H_{0} : \alpha_{1}=\alpha_{2}=\dots =\alpha_{S}=0,\quad H_{1}: \lnot H_{0}
检验的统计量为 NR^{2}\sim \chi^{2}_{(S-1)} ,若拒绝原假设则存在异方差问题。
4. White 检验
如果不清楚随机误差与哪些解释变量有关,可令 z_{1}, z_{2}, \dots,z_{S} 为回归方程中的变量、变量的平方项和变量的交叉项。例如,对于回归模型 y=\beta_{1}+\beta_{2}x_{2}+\beta_{3}x_{3}+e ,取 z_{1} =1, \quad z_{2}=x_{2}, \quad z_{3} = x_{3}, \quad z_{4}=x_{2}^{2}, \quad z_{5}=x_{3}^{2},\quad z_{6}=x_{2}x_{3} .
五、检验假设五:共线性
使用方差膨胀因子(variance inflaction factor)判断是否存在共线性问题:
VIF = \dfrac{1}{1-R^{2}_{i}}, i = 1,2,\dots,K
其中 R_{2}^{2} 是回归 x_{i} = x_{1}+\dots+x_{i-1}+x_{i+1}+\dots+x_{K}+v 的拟合优度。存在共线性的经验判断准则是 VIF > 10.
六、检验预测能力
1. 调整R方
调整 R^{2} 适用于样本内预测:
{\bar{R}}^{2}=1-\dfrac{SSE/(N-K)}{SST/(N-1)}
调整 $R^{2}$ 将样本容量和解释变量的数量纳入考虑。
2. 信息准则
信息准则适用于样本内预测:
AIC = ln(\dfrac{SSE}{N})+\dfrac{2K}{N}
BIC(SC) = ln(\dfrac{SSE}{N})+\dfrac{Kln(N)}{N}
3. RMSE
RMSE适用于样本外预测:
一共有 N= N_{1} + N_{2} 个样本,使用 N_{1} 个样本预测参数,再使用 N_{2}
个样本评估预测能力,计算 RMSE (root mean square errors):
RSME = \sqrt{\dfrac{1}{N_{2}}{\sum_{i=N_{1}+1}^{N}}(y_{i}-\hat{y_{i}})^{2}}
原文地址:https://zhuanlan.zhihu.com/p/635344969 |