立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索

图文播报

查看: 352|回复: 5

[分享] 同一个模型两组不同样本下,回归系数间的差异性检验??( 非虚拟变量,stata方法)

[复制链接]
发表于 2025-3-11 17:55 | 显示全部楼层 |阅读模式

登陆有奖并可浏览互动!

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录 手机动态码快速登录

×
假如,都是因变量y对x1和x2回归,只不过回归时两组样本分别用国有企业、民营企业数据。
这样就会估计出两个方程,y=a0+a1*x1+a2*x2(国有)以及y=b0+b1*x1+b2*x2(民营)。
问题来了,我怎么比较a1与b1间(以及a2与b2)的差异性呢??

ps 各位富美富帅不要再建议用虚拟变量了,我想用的是一个可以直接比较的方法,看到很多论文中都是这么做的。最好是可以用stata实现。谢谢啊!
原文地址:https://www.zhihu.com/question/23642050
楼主热帖
回复

使用道具 举报

发表于 2025-3-11 17:56 | 显示全部楼层
在实证分析中,我们经常会去刻意地推进一种因果关系的发展,使得所得的因果关系结论更具具体化和精确化。当然,这并不是有意为之,而是提供一个关于A与B因果关系更为丰富的研究内容。

为了实现上述这个目标,诸多实证研究常常对主效应关系进行分样本检验,以发现更为重要的异质性结论,这种分样本操作是将近99%经管实证论文都出现过的拓展方式。但是,在分样本检验过程中,我们常常遇到不同的分样本检验的情景,主要包括以下三种类型:

一是,分样本情况下各组样本的自变量系数都显著。从大多数文章分样本的初衷来看,作者是希望其中一组自变量系数显著、另一组系数不显著的,而且最好的结果是这种明显的分样本带来自变量系数差异能符合一定的理论基础的支撑。在这种情况下,作者能够通过分样本可以实现结论的详细化,有助于发现更有价值的结论。但实际上的实践来看,很多分样本下多组分样本下自变量系数都是显著的,针对这种情景,我们一般会有两种处理方式:其一是通过样本组间系数比较,也可以分析不同样本下自变量系数的差异,即邹检验(chow test);其二是如果通过chow test后发现两者间系数没有显著差异,这就可以表明自变量对因变量的影响不受分样本(分组依据)因素的影响。

二是,分样本情况下各组样本的自变量系数都不显著。如果作者在对显著的主效应因果关系进行分样本时发现,分组下的多组样本自变量系数都未能通过显著性检验,这就意味着在分样本下由于样本量下降,单一样本下自变量系数不显著。遇到这个情况,一般情况下笔者是不赞成作者将其纳入文章内容之中,因为这种分样本检验未能获得足够靓丽的研究结论,而是无形中为作者添加了更多的麻烦,譬如你要阐述一下为什么分组下系数都不显著了,这个原因其实是非常难以解释的,有可能是统计原因,有可能是理论支撑的结果。

三是,分样本情况下各组样本的自变量系数存在显著差异,一组系数显著,另一组系数却不显著。这种情况是目前学界文献中最为常见的一种,在分析主效应的分样本组间系数差异时,一组自变量系数通过显著性检验,而另一组却没有,这是一种非常明显差异的结论。在这种情况下,这是实证分析中亮点之一,需要作者对这种差异做出反应,利用已有的研究理论对这种差异的经济现象产生的原因进行解释说明,而且要基于分样本依据因素作为理论出发点,而不是泛泛而谈。譬如:我们经常用到的企业产权性质、地区东中西差异。当主效应系数在不同产权性质企业中存在较大差异时,这个时候我们一定要着力于产权性质这个视角进行阐述,从所有制差异制度性因素出发,来阐述分样本下系数差异的缘故。

记住,遇到第三种情景,一定要善于利用这个论文质量拔高的机会,这是学术论文异质性分析的最为常见的思路之一。
回复 支持 反对

使用道具 举报

发表于 2025-3-11 17:56 | 显示全部楼层
我在专栏中对此问题进行了详细的介绍:[连玉君专栏]如何检验分组回归后的组间系数差异?
通过实例介绍了三种方法以及它们在 stata 中的实现方法:

  • 方法1:引入交叉项(Chow 检验)
  • 方法2:基于似无相关模型的检验方法 (suest)
  • 方法3:费舍尔组合检验(Permutation test)
我的主页:
   我混迹于 连享会,折腾那些 有趣又伤神 的问题。
回复 支持 反对

使用道具 举报

发表于 2025-3-11 17:57 | 显示全部楼层
邹至庄检验,参考
https://zh.m.wikipedia.org/zh-cn/%E9%82%B9%E6%A3%80%E9%AA%8C
反对
@慧航 的答案,确实是可以做到分开回归,不用加虚拟变量的。
参考
http://www.brynmawr.edu/socialwork/GSSW/Vartanian/Handouts/chowtest.pdf
回复 支持 反对

使用道具 举报

发表于 2025-3-11 17:58 | 显示全部楼层
让我来给你一个回答。亲测可行。如果感觉好请给我点赞。
背景:女票一篇文章要改,初稿时直接比较两个方程的系数,被审稿人明确说了不行,而且必须分组回归,所以向我求助。虽然我一直认为这种事情很简单,但并没有真实做过,也竟一时凝噎。于是我向我大师兄请教,大师兄建议用虚拟变量放在同一个方程比较。不过该方法不适合我女票。
但我确定分开回归是可以比较的。因为我在Econometrica上看到一篇文章,他们是直接比较的。请看下图,尤其是黄色部分,该文发表在Econometrica, Vol. 83, No. 4 (July, 2015), 1315–1371。



于是我继续google其他解决方法。非常幸运的找到了直接进行比较的stata命令,采用的命令为suest,具体请看下图








我们可以看到,改命令采用的统计量为卡方统计量,但具体怎么构造的我真不知道,可以像第一张图那样直接得到p值。
当然,记得给你上述方法的原网站,
Stata Code Fragment: Comparing Regression Coefficients Across Groups using Suest
最后,学术不容易,祝你好运。
回复 支持 反对

使用道具 举报

发表于 2025-3-11 17:59 | 显示全部楼层
如果你想比较两组的系数是否一致,加虚拟变量。没有别的办法了。分开做的大有人在,但是没办法做这两个的系数检验。要想检验,就得放在一起加虚拟变量。
===================
科普,反对
@徐惟能的答案。
他对Hausman test的理解有偏误。
Hausman test的应用场景:存在同一组系数的两个估计b1 b2,满足:
在H0的条件下,b1 b2均一致,但是b1是最有效的
在H1的条件下,b1 是不一致的,但是b2是一致的
Hausman证明了,在H0的条件下,var(b2-b1)=var(b2)-var(b1)
故而可以构造统计量,(b2-b1)(var(b2)-var(b1))^(-1)(b2-b1)~chi2
比如,检验线性回归是不是有内生性:
H0:不具有内生性
H1:具有内生性
那么b1 就是ols回归结果,b2就是iv的回归结果。
同样,检验固定效应还是随机效应,b1是随机效应结果,b2是固定效应结果。
但在这里例子中,显然不满足Hausman test的前提
所以。。。绝对不能用Hausman test
============================
@徐惟能给出的wiki的网址,摘抄一下:
Consider the linear model y = bX + e, where y is the dependent variable and X is vector of regressors, b is a vector of coefficients and e is the error term. We have two estimators for b: b0 and b1. Under the null hypothesis, both of these estimators are consistent, but b1 is efficient (has the smallest asymptotic variance), at least in the class of estimators containing b0. Under the alternative hypothesis, b0 is consistent, whereas b1 isn’t.
翻译一下就是我说的意思。
回复 支持 反对

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册 微信登录 手机动态码快速登录

本版积分规则

关闭

官方推荐 上一条 /3 下一条

快速回复 返回列表 客服中心 搜索 官方QQ群 洽谈合作
快速回复返回顶部 返回列表