“傻瓜”学计量——稳健性检验的10种方法(持续更新)
提纲:“10种” 稳健性检验的方法
我们为何要做稳健性检验?要确保结论的稳健性
1.变量替换(自变量 因变量,比例、自然对数、程度变量)
在文献中一般表现为:参考其他大佬的测量方法、和指标选择。
在实证中,变量替换的对象主要是所考察主题的因变量(被解释变量)、自变量(解释变量)。根据不同论文的度量 方法,可以引用不同的变量替换方式,来考察问题或者亚久假设的稳健性。
2.检验方法替换(连续变量 离散变量)
大部分情况下,会根据因变量的特征来选择方法。 例如,当主题所考察的因变量为连续变量,其存在不少0样本时,文章选择最小二乘法(OLS)、tobit模型都比较合适,显然这两种方法在一定程度上来讲 都是可以替换的。
少部分情况下,选择方法时,也要考虑样本的特性。例如,当样本时截面数据或面板数据时,选用的方法也会不同。
3.内生性问题(工具变量法、DID等)
内生性是社科领域中研究因果关系时必须要关注和考察的。
内生性问题产生的原因 | 遗漏变量 |
反向因果 | |
自我选择偏误 | |
样本选择偏误 | |
内生性问题的解决方法 | 工具变量法 |
Heckmann二阶段模型考察 | |
自然实验法 | |
DID双重差分法 | |
内生性具体内容及stata指令 参考我的另一篇笔记: |
4.特殊样本剔除(特殊年份 特殊地区 特殊个体)
在文献中的出现形式:放大或缩小样本时间窗口、剔除例如武汉新冠时期GDP、剔除我国大量增发货币的年份的数据。
5.增加其他控制变量(个体、企业、地区等)
增加那些,在模型回归分析中我们经常忽视或者遗漏的一些重要因素,而这些因素将是影响我们考察因果关系中的重要变量。根据以往文献选取控制变量。
在文献中的出现形式:增加控制变量、修改模型设定(在基准模型中加入固定效应、行业✖年份交互固定效应)。
6.变换样本
即:作者用某个数据库的样本得出结论后,再通过其他样本(或数据库)进行检验分析,从而进一步夯实了这个结论。
(比较麻烦)
7.排除其他理论依据假说
用实证研究推翻别人的逻辑。
8.多重共线性问题(膨胀因子分析法)
逐步回归法:第一种:将显著的变量逐步进行剔除。
第二种:若存在交乘项时,应先对变量进行中心化处理,再得出交乘项。
9.排除(非)线性关系(构建平方项纳入方程等)
基本思路:在基准模型中引入自变量的二次方项就可以了。
为避免多重共线性问题,需将二次方向先进行中心化处理再引入基准方程。
10.剔除异常值的影响
对连续变量进行缩尾处理
更多推荐
所有评论(0)