两阶段回归TSLS怎么做:SPSSAU软件操作步骤与结果指标解读
一、两阶段回归TSLS所属模块
两阶段回归TSLS在SPSSAU中属于计量经济研究模块。
二、方法概述
两阶段回归TSLS主要用于处理回归分析中的内生性问题,适合自变量与误差项可能相关、普通回归结果容易偏误的研究场景。实际应用中,它常见于经济、管理、政策评估等研究,用来借助工具变量得到更稳妥的估计结果。
三、变量设置规则
两阶段回归TSLS需要设置4类变量,分别是被解释变量、内生变量、工具变量和外生变量。其中前3类为必填,外生变量为可选项。
1. 被解释变量设置
(1)被解释变量只能放入1个,是必须填写的核心结果变量。
(2)该变量用于表示研究中需要被解释、被预测或被检验影响结果的对象。
2. 内生变量设置
(1)内生变量至少放入1个,最多可放入多个,是必须填写的变量。
(2)这类变量通常是研究中重点关注的解释变量,但它可能与误差因素相关,因此不能直接用普通回归处理。
3. 工具变量设置
(1)工具变量至少放入1个,最多可放入多个,是必须填写的变量。
(2)工具变量的作用是帮助识别内生变量中的有效变化,从而提升估计结果的可信度。
(3)如果工具变量个数多于内生变量个数,分析结果中还会进一步给出过度识别检验。
4. 外生变量设置
(1)外生变量为可选项,可以不放,也可以放入多个。
(2)这类变量通常作为控制变量使用,用于在模型中控制其他可能影响被解释变量的因素。
四、参数设置及解释说明
保存残差和预测值
勾选后,系统会将残差和预测值单独保存,便于后续继续做诊断分析、异常值排查或模型比较。如果只是查看当前TSLS结果,可以不勾选;如果后续还要继续做深入分析,建议保留该项。
五、分析结果表格及其解读
两阶段回归TSLS完成分析后,通常会输出研究变量类型、2sls模型分析结果、简化结果表、模型汇总、外生性检验、过度识别检验、第1阶段回归汇总、第1阶段回归结果汇总以及样本缺失情况汇总等表格。

该表格的作用是帮助研究者再次核对模型中各类变量的角色划分,通常包括被解释变量、内生变量、工具变量和外生变量。它本身不用于统计显著性判断,但能帮助确认变量放置是否正确。

该表格是两阶段回归TSLS最核心的结果表,主要用于查看各变量对被解释变量的影响方向、影响大小及模型整体表现,通常包括回归系数、标准误、t值、p值、置信区间、R²、调整R²和Wald检验等指标。
●回归系数B:用于判断变量对结果变量的影响方向和影响强弱。系数为正,通常表示正向影响;系数为负,通常表示负向影响。只有在显著性通过时,这个方向和大小才更有解释价值。
●标准误:反映估计结果的波动程度,数值越小,通常说明估计越稳定。它本身不单独决定结论,但会影响显著性判断。
●t值:用于辅助判断系数是否显著,绝对值通常越大,说明变量越可能具有统计学意义。实际解读时应结合p值一起看。
●p值:用于判断某个变量是否显著影响被解释变量。通常小于0.05说明结果具有统计学意义;大于等于0.05时,一般认为该变量在当前模型中不显著。
●95%CI:用于展示系数可能落入的范围。若区间较集中,说明估计相对稳定;若区间很宽,则提示结果波动可能较大。
●R²:表示模型对被解释变量的解释程度,数值越高,说明模型解释力度通常越强。
●调整R²:是在考虑变量数量后对R²进行修正,更适合比较不同复杂度的模型。数值越高通常越好,但也要结合研究场景判断。
●Wald χ²:用于判断模型整体是否成立。对应p值显著时,通常说明整体模型具有统计学意义。
表3:2sls模型分析结果-简化格式
该表格用于快速汇总核心结论,常见内容包括各变量回归系数、样本量、R²、调整R²和Wald检验等。它更适合写报告或论文时快速引用,判断思路与完整结果表一致。
表4:模型汇总(中间过程)
该表格主要用于概括模型整体拟合情况,通常包括Wald检验、R值、R²、调整R²、Root MSE和DW值。
●R值:反映模型预测值与实际值之间的一致程度,数值越高,通常说明模型拟合关系越强。
●Root MSE:用于反映预测误差的整体大小,数值越小通常表示模型误差越小。
●DW值:用于观察残差是否存在自相关问题。一般接近2时更理想;如果明显偏离2,说明残差可能存在相关性,需要进一步留意。

该表格主要用于判断解释变量是否真的存在内生性,也就是帮助研究者确认是否需要采用TSLS而不是普通回归。表中通常包含Durbin检验和Wu-Hausman检验。
●Durbin检验:原假设通常为解释变量是外生的。若p值小于0.05,通常说明应拒绝原假设,提示存在内生性。
●Wu-Hausman检验:也是判断是否存在内生性的常用检验。若p值小于0.05,通常说明普通回归可能不合适,采用TSLS更稳妥。
表6:过度识别检验
当工具变量个数多于内生变量个数时,系统通常会输出该表。它用于检验工具变量整体是否满足外生性要求,常见指标包括Sargan检验和Basmann检验。
●Sargan检验:用于判断工具变量是否整体有效。通常p值大于0.05时,更倾向于认为工具变量满足外生性要求;若小于0.05,则需要警惕工具变量可能不合适。
●Basmann检验:与Sargan检验作用相近,可作为补充参考。通常也是p值大于0.05更理想。
表7:第1阶段回归汇总
该表格用于判断工具变量对内生变量的解释能力,通常包括R方、Partial R方、Shea’s R方、F统计量和p值等信息。
●R方:表示第一阶段模型对内生变量的解释程度,数值越高通常说明解释能力越强。
●Partial R方:用于反映工具变量在控制其他变量后对内生变量的独立解释作用,数值越高通常越好。
●Shea’s R方:用于进一步衡量工具变量的有效性,特别适合在多个工具变量或多个内生变量场景下辅助判断。数值越高通常说明工具变量贡献更充分。
●F统计量:常用来判断工具变量是否偏弱。一般来说,该值越大越好;若过低,则说明工具变量可能较弱,结果稳定性需要谨慎看待。
表8:第1阶段回归结果汇总
该表格用于详细展示第一阶段中各工具变量、外生变量对内生变量的回归结果,便于进一步判断工具变量是否真正发挥作用。一般优先关注工具变量对应系数方向、显著性和第一阶段整体F值。
表9:样本缺失情况汇总
该表格用于说明有效样本数、排除无效样本数及占比,帮助研究者了解最终纳入分析的数据规模。如果有效样本占比较低,需要留意缺失样本是否会影响结论的代表性。
六、分析结果图表及其解读
两阶段回归TSLS在结果页中还会输出模型结果图,用于更直观展示各解释变量与被解释变量之间的关系。
该图通常以关系图的形式展示内生变量、外生变量与被解释变量之间的连接关系,并在连线上显示回归系数及显著性标记。阅读时可以重点看两点:一是连线方向对应的是影响方向,二是连线上的系数和显著性标记可以帮助快速识别哪些变量影响更明显、哪些变量暂未通过显著性检验。若某条路径系数绝对值更大且显著,通常说明该变量对结果的影响更值得重点关注。
以上就是SPSSAU两阶段回归TSLS方法的相关内容,更深入教程可查看SPSSAU帮助手册、教学视频、疑难解惑等资料。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)