一、Robust回归所属模块

Robust回归在SPSSAU中属于【计量经济研究】模块。

二、方法概述

Robust回归适合用于做回归关系分析,同时尽量降低异常值或异方差对结果稳定性的干扰。它常用于普通回归结果不够稳、担心极端值影响判断的场景。

三、变量设置规则

1. 总体要求

Robust回归需要设置1个因变量和至少1个自变量,因变量为必填,自变量同样为必填。

2. 具体设置规则

(1)因变量设置

因变量只能放入1个,且必须为定量变量。也就是说,最终要被解释或预测的结果项只能有一个。

(2)自变量设置

自变量至少放入1个,最多可放入200个,支持定量变量和定类变量。实际使用中,如果自变量较多,建议先结合研究目的做好筛选,避免解释过于分散。

四、参数设置及解释说明

保存残差和预测值

该选项用于把本次分析得到的残差和预测值保存下来,便于后续继续做诊断、对比或二次分析。若只是看本次回归结果,可不勾选;若后面还要检查模型表现,或想把预测结果继续用于别的分析,建议勾选。

五、分析结果表格及其解读

Robust回归完成后,通常会输出2张核心结果表;如果数据中存在被排除的无效样本,还会额外输出1张样本缺失情况汇总表。

1. 表1:Robust回归分析结果

该表格用于完整展示模型整体拟合情况以及各个自变量的回归结果,包含回归系数、标准误、t值、p值、95%置信区间、R²、调整R²和F值等核心指标。

• 回归系数:反映自变量对因变量的影响方向和影响大小。系数为正,说明自变量增加时因变量倾向上升;系数为负,说明两者方向相反。判断时先看正负方向,再结合显著性判断这个影响是否成立。

• 标准误:反映回归系数估计的稳定程度。一般来说,标准误越小,说明系数估计越稳定;如果标准误较大,往往意味着结果波动较明显,需要谨慎解读。

• t值:用于辅助判断某个自变量是否对因变量有实际影响。通常绝对值越大,说明支持该变量有效的证据越强,但最终仍要结合p值一起看。

• p值:用于判断结果是否显著。通常p值小于0.05,可认为该变量对因变量存在显著影响;大于等于0.05,则说明证据不足,不能轻易认定其有影响。

• 95%置信区间:用于观察系数可能落入的范围,也能辅助判断显著性。如果区间没有跨过0,通常说明结果更稳定且更可能显著;如果区间跨过0,则说明该变量的影响不够明确。

• R²:用于反映模型对因变量变化的解释程度,数值越接近1,说明模型解释力越强;如果数值较低,则说明还有较多变化没有被模型解释。

• 调整R²:是在考虑自变量数量后得到的解释力指标,比R²更适合做模型之间的比较。该值越高越好;若加入变量后反而下降,通常说明新增变量贡献有限。

• F值及其对应p值:用于判断整个模型是否整体有效。通常对应p值小于0.05,说明模型整体成立;若不显著,则说明这一组自变量整体上对因变量的解释支持不足。

2. 表2:Robust回归分析结果-简化格式

该表格用于快速汇总核心结论,适合写报告或做结果展示,包含各变量回归系数、对应t值、样本量、R²、调整R²以及F值。

• 回归系数与t值:适合快速判断每个变量的影响方向和统计支持程度。若系数方向清晰、t值绝对值较大,通常说明该变量更值得重点关注。

• 样本量:表示本次进入模型分析的有效样本数。样本量过少时,模型结果往往更不稳定,因此解读时要同时关注样本基础是否充分。

• R²与调整R²:用于快速把握模型解释力。两者越高,通常说明模型拟合越理想;如果二者差距较大,也提示模型中可能存在无效变量较多的情况。

• F值:用于再次确认模型整体是否成立,重点仍然看其对应的p值是否达到显著标准。

3. 表3:样本缺失情况汇总

当原始数据中存在缺失值或无效样本被排除时,系统会额外输出这张表,用于说明最终进入回归分析的数据情况,包含有效样本、排除无效样本和占比等指标。

• 有效样本:表示真正参与本次分析的数据数量。数量越充足,通常越有利于提升结果稳定性。

• 排除无效样本:表示因缺失或其他原因未进入分析的数据数量。如果该部分占比过高,说明数据损失较多,需要谨慎解读分析结果。

• 占比:用于直观看各类样本所占比例。若有效样本占比较高,通常说明本次分析基础较好;若无效样本占比偏高,则要关注数据质量问题。

六、分析结果图表及其解读

Robust回归完成后,通常还会输出模型结果图和回归系数95%置信区间图,方便更直观地查看变量关系和结果稳定性。

1. 模型结果图

该图通常用连线方式展示各个自变量与因变量之间的关系,并直接呈现对应系数信息。它适合快速看清哪些变量与结果项关联更明显。判断时可先看系数方向,再结合显著性标识,区分出正向影响、负向影响以及不显著影响。

2. 回归系数95%置信区间图

该图用于同时展示各变量回归系数及其区间范围,特别适合比较不同变量结果的稳定性。若某变量的区间没有跨过0,通常说明该变量影响更明确;若区间很宽,说明结果波动较大;若区间跨过0,则说明该变量是否有影响还不够稳定。

以上就是SPSSAU Robust回归方法的相关内容,更深入教程可查看SPSSAU帮助手册、教学视频、疑难解惑等资料。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐