相关分析是研究两个变量共同变化的密切程度,但有时出现相关的两个变量又同时与另外的一个变量相关,在这三个变量中,有可能只是由于某个变量充当了相关性的中介作用,而另外的两个变量并不存在实质性的相关关系。这种情形导致数据分析中出现“伪相关”现象,造成伪相关现象的变量被称为“桥梁变量”。

在数据的相关性分析中,为了摒弃桥梁变量的影响力,发现变量内部隐藏的真正相关性,人们引入了偏相关分析的概念。偏相关分析是在剔除控制变量的影响下,分析指定变量之间是否存在显著的相关性。

目录

一、前提

二、步骤

1、计算样本的偏相关系数

2、对样本来自的两个总体是否存在显著的净相关进行推断(显著性sig推断)

三、基于spss的具体操作

四、应用

五、参考文献


一、前提

在之前进行相关性分析的时候有出现过三者或多者因素显著相关,这时就有疑问了,到底是这三者间两两相关,还是中间存在一个“桥梁变量”,进而联系其另外两个变量的?

于是就需要使用偏相关分析,把桥梁变量作为控制变量,重新进行相关性分析,检查在排除了桥梁变量的影响力之后,其它变量之间是否还存在关联性。如果开始有相关关系,剔除了控制变量之后,相关关系不存在了,说明控制变量为桥梁变量。

二、步骤

1、计算样本的偏相关系数

利用样本数据计算偏相关系数,反应了两个变量间净相关的强弱程度。在分析变量x1和x2之间的净相关时,当控制了变量x3的线性作用后,x1和x2之间的一阶偏相关系数定义为:

                                                                r_{12(3)}=\frac{r_{12}-r_{12}r_{23}}{\sqrt{1-r^{2}_{13}}\sqrt{1-r^{2}_{23}}}

2、对样本来自的两个总体是否存在显著的净相关进行推断(显著性sig推断)

  1. 提出原假设,即两总体的偏相关系数与零无显著差异。
  2. 选择检验统计量。偏相关分析的检验统计量为t统计量,它的数学定义为:

                                                                                 t=\frac{r\sqrt{n-q-2}}{\sqrt{1-r^{2}}}

三、基于spss的具体操作

通过分析三十个样本地区的家庭经营收入x2与衣着y2居住y3饮食y4支出之间的关系,判断其具有相关性。(由常识可得的,收入决定支出嘛,所以怀疑x2对y2y3y4之间的相关性具有”桥梁作用“,于是使用偏相关分析进行排查)

【分析】-【相关】-【双变量】(此处同之前的相关性,因为是先判断相关后,对相关性是否有牵连作用做出判断) 

 由此可见,四者都是有关系的。此处怀疑家庭收入作为三个支出相关的”桥梁“。于是进行偏相关分析。

【分析】-【相关】-【偏相关】,将三个支出选为变量,家庭收入选为控制变量

由图可以看出,它们之间仍然具有相关性,且显著性sig小于0.05,说明不仅相关且显著。

由此可以看出上面的怀疑推测是没有依据的,支出与支出之间仍然存在相关性,比如,收入恒定,则买衣服的钱多了,吃得自然就差了一些嘛。

四、应用

在多元回归中,应注意简单相关系数只是两变量局部的相关性质,而并非整体的性质。在多元回归中并不看重简单相关系数,而是看重偏相关系数。根据偏相关系数,可以判断自变量对因变量的影响程度;对那些对因变量影响较小的自变量,则可以舍去不顾。

五、参考文献

[1]微信公众号生活统计学:SPSS分析技术:偏相关分析

[2]百度百科:偏相关分析

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐