SPSS——方差分析(Analysis of Variance, ANOVA)——单因素方差分析
方差分析基本原理
样本要求
- 独立性
各样本必须是相互独立的随机样本
样本含量尽可能相等或相差不大 - 可比性
样本均值不相同,可比较 - 正态性
样本的总体符合正态分布,偏态分布不适用于方差分析。
对偏态分布应考虑用对数转换、平方根变换、倒数变换、平方根反正弦变换等变量变换方法变为正态或接近正态分布后再进行方差分析 - 方差齐性
各组样本具有相同的方差
基本原理
由于各种因素的影响,方差分析研究的数据呈现波动性。造成波动的原因可分为两类:一是不可控的随机因素;二是研究中施加的对结果形成影响的可控因素
方差分析若拒绝原假设,只能说明多个样本总体均数不相等或不全相等。若要得到各组均数之间详细信息,应在方差分析的基础之上进行多个样本均值的两两比较
产生总变异的原因有两方面
同一处理不同重复观测值的差异是由偶然因素影响造成的,即试验误差,又称组内变异
不同处理之间平均数的差异主要是由处理的不同效应造成的,称处理间变异,又称组间变异
因此:总变异可分解为组间变异和组内变异两部分
图解总变异=组间变异+组内变异
当选择样本时,样本尽量接近总体均值,效果越好,我们希望样本的组内变异越小越好,组间变异越大越好。
通过检验组间变异和组内变异之比,可以判断是否组间变异起到决定性的因素
ANOVA分析的流程
单因素方差分析
简介
如上图ANOVA分析的流程,
- 单因素方差分析针对多组均数间的比较。
- 方差分析拒绝H0,只能说明多个样本总体均数不相等或不全相等。若要得到各组均数间更详细的信息,应在方差分析的基础上进行多个样本均数的两两比较。
- 两两比较分为事前计划好的比较和事后比较,前者借助于对比(Contrast),后者借助于两两比较(Post Hoc )提供的许多方法。
- 在分组变量包含次序信息时,如果方差分析做出了各组间差异有统计学意义的结论,并且Means-Plot均数图提示各组均数的某种趋势时,可以利用趋势分析讨论观察值与分组变量取值间的数量依存关系。借助于对比(Contrast)完成。
为什么不用独立样本t检验
多次采用独立样本t检验,会导致拒绝原假设的概率增大。例如t检验的显著水平是0.05,N次t检验的显著水平为1-0.95**N,明显比0.05大得多
数学模型
模型简介
详细证明
注意:这里可以看到样本要求假设如果作用于数学建模。
定义随机误差模型
不同水平条件下重复试验结果
构建数学模型
参数估计
分解定理与自由度
显著性检验
单因素方差分析表
菜单
数据源 salesperformance.sav
变量选择设置
对比
多项式: 用于组间均数变化的趋势检验
度:对趋势分析指定多项式的形式
有时候为了考察因变量与处理因素之间是否存在着某种依存关系,可以利用线性模型的有关原理对数据作进一步的分析,以统计学上称为趋势(线性或者多项式关系)检验(Trend Analysis)。
可以选择选项中的均数图,可以直观地揭示趋势关系。
举个例子:
系数:精确定义均值比较的多项式系数
多重比较实际上等价于均数的线性组合的假设检验。常用于实现计划好的比较,即事先知道每组样本的均值的线性关系。
举个例子:
两两比较
如果事先并不知道样本均值的线性关系,接受原假设后,需要进一步分析两两样本均值的显著性差异。
假定方差齐性
- LSD法
即最小显著差法(Least Significance Difference Method),是最简单的比较方法之一。
用t检验完成各组均值间的配对比较,对多重比较误差率不进行校正。 - Sidak法
实际上是Sidak校正在LSD法上的应用。
用t检验完成各组均值间的配对比较,对多重比较误差率进行校正。
Sidak法比LSD法保守得多。 - Bonferroni法
实际上是Bonferroni校正在LSD法上的应用
用t检验完成各组均值间的配对比较,对多重比较误差率进行校正
Bonferroni法比Sidak法保守一些。 - Scheffe法
对多组均数间的线性组合是否为0进行检验,即(Contrast) - Dunnett法
常用于多个实验组与一个对照组间的比较
设定此法后,激活Control Category 参数框,展开小菜单,选择对照组。
未假定方差齐性
- Tamhane’s T2 基于 t 检验的保守成对比较。当方差不相等时,适合使用此检验。
- Dunnett’s T3 基于学生化最大值模数的成对比较检验。当方差不相等时,适合使用此检验。
- Games-Howell 当方差不相等时的一种比较灵活的配对比较。
- Dunnett’s C 基于学生化范围的成对比较检验。当方差不相等时,适合使用此检验。
两两比较方法的选择策略
- 多个实验组与一个对照组的比较,一般采用Dunnett法。
- 需要进行任意两组间的比较而各组样本含量相同,选用Tukey法。
- 需要进行任意两组间的比较而各组样本含量不相同,选用Scheffe法。
选项
- 描述性 描述性统计量
- 固定和随机效果
固定效应模式和随机效应模式的相关统计量 - 方差同质性检验
方差齐次检验结果 - Brown-Forsythe
https://en.wikipedia.org/wiki/Brown%E2%80%93Forsythe_test
http://www.real-statistics.com/one-way-analysis-of-variance-anova/brown-forsythe-f-test/
检验各组均值是否相等的统计量
Brown-Forsythe检验是指采用Brown-Forsythe分布的统计量进行的各组均值是否相等的检验。Brown-Forsythe分布也近似于F分布,但采用Brown-Forsythe检验对方差齐性也没有要求,所以当因变量的分布不满足方差齐性的要求时,采用Brown-Forsythe检验比方差分析更稳妥。 - Welch
http://www.real-statistics.com/one-way-analysis-of-variance-anova/welchs-procedure/
检验各组均值是否相等的统计量
Welch检验是指采用Welch分布的统计量进行的各组均值是否相等的检验。Welch分布近似于F分布,采用Welch检验对方差齐性没有要求,所以当因变量的分布不满足方差齐性的要求时,采用Welch检验比方差分析更稳妥。
结果分析
0.014 < 0.05 说明各组的方差没有齐性,方差不等;这种情况适合于Welch / Brown-Forsythe检验
F统计量显著性Sig < 0.05,说明均值不等
通过渐近F分布,Sig < 0.05,说明均值不等
可以看到未标星的为 2组和3组,说明2组和3组没有显著性差异
可以看到因子和因变量的趋势,第一组得分最低,第二组和第三组的分值差距不大,可以多重比较的结果非常一致。
更多推荐
所有评论(0)