立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索

图文播报

查看: 1511|回复: 5

[分享] 什么是方差齐性检验(说人话)?做两独立样本T检验为什么要先做方差齐性检验?

[复制链接]
发表于 2024-10-8 14:56 | 显示全部楼层 |阅读模式
回复

使用道具 举报

发表于 2024-10-8 14:56 | 显示全部楼层

  • 为什么进行方差齐检验(说人话版本)?
举个例子:妈妈为孩子选学校:一中和二中,已知这两所学校的全校平均分都是70,那么是不是意味着这两所学校水平差不多,选哪个都一样呢?
这个时候这位妈妈就想到统计学中讲到的,衡量总体的水平不能单看总体平均值,还要看总体方差(或者标准差),当两个总体的方差相差很大的时候,那么两个总体的均值没有直接可比性。
那么比较两个学校水平,虽然一中和二中的全校平均分都是70分,但是一中总体的标准差是5分,二中总体的标准差是10分,那么对于满分为100分的试卷来讲,两个中学的总体标准差相差很大。
对比如下图:


从上图可以明显的看出,一中学生的成绩更加集中在平均值70附近,而二中的成绩更加分散,偏离70的很多。那么这个妈妈如果选学校的话,肯定会选标准差小的一中,而不是二中。
so?为什么方差分析或者t检验等参数检验要进行方差齐检验,因为方差分析ort检验是用来比较样本均值之间差异的方法,但是脱离样本方差去对比样本均值是没有直接可比性的,比较的结果也没有太大说服力。所以在方差分析andt检验前需要进行方差齐检验(方差分析用于推断两个或多个样本均数所代表的总体均数是否存在差异)。
因此需要进行方差齐检验,当两个样本满足方差齐时,再对比均值的大小才有意义。
<hr/>

  • 如何进行方差齐检验?
统计学中比较常用的方法是莱文方差齐性检验(Levene's test),在SPSSAU系统【通用方法】模块选择【方差分析】中的方差齐检验,对比两所学校成绩是否满足方差齐性,操作如下图:


SPSSAU输出方差齐检验结果如下:


从上表可以看出:不同学校样本对于成绩全部均不会表现出显著性(p=0.136>0.05),意味着不同学校样本数据的波动性均呈现出一致性,满足方差齐前提条件,因而可放心使用方差分析。
SPSSAU进行方差分析得到结果如下:


从方差分析结果来看,两所学校的成绩并未呈现出显著差异(p=0.299>0.05)。
相关阅读推荐:
今儿个学习:方差分析一文汇总整理(全)SPSSAU
回复 支持 反对

使用道具 举报

发表于 2024-10-8 14:57 | 显示全部楼层

1.什么是方差齐性
两个或多个样本之间的方差离散程度相同。
2.什么是方差齐性检验
方差齐性检验就是检验不同总体的方差是否相等。方差相等就是两组数据的离散程度相同。
3.什么是两独立样本t检验
独立样本t检验是在检验两个总体的平均数有没有差异。例如想知道购买某种产品与不够买某种产品的顾客平均收入是否相同等等。
4.为什么先做方差齐性检验
因为两个样本的方差相等与方差不相等时使用计算t值的公式不一样,所以应该先进行方差齐性检验。
5.SPSSAU进行方差齐性检验
分析路径【通用方法】→【方差】


结果:




6.SPSSAU进行两独立样本t检验
分析路径【通用方法】→【t检验】(例子假设满足分析前提条件)




<hr/>SPSSAU
回复 支持 反对

使用道具 举报

发表于 2024-10-8 14:58 | 显示全部楼层

  • 什么是方差齐性
  • 为什么要做方差齐性
  • SPSSAU独立样本t检验如何分析
什么是方差齐性

方差齐性在统计学中大概是我们检验或者分析的数据总体具有分布成一致性的特点。不用俎定类数据对定量数据波动情况是否一致。
为什么要做方差齐性

进行独立样本的t检验要求被比较的两个样本彼此独立,也就是没有配对关系。要求两个样本均来自正态总体,要求均值是对于检验有意义的描述统计量。因为两个样本方差相等与不等时使用的计算t值的公式不同。所以一般先进行齐性检验。
SPSSAU独立样本t检验如何分析

已知参与分析的数据符合彼此独立。
正态性



发现样本量小于50,选择S-W检验,统计量W值为0.94,并且p值为0.11大于0.05,模型不显著,所以符合正态性。
方差齐性



方差齐性检验中,F值为0.3,p值为0.59大于0.05,拒绝原假设,模型不显著,所以分析项具有方差齐性。
独立样本t检验结果



从上表可以看出X=1的均值为1.98,X=2的均值为2.32,二者的均值有差异,并且F值为4.40,p值为小于0.05(由于保留两位小数,四舍五入所以显示p值为0.05,实际小于0.05),所以具有显著性差异,模型显著。
<hr/>SPSSAU
回复 支持 反对

使用道具 举报

发表于 2024-10-8 14:58 | 显示全部楼层
独立样本t检验为什么要进行方差齐性检验?

一些刚开始接触统计的同学都会有这样一个疑问:为什么独立样本t检验要进行方差齐性检验?
有人回答是这样的:如果方差不齐就不具备可比性。而这个回答实际上并不准确。这个回答很可能是将零假设和备择假设中抽样分布的方差相同与t检验的方差齐性假设混淆了。二者实际上并不是一个概念。注意到在独立样本t检验中,抽样分布是指的分布(M指样本均值)
方差不齐(总体方差)的两个样本是可以进行检验的。随便翻看一本统计教材,当两个总体方差已知时,可直接计算标准误,用Z检验来做出推断。此时并没有要求方差齐性:。另外,在SPSS中也自动报告了方差不齐时的校正结果。可见,方差不齐的情况下是可以检验的。那么为什么有方差齐性假设呢?
接下来,我们好好的梳理一下。
如果对推导过程没有兴趣的同学可以直接跳到最后的结论部分。
1. 抽样分布

假设检验的基础就是抽样分布,尤其是样本均值的抽样分布。说具体一点,样本均值的抽样分布就是指:我采用放回抽样随机从一个总体中抽取容量为n的样本,理论上我可以得到无数个样本。每一个样本可以计算出一个均值,因此可以得到无数个均值。这个均值就相当于一个变量,用来表示,其分布规律就是样本均值的抽样分布
根据中心极限定理,若总体均值为,方差为,且服从正态分布,的抽样分布服从均值为,方差为的正态分布;就算总体不是正态分布,当足够大(如大于30)时,也可将抽样分布近似为正态分布。
2. 通过样本均值对总体均值的检验

有了抽样分布,就可以开始进行假设检验了。
例如,我随机测量了某地区30个男生的身高,我想通过该样本数据推断一下该地区男生总体的身高是否大于170cm。
根据抽样分布,我相当于从总体(该地区所有男生的身高)中抽取了一个的样本,其样本均值是来自于抽样分布的一个观测值。由于是均值为,方差为的(近似)正态分布,我可以计算出在该分布中的位置,通过位置是否极端来做出推断。
由于我想要推断的是”该地区男生总体的身高是否大于170cm“,不妨先**假设该地区男生总体身高为170,即**,也就是零假设。
此时我根据零假设计算一下在分布中的位置,即标准分数

根据小概率原则,我们认为小于5%的小概率事件在单次抽样中基本不可能发生,而正态分布中双尾概率5%对应的临界值为±1.96。用计算出来的跟±1.96进行比较,如果超过了临界值(大于1.96或小于-1.96),则认为此时小概率事件发生了,违背了小概率原则。那么就有理由怀疑零假设的真实性。用更通俗的话来说:如果该地区男生总体身高为170的话,我居然在一次抽样中抽到了非常小概率的情况,这说明该地区男生的身高很可能不是170
3. 当总体未知时

从上述公式可以看出,要计算值,其中是来自于样本的信息,可以获取;是基于零假设提出的,可以代入;唯一需要关注的就是总体标准差
实际上,在现实研究中,是很难获取的,此时怎么办呢?
要解决这个问题,就需要引入一个新的分布——t分布,其定义是:若变量服从标准正态分布,变量服从自由度为的卡方分布,且独立,那么变量就服从t分布
恰巧服从均值为,方差为的正态分布,将其标准化,即就服从标准正态分布,我们得到了。而又知服从自由度为的卡方分布(其中为样本标准差,具体证明略,可以百度谷歌或者看教材),我们又得到了。那么根据分布的定义:

可见,当未知时,我们便可以将带入上述公式,计算出值,在分布中进行检验。
4. 两个总体均值的差异

啰嗦了半天,终于进入到了正题。
刚才讨论的都只是一个样本的情况,那么两个样本又如何呢?我们怎么通过两个样本来检验两个总体的均值是否存在差异,即是否等于零?
实际上并没有太大区别。假设从均值为,标准差为的正态总体中抽取容量为的样本,样本均值记为;从均值为,标准差为的正态总体中抽取容量为的样本,均值记为。根据抽样分布可知:
服从均值为,标准差为的正态分布;
服从均值为,标准差为的正态分布;
当总体A与B相互独立时,之差形成的新变量服从均值为,方差为。至于为什么均值求差方差求和可以自行百度。
可见:

注意到不就是我们想要验证的假设吗?
因此,按照相同的逻辑,我们计算此时获取的样本在上述分布中的位置:

然后跟±1.96进行比较即可。
注意到,在上述过程中我并没有要求,即方差齐性。可见方差不齐的时候也是可以比较两个总体均值差异的。
5. 独立样本t检验的方差齐性假设

既然上述公式不要求方差齐性,那么在t检验中为什么又要求了呢?
我们按照分布的定义来梳理一下。
此时的服从标准正态分布,
服从自由度为的卡方分布;服从自由度为的卡方分布;根据卡方分布的可加性:服从自由度为的卡方分布,于是:

从上面这个恶心繁琐的公式可见,只有当时,上述公式才能够将分子分母中的消掉,留下干净的结果。


此时我们不再需要就能做出推断。
注意到上式中的部分就是所谓的联合方差
6. 方差不齐时怎么办?

可见,独立样本t检验要求方差齐性,并不是出于可比性,而是若方差不齐,便不能在未知的情况下计算
那么问题来了,如果方差不齐,怎么办?
不用担心,实际上方差不齐时也能进行t检验,只不过会导致一型错误膨胀。此时只需要采用更严格的标准即可,SPSS中就报告了方差不齐时的修正方法,即采用更小的自由度,使得临界值增大,更难拒绝零假设。
7. 总结


  • 通过两个样本推断独立总体的均值差异,并不要求总体方差相等。例如总体方差已知时,可直接用Z检验,此时无所谓方差齐性。
  • 当总体方差未知时,需要方差齐性的前提才能计算出t值。方差齐性并不是出于可比性的考虑,而是方差不齐你就没法计算t值
  • 总体方差未知,且方差不齐时,并不是就无法检验,而是可以通过设置更严格的标准,对一型错误进行校正,从而做出推断。
回复 支持 反对

使用道具 举报

发表于 2024-10-8 14:59 | 显示全部楼层
方差齐性检验就是用来比较两个及以上总体的方差是不是差不多。
首先独立样本T检验是针对独立样本的平均数差异检验,也就是检验两个总体的平均数有没有差异。那么首先就要保证这两个独立样本是否具有可比性,没有可比性就不能进行T检验。怎么证明有没有可比性,平均数差异检验比的两个总体的平均数,也就是要证明这两个总体的平均数有没有可比性。方差可以证明(方差的特点)。方差的概念一定要通透,指的是一组数据的离散程度,方差越大,分布曲线越低阔,数据越离散(离散就说明这些数据更分散,离平均数都很远);方差越小,分布曲线越高狭,数据越集中,离平均数就近,所以平均数的代表性就好。如下图,σ₁²<σ₂²,面积一定的前提下,左边的大部分面积都集中在了平均数周围(都集中在x₁和x₂的区间),这个分布就集中。


所以比较总体方差,就可以证明总体的平均数代表程度是不是差不多。如果方差不一致,这时比较μ₁和μ₂就没有意义了。
回复 支持 反对

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册 微信登录 手机动态码快速登录

本版积分规则

关闭

官方推荐 上一条 /3 下一条

快速回复 返回列表 客服中心 搜索 官方QQ群 洽谈合作
快速回复返回顶部 返回列表