金桔
金币
威望
贡献
回帖0
精华
在线时间 小时
|
一、假设检验
假设检验:总体分布函数完全未知或只知形式不知参数情况下,推断总体某些特性,提出某些关于整体的假设,根据样本对所提出的假设作出接受或是拒绝的决策
显著性水平:犯错概率α,P\{当H_0为真拒绝H_0\}=P_{μ_0}\{|\frac{\overline{X}-μ_0}{σ/\sqrt{n}}|≥k\}≤α(≥k表示\overline{X}和真实的μ_0相差超过临界值k后即差距过大时认为假设不成立,如果要让H_0成立就需要让超过临界值的概率非常小,为α),关于\overline{x}和μ_0有无显著差异判断是在显著性水平α之下作出的
检验统计量:Z=\frac{\overline{X}-μ_0}{σ/\sqrt{n}}
检验问题的叙述:在显著性水平α下,检验假设H_0:μ=μ_0(原假设/零假设),H_1:μ≠μ_0(备择假设)
拒绝域:拒绝原假设H_0的区域,其边界点称为临界点
两类决策错误
1. 第Ⅰ类错误弃真:H_0为真时拒绝H_0(θ∈H_0)
2. 第Ⅱ类错误取伪:H_0实际不真时接受H_0(θ∈H_1)
样本容量固定时,减少一类错误概率另一类概率增加,增加样本容量才能让犯两类错误概率都减小
显著性检验:知对犯第一类错误概率进行控制,控制在α以下
双边备择假设与双边假设检验
单边检验:右边:H_0μ≤μ_0,左边H_0μ≥μ_0
假设检验步骤:(假设+检验量+求出拒绝域+看样本算出来的有没有在拒绝域)
1. 根据实际问题提出原假设及备选假设
2. 给定显著性水平α及样本容量n
3. 确定检验统计量(中枢量)及拒绝域形式
4. 按P\{当H_0为真拒绝H_0\}≤α求出拒绝域
5. 取样,根据样本观察值做出决策
二、正态总体均值的假设检验
(一)单个总体N(μ,σ^2)均值μ的检验
- σ^2已知,关于μ的检验(Z检验):检验量Z=\frac{\overline{X}-μ_0}{σ\sqrt{n}}
- σ^2未知,关于μ的检验(t检验):检验量t=\frac{\overline{X}-μ_0}{S\sqrt{n}}\sim t(n-1)
(二)两个正态总体均值差的检验(t检验):检验量t=\frac{(\overline{X}-\overline{Y})-(μ_1-μ_2)}{S_ω\sqrt{\frac1{n_1}+\frac1{n_2}}}\sim t(n_1+n_2-2)
(三)基于成对数据的检验(t检验):数据不服从独立同分布但成对,可以将每对数据作为一个合成数据,根据题意这对数据的差或其他关系满足独立同分布,则可采用t检验
三、正态总体方差的假设
(一)单个总体方差的假设检验(χ^2检验法)
问题:总体X\sim N(μ,σ^2),μ、σ未知,要求检验:H_0:σ^2=σ^2_0
S^2为σ^2无偏估计→H_0为真时\frac{s^2}{σ^2_0}比值在1附近→χ^2=\frac{(n-1)S^2}{σ^2_0}\sim χ^2(n-1)→拒绝域P_{σ_0^2}\{ (\frac{(n-1)S^2}{σ^2_0}≤k_1)∪(\frac{(n-1)S^2}{σ^2_0}≥k_2) \}=α→\frac{(n-1)s^2}{σ^2_0}≤χ^2_{1-α/2}(n-1)或\frac{(n-1)s^2}{σ^2_0}≥χ^2_{α/2}(n-1)
(二)两个总体的情况(F检验法)
问题:总体X\sim N(μ_1,σ_1^2),Y\sim N(μ_2,σ_2^2),均值方差均未知,要求检验:H_0:σ_1^2≤σ_2^2 H_0为真时,E(S_1^2)=σ_1^2≤σ_2^2=E(S_2^2)→拒绝域形式\frac{s_1^2}{ s_2^2}≥k→P\{拒绝H_0\}=P_{σ_1^2≤σ_2^2}\{ \frac{S_1^2}{ S_2^2}≥k \}≤P_{σ_1^2≤σ_2^2}\{ \frac{S_1^2/ S_2^2}{ σ_1^2/ σ_2^2 }≥k \}=α→\frac{S_1^2/ S_2^2}{ σ_1^2/ σ_2^2 }\sim F(n_1-1,n_2-1)→拒绝域F=\frac{s_1^2}{ s_2^2}≥F_α(n_1-1,n_2-1)
四、置信区间与假设检验之间的关系
求出置信区间来进行假设检验,也能求得检验问题接收域后求置信区间
五、样本容量的选取
一般预先给出显著性水平来控制第Ⅰ类错误,选择合适的样本容量来控制第Ⅱ类错误
OC函数:若C是参数θ的某检验问题的一个检验法,β(θ)=P_{θ}(接受H_0)称为检验法C的施行特征函数或OC函数,其图形称为OC曲线
功效函数与功效:θ∈H_1时,β为反第Ⅱ类错误的概率,1-β(θ)为做出正确判断概率,称为功效函数,1-β(θ_*)称为检验法在点θ_*的功效
β是n的函数,根据β的函数形式,控制β(θ)(真值)与β(θ_*)的关系就能让犯第Ⅱ类错误的概率不超过β,从而计算出合适的样本容量
六、总结
本章讨论的是统计推断基本问题第二类问题——假设检验问题。假设检验就是根据样本所提供的信息对所考虑的假设做出接受或者拒绝的决策的过程。一般用前面所讲述的性质构造检验统计量,然后根据样本做出决策。 完成决策后,一般可能遇到两种错误:弃真和取伪。在样本容量固定的情况下,这两种错误不能同时降低,只有增加样本容量才能让犯两类错误的概率都减小。假设检验的步骤一般要有提出假设、确定显著性水平和样本容量、确定检验量(中枢量)、求出拒绝域,最后根据样本观察值做出决策。而置信区间与假设检验两者间是能够已知一方求另一方的。 本章最后对正态总体均值和方差进行假设检验。枢轴量的确定同样应用了第六章所属抽样分布函数内容。
七、参考文献
[1] 浙江大学《概率论与数理统计(第四版)》
原文地址:https://zhuanlan.zhihu.com/p/412392628 |
|