如何理解假设检验的接受域与置信区间的关系？

幸福侠侣 · 发表于 2024-10-27 13:37

登陆有奖并可浏览互动！

您需要登录才可以下载或查看，没有账号？立即注册

×

如何理解假设检验的接受域与置信区间的关系？
原文地址：https://www.zhihu.com/question/52174039

检验医师 · 发表于 2024-10-27 13:37

看了所有答案，脑袋里只有？？？
所以，这里我用一张图带你理解

这么简单的问题你们是如何讲的辣么复杂的，奇了怪了

同花顺 · 发表于 2024-10-27 13:38

事实上，有专门一套通过假设检验来做置信区间的方法。我们可以规定如下关系来建立两者之间的“对偶”：定义 $c(\underline X)$ 为数据 $\underline X$ 所生成的置信区间， $A(\theta)$ 为接受域，则可以定义如下关系：
$\theta \in c(\underline X) \Longleftrightarrow \underline X \in A(\theta)$ .
若知参数 $\theta$ 的UMP test，则可以通过该对偶关系来构建UMA(uniformly most accurate)置信区间。这样的好处在于可以把UMP的性质直接嫁接在UMA上：对于size为 $\alpha$ 为UMP，其对应的UMA 置信区间 $c(\underline X)$ 有以下三个性质：

$P_{\theta_0}(\theta_0 \in c(\underline X ) ) = 1- \alpha$
$P_{\theta_0}(\theta' \in c(\underline X) ) \leq P_{\theta_0}(\theta'\in c_1 (\underline X) )$ , 当 $c_1(\underline X)$ 为任意其他满足性质1.的置信区间, 且 $\theta' \in \Theta$ .
$E(vol(c(\underline X)) \leq E(vol(c_2(\underline X))$ , 当 $c_2(\underline X)$ 为任意其他满足性质1.和性质2的置信区间

用大白话来说：性质一说UMA 包含真实参数的概率为 $1-\alpha$ （很大），性质二说UMA包含错误参数的概率最小，性质三说UMA的期望长度的最小。这一切性质仅仅需要通过对偶假设检验就可以获得。
当然，UMP是单边的，所以与其对偶的UMA也一定是upper或是lower confidence interval。幸运的是，我们也可以用UMPU test来构建与其对应的置信区间。细节与上述的大同小异，此处略去。

卡卡 · 发表于 2024-10-27 13:38

不想用太多符号以及概率来表达这两者关系，我想尝试一下用简便的方法来阐述一下这两者的关系，如果有错误欢迎指出。
首先假设检验中的不拒绝域和置信区间本质上是两个不一样的东西，但是它们之间有点异曲同工。前者的不拒绝域是以总体参数为主体来构建的，它可以理解为假设参数为真的条件下样本统计量落入这个不拒绝域的概率有（1-α），因此若你的样本统计量在α这么小的概率都落入了拒绝域，那么我就有充足的理由去说你这个原假设是假的，而这也正是假设检验的思想所在。至于置信区间它则是以样本统计量作为主体来构造的，它是以一个相对的思想来构造的，它的思想首先出发于估计量的无偏性，以正态分布为例由于估计量具有无偏性因此总体参数真值的正负3σ的区间内包含了99%的样本统计量，但是我们要估计的就是总体参数，因此总体参数是未知的，那我们就可以以相对的思想，既然你参数真值正负3σ的区间内包含了99%的样本统计量，则我也有99%的样本统计量±3σ区间也包含你参数真值，这就是置信区间。
总的来说，假设检验中的不拒绝域是以参数为主体来构造的，而区间估计中的置信区间则是以样本统计量为主体来构造的，它们构造的主体不同，但是构造的思想基本一致。
By the way其实个人觉得假设检验的原理完全可以用p值来定义

继续前进 · 发表于 2024-10-27 13:38

一. “接受域”
   首先明确一个概念，只有拒绝域没有接受域，不论哪本书提到了接受域这都是不严谨的（我们上课使用的茆时松先生的《概率论与数理统计》这本书因为提到了“接受域”而被授课的时任系主任梅长林教授质疑）。它是一种错误的描述方式，正确的描述方式是“不拒绝的区域”。
   下面解释“拒绝域”。
   它来源于假设检验，是一个区域。假设检验是将参数空间划分出两个区域H0、H1，检验某分布中的参数是否位于“原假设”（null hypothesis,H0）区域。由此演化出“拒绝域”的概念：假设检验也等价于将样本空间也分为两个互不相交的部分，当样本属于A区域时，拒绝H0，否则不拒绝。称A为该检验的拒绝域。
   特别说明，一般假设检验是通过“检验统计量”完成的（“检验统计量”通俗解释就是样本之间进行某种数学上的“组合”得到一个数，比如10个样本取均值，那均值就是一个“统计量”），拒绝域是针对这个“检验统计量”所在空间而言的，因此一旦拒绝域确定了也就确定了一个检验法则。
二. “置信区间”
   先解释一下频率学派意义下的“Confidence interval”的含义，大部人的理解可能是置信区间是未知参数有100(1- $\alpha$ )%的概率取在该范围内，然而正确的解释是“N次独立重复试验中，这个区间恰好覆盖住100(1- $\alpha$ )N%的实验所得到的参数值”。究其根源是因为频率学派认为未知参数是个定值，因此不能用概率这个概念去衡量它的取值。
   回到置信区间这个话题，他实际上是：在已经知道分布形状(即含有明确的分布表达式形式)但中间还有未知的参数的情况下，通过大量重复试验从该分布中得到样本数据，以此估计未知参数位于数轴的什么位置。
三. 二者差异
二者描述的对象本体不同，拒绝域是假设检验中拒绝H0时“检验统计量”应该落入的区域，而置信区间是对于未知参数的估计中“未知参数”可能存在于的区域。
但二者有一定的联系，简单来讲就是“检验统计量”中可能包含“参数”
Example: 比如均值，它既可以成为检验统计量，自己也可以作为未知参数出现于某一分布中。由此对于正态样本，在方差已知的情况下对于均值的显著性水平为 $\alpha$ 的双侧假设检验所得到的“不拒绝区域”应该与区间估计中均值的 $1-\alpha$ 置信区间在数值上是一样的。（上述假设检验原假设是 $\mu =\mu _{0}$ ）

检验医师 · 发表于 2024-10-27 13:39

它们对问题的提法不同。但解决问题的途径是相通的。
假设检验接受域的上下两个边界就是对应参数置信区间的置信上限和置信下限。
参数的假设检验和参数的区间估计是从不同角度回答同一问题，假设检验判断结论是否成立，参数估计解决的是多少（或范围）。前者解决定性的后者解决定量的。

图文播报

[分享] 如何理解假设检验的接受域与置信区间的关系？

登陆有奖并可浏览互动！

发表回复

官方推荐 /3

个人中心