, a value will be calculated at size aiming to reject the null hypothesis. The sample size , however, can retrospectively be divided into partial samples and a test of significance can be calculated for each partial sample. As a result, several partial samples will provide significant values whereas others will not show significant values. In this paper, we propose a significance test that takes into account the additional information from the values of the partial samples of a random sample. We show that the    values can greatly modify the results of a classic significance test."> 不重要:现在什么? - raybet雷竞app,雷竞技官网下载,雷电竞下载苹果

概率论与数理统计》杂志上

PDF
概率论与数理统计》杂志上/2012年/文章

研究文章|开放获取

体积 2012年 |文章的ID 804691年 | https://doi.org/10.1155/2012/804691

格哈德Marinell Gabriele Steckel-Berger,汉诺乌尔姆, 不重要:现在什么?”,概率论与数理统计》杂志上, 卷。2012年, 文章的ID804691年, 6 页面, 2012年 https://doi.org/10.1155/2012/804691

不重要:现在什么?

学术编辑器:人赖唐
收到了 2012年7月25日
接受 2012年10月12日
发表 2012年11月08

文摘

在一个经典的显著性检验,基于随机样本的大小 ,一个 值将被计算在大小 旨在拒绝零假设。样本的大小 然而,回顾可以分为部分样品 和测试的意义可以计算每个部分的样本。因此,几个部分将提供重要的样品 值而另一些不会显示明显 值。在本文中,我们提出一个显著性检验,考虑的附加信息 的值 部分样本的随机样本。我们表明, 值可以大大修改经典意义测试的结果。

1。介绍

在这个时代,测试的意义已经成为一种仪式,如果它会导致一个重要的结果,仍然打开大门,许多知名期刊在几乎每一个科学领域。这样虽然很长一段时间的应用测试被批评,甚至拒绝零假设意义(1]。这里将显示,通过扩展经典的显著性检验可以获得额外的信息从一个随机样本和一个“不重要”的结果可能使“重大”。零假设意义的滥用测试却不可以用这种方法避免(2]。

在费雪(定义的显著性检验3,4)具体样本的概率会发生计算基于零假设的有效性。这个概率通常是简短的 与传统相比,确定水平的意义通常是5%。当 等于或小于这个级别的意义则拒绝零假设。如果情况不是这样,那么,所定义的费舍尔,不能拒绝零假设,也不接受5]。这个过程是有效的对于一个给定的样本提供的随机样本。这意味着样本的单位是来自人口随机和的概率单位绘制出的人口。如果你假定,像往常一样,一个简单的随机样本(“idd”=“独立同分布假设),然后我们有相同的概率为每个单位的样品和图纸从人口发生彼此独立的。

即使样本的随机性是显著性检验的一个前提,它是很少认证。此外,“iid”假设需要图纸的顺序从人口是已知的,这允许一个随机样本分割成一系列较小的次级样本。样本的大小 因此可以回顾分为部分样品吗 和测试的意义可以计算每个部分的样本。因此,几个部分将提供重要的样品 值而另一些不会显示明显 价值观和第三类只会导致近显著 值。

2。说明性的例子

一系列的例子与随机样本应该说明典型的情况。在第一个例子中,零假设 应验证在5%的显著性水平的显著性检验和随机样本的大小 。如果一个随机样本的大小是由一个随机发生器二项分布的随机变量和“真正”的价值 ,因此相应的随机样本 0.100不建议重大科研成果的价值。然而,如果部分样品1 这个随机样本的检查然后我们得到不同的结果。的 值的部分示例图进行描述1在下面。一个可以看到 值躺上面和下面两个层次的意义。然而,在的情况下 , 很明显高于5%的水平相似可以看到什么

然而,在这样特殊的情况下,我们知道真正的价值是0.55,因此零假设并不适用,但拒绝零假设基于给定的样本是不可能的。不过这将是可能的如果一个人,例如,只考虑第一个28个单位。作为一个结果 值(0.044)小于5%的显著性水平,可以拒绝零假设。这种拒绝零假设,然而,要求后的两个单位的信息将被忽略。能简单地忽略了有效信息的方法是不明智的,很难被接受。所以在我们的方法,我们不打算忽略有效信息,如下我们展示。我们试图捕捉所有的信息,一个有效的样本。零假设在我们的例子中只能拒绝了如果所有 次级样本。

在第二个例子中随机值的“真正”的价值 ,因此相同的值为零假设,的帮助下创建一个随机发生器。对应的样本的大小 有一个 值0.100,因此并不意味着一个重要的结果在5%水平的意义。不能拒绝零假设。的 的值 可能部分样品如图2

引人注目的是,是什么 值部分样本 因此是意义和因此导致的5%水平下拒绝零假设,即使“真正”的值创建的随机样本 因此一样的零假设。样本大小也是如此 、24和26所示。他们的 也值导致的拒绝零假设。再次的诱惑是伟大的在这些情况下报告的一个重要结果,选择样本大小16日,23日,24日,或者26日我们有意义 值。这将再次意味着有效信息被删除;这是不能接受的。相比之下,如果 从所有次级样本值被认为是,似乎有可能不能拒绝零假设,我们将在下面进行讨论。

最后一个例子应该澄清情况进一步指出:“真正的”价值,二项分布的随机值创建 。的 值相应的随机样本的大小 。零假设因此不可以拒绝在5%的显著性水平。由此产生的图像 部分样品的 值图中可以看到3

从样本的大小 以后几乎所有的 值,直到 小于水平的意义。只有当 值大于0.05。在这种情况下,与前面的例子,它将不可能拒绝零假设的样本大小 当我们有一个 值为0.062,大于水平的意义。也是同样的道理 。在这个例子中,使用 值将导致正确的结果,即拒绝零假设。

因此,我们可以得出以下结论。如果只是一个惯例 价值 计算,不能拒绝零假设的三个例子中,尽管这个决定是错误的在两个三个的情况。决定完全基于随机样本的显著性检验,完整的样本大小 ,不考虑所有可用的信息。失踪一个全面的给出任何随机样本的照片吗 部分样本的 值显示在上面的例子和图表。仍悬而未决的问题是如何根据附加信息,我们能数值区分显著拒绝零假设的或nonrejection ?

3所示。引导

一种方法包括额外的部分示例中给出的信息 价值观是引导方法(6]。这种方法不需要特定类型的 值分布,仍然允许的估计 价值的未知分布函数包括均值和方差。因此,未知的“真正”的置信区间 值也可以确定,它不仅包含关于样品的信息 ,但也对其 部分样品。

在第一个例子给这里的“真”值 ,它创建了一个随机样本的大小 。在这个示例零假设 不能被拒绝在5%的显著性水平。的 值这个样本大小等于0.100。如果一个不仅获得以下结果来自样本大小的信息 考虑,但也从 部分样品计算的引导方法。

可以拒绝零假设的样本来自人口 。这个样例的结果的概率,如果零假设是有效的不再是0.100但是= 0.044。引导的平均值和标准偏差的分布 值是 ,

在第二个例子中“真”值 ,它创建了一个随机样本的大小 ,一样的零假设。在这种情况下,零假设 不能被拒绝在5%的显著性水平。的 值这个样本大小等于0.100。如果一个不仅获得以下结果来自样本大小的信息 考虑到也是的 部分样品计算的引导方法。

不能拒绝零假设,样本来自人口 。这个样例的结果的概率如果零假设有效已经上升到0.1479。引导的平均值和标准偏差的分布 值是 ,

在最后一个例子是“真正”的价值 。的样本大小 ,零假设 不能被拒绝在5%的显著性水平。的 值这个样本大小等于0.100。然而,如果一个人,不仅来自样本大小的信息 考虑,但也从 其他样本大小的引导方法,然后可以拒绝零假设。

这个样例的结果的概率如果零假设是有效的= 0.0448。引导的平均值和标准偏差的分布 值是 ,

通常与我们的例子中,一个不知道的“真正”的价值 的帮助下,创建一个随机发生器,我们每一个二项分布的随机样本。我们的目的是估计的“真正”的价值 在我们的样本。不玩滚是否我们正在处理一个测试问题 或者我们看著名的零假设等参数为例,

4所示。讨论

因此,经典的显著性检验应该导致一个结果是“不重要的”,这并不一定意味着我们的分析已经结束了(不过也不一定表明一个“重大”的结果)。的 值可以大大修改经典意义测试的结果作为我们的例子所示。这种显著性检验提供了机会,不仅要提供的信息在一个典型的显著性检验基于随机样本的大小 考虑,但也给了我们额外的信息 的值 部分样本的随机样本。这些值可以被视为实现 的随机变量 (7),他也考虑到 值随机变量但寻求一个不同的目标。根据伯努利大数定律, 将收敛于真实值 值增加 : 引导方法的可能性估计这个随机变量的均值和方差。

测试我们的想法扩展经典意义并不描述序列分析的瓦尔德的序贯概率比检验8),例如,抽样可以停止在达到一定限制的决定。在我们的方法中,样本的大小 是固定的,没有打算停止采样在早期阶段。我们不需要进一步考虑II型错误和相应的效果由于我们的方法依赖于费舍尔模型(3,4)而不是Neyman和皮尔森(9]。根据所需的一个随机样本,随机抽样顺序也是固定的,我们不需要考虑理论上的可能性(二项式系数的总和 分析以上) 部分次级样本。此外,我们的方法并不构成一个典型的多个测试情况。多个测试情况通常需要多个假设的测试。在我们的例子中,我们只测试一个假设,我们的主要目的是改善的估计 值使用部分次级样本数据的信息。在这个意义上我们的方法也可以被视为一个估计问题。

总之,在本文中,我们提出一个考虑信息的显著性检验 部分次级样本值的随机样本。我们表明,额外的使用 值可以大大修改经典意义测试的结果作为一个“扩展的部分数据分析的数据挖掘方法。

附录

实现三个随机样本

(1)示例: (2)示例: (3)示例:

引用

  1. j·科恩,“地球是圆的 p < 0。 ),“美国心理学家卷,49号12日,第1003 - 997页,1994年。视图:谷歌学术搜索
  2. g . Loftus“暴政的假设检验在社会科学中,“当代心理学36卷,第105 - 102页,1991年。视图:谷歌学术搜索
  3. r·a·费雪实验设计(5。,1951;第七版。,1960;8日。,1966)英国爱丁堡,奥利弗和博伊德,1935。
  4. r·a·费雪统计方法和科学推理英国爱丁堡,奥利弗和博伊德,1956。
  5. g .吉仁泽“漫不经心的统计数据”,《科学版,33卷,不。5,587 - 606年,2004页。视图:出版商的网站|谷歌学术搜索
  6. b·埃夫隆和r . Tibshirani介绍了引导1994年,查普曼&大厅/ CRC,。
  7. d .嘘声,i Stefanski。”P值精度和重现性。”美国统计学家,卷65,不。4、213 - 221年,2011页。视图:谷歌学术搜索
  8. a·瓦尔德”顺序统计假设测试。”数理统计年鉴中,16卷,不。2、117 - 186年,1945页。视图:谷歌学术搜索
  9. j . Neyman和e·皮尔森,”问题的最有效的测试统计假设,”英国伦敦皇家学会哲学学报。一个系列卷,231年,第337 - 289页,1933年。视图:谷歌学术搜索

版权©2012 Gerhard Marinell et al。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。


更多相关文章

PDF 下载引用 引用
下载其他格式更多的
订单打印副本订单
的观点1044年
下载768年
引用

相关文章

文章奖:2020年杰出的研究贡献,选择由我们的首席编辑。获奖的文章阅读