我们研究两个示例同质性测试问题,其中一个样本来自人口密度<年代vg height="13.6125" id="M1" style="vertical-align:-2.34499pt;width:27.799999px;" version="1.1" viewbox="0 0 27.799999 13.6125" width="27.799999" xmlns="http://www.w3.org/2000/svg">
(
)
从混合物中,另一个是人口密度与混合<年代vg height="13.6125" id="M2" style="vertical-align:-2.34499pt;width:124.9375px;" version="1.1" viewbox="0 0 124.9375 13.6125" width="124.9375" xmlns="http://www.w3.org/2000/svg">
(
1
−
)
(
)
+
(
)
。这个问题自然来自许多统计应用程序测试等偏微分基因表达微阵列研究为基因突变或基因的研究。半参数的假设下<年代vg height="16.612499" id="M3" style="vertical-align:-2.34499pt;width:107.25px;" version="1.1" viewbox="0 0 107.25 16.612499" width="107.25" xmlns="http://www.w3.org/2000/svg">
(
)
=
(
)
+
,惩罚可以建造经验似然比检验,但其实现受阻,没有可行的算法计算检验统计量也可用在其理论研究成果属性。为了克服这些困难,我们提出一个EM测试基于惩罚经验似然。我们证明他们测试有一个简单的限制卡方分布,我们也证明其竞争测试通过模拟表演。一个真实数据的例子是用来说明提出的方法。
<年代p一个n class="end-abs">
1。介绍
让<年代vg height="13.7625" id="M4" style="vertical-align:-5.41734pt;width:65.262497px;" version="1.1" viewbox="0 0 65.262497 13.7625" width="65.262497" xmlns="http://www.w3.org/2000/svg">
1
,
…
,
0
是一个随机样本的人口分布函数<年代vg height="10.325" id="M5" style="vertical-align:-0.0pt;width:12.05px;" version="1.1" viewbox="0 0 12.05 10.325" width="12.05" xmlns="http://www.w3.org/2000/svg">
,让<年代vg height="13.6375" id="M6" style="vertical-align:-5.32956pt;width:63.5625px;" version="1.1" viewbox="0 0 63.5625 13.6375" width="63.5625" xmlns="http://www.w3.org/2000/svg">
1
,
…
,
1
是一个随机样本的人口分布函数<年代vg height="10.325" id="M7" style="vertical-align:-0.0pt;width:15.175px;" version="1.1" viewbox="0 0 15.175 10.325" width="15.175" xmlns="http://www.w3.org/2000/svg">
。测试两个种群是否有相同的分布,也就是说,<年代vg height="14.3875" id="M8" style="vertical-align:-3.25793pt;width:80.625px;" version="1.1" viewbox="0 0 80.625 14.3875" width="80.625" xmlns="http://www.w3.org/2000/svg">
0
∶
=
与<年代vg height="14.375" id="M9" style="vertical-align:-3.13504pt;width:79.425003px;" version="1.1" viewbox="0 0 79.425003 14.375" width="79.425003" xmlns="http://www.w3.org/2000/svg">
1
∶
≠
,都<年代vg height="10.325" id="M10" style="vertical-align:-0.0pt;width:12.05px;" version="1.1" viewbox="0 0 12.05 10.325" width="12.05" xmlns="http://www.w3.org/2000/svg">
和<年代vg height="10.325" id="M11" style="vertical-align:-0.0pt;width:15.175px;" version="1.1" viewbox="0 0 15.175 10.325" width="15.175" xmlns="http://www.w3.org/2000/svg">
完全不明,需要一个非参数检验。自<年代vg height="14.375" id="M12" style="vertical-align:-3.13504pt;width:84.625px;" version="1.1" viewbox="0 0 84.625 14.375" width="84.625" xmlns="http://www.w3.org/2000/svg">
1
∶
≠
是一个非常广泛的假设,很多时候一个可能需要考虑一些指定的选择,例如,只两个种群在不同的位置。在本文中,我们将考虑一个指定替代的两个样品的混合结构。更具体地说,我们有<年代p一个n class="equation" id="EEq1">
1
,
…
,
0
我
。
我
。
d
。
∼
(
)
,
1
,
…
,
1
我
。
我
。
d
。
∼
ℎ
(
)
=
(
1
−
)
(
)
+
(
)
,
(
1
。
1
)
在哪里<年代vg height="13.6125" id="M14" style="vertical-align:-2.34499pt;width:105.425px;" version="1.1" viewbox="0 0 105.425 13.6125" width="105.425" xmlns="http://www.w3.org/2000/svg">
(
)
=
(
)
/
,<年代vg height="13.6125" id="M15" style="vertical-align:-2.34499pt;width:103.725px;" version="1.1" viewbox="0 0 103.725 13.6125" width="103.725" xmlns="http://www.w3.org/2000/svg">
(
)
=
(
)
/
,<年代vg height="13.6625" id="M16" style="vertical-align:-2.29482pt;width:107.225px;" version="1.1" viewbox="0 0 107.225 13.6625" width="107.225" xmlns="http://www.w3.org/2000/svg">
ℎ
(
)
=
(
)
/
,<年代vg height="13.45" id="M17" style="vertical-align:-2.21957pt;width:60.512501px;" version="1.1" viewbox="0 0 60.512501 13.45" width="60.512501" xmlns="http://www.w3.org/2000/svg">
∈
(
0
,
1
)
是有时被称为污染比例未知参数。兴趣是测试的问题<年代vg height="14.8625" id="M18" style="vertical-align:-3.25793pt;width:73.612503px;" version="1.1" viewbox="0 0 73.612503 14.8625" width="73.612503" xmlns="http://www.w3.org/2000/svg">
0
∶
=
ℎ
或者同样的<年代vg height="10.9375" id="M19" style="vertical-align:-0.20064pt;width:35.787498px;" version="1.1" viewbox="0 0 35.787498 10.9375" width="35.787498" xmlns="http://www.w3.org/2000/svg">
=
0
。这个特殊的两个示例问题自然等各种统计应用程序测试偏微分在微阵列基因表达研究中,基因突变的基因研究,病例对照研究污染控制,或治疗效果的测试在nonresponders在生物实验中(见秦和梁<一个href="#B14">1一个>]详情)。
gydF4y2Ba如果没有辅助信息是可用的,这只是通常的两个示例拟合优度的问题。已经有大量的文献;看到张(<一个href="#B16">2一个>)和引用。然而,这些测试不适合具体的替代和混合结构可能不如与设计方法的具体选择。在这篇文章中,我们将提出一个经验基于可能性测试程序这个特定混合物替代安德森的半参数的假设下(<一个href="#B2">3一个>]。出于逻辑回归模型,提出的半参数假设安德森(<一个href="#B2">3一个>链接两个分布函数<年代vg height="10.325" id="M20" style="vertical-align:-0.0pt;width:12.05px;" version="1.1" viewbox="0 0 12.05 10.325" width="12.05" xmlns="http://www.w3.org/2000/svg">
和<年代vg height="10.75" id="M21" style="vertical-align:-0.15048pt;width:11.9125px;" version="1.1" viewbox="0 0 11.9125 10.75" width="11.9125" xmlns="http://www.w3.org/2000/svg">
通过以下方程:<年代p一个n class="equation" id="EEq2">
l
o
g
(
)
(
)
=
+
,
(
1
。
2
)
在哪里<年代vg height="7.1750002" id="M23" style="vertical-align:-0.1254pt;width:8.9375px;" version="1.1" viewbox="0 0 8.9375 7.1750002" width="8.9375" xmlns="http://www.w3.org/2000/svg">
和<年代vg height="13.425" id="M24" style="vertical-align:-2.29482pt;width:8.8500004px;" version="1.1" viewbox="0 0 8.8500004 13.425" width="8.8500004" xmlns="http://www.w3.org/2000/svg">
都是未知参数。有很多例子的密度比的对数线性观测。
<年代p一个n class="statement" id="ex1">例1.1。我>年代p一个n>让<年代vg height="10.325" id="M25" style="vertical-align:-0.0pt;width:12.05px;" version="1.1" viewbox="0 0 12.05 10.325" width="12.05" xmlns="http://www.w3.org/2000/svg">
和<年代vg height="10.75" id="M26" style="vertical-align:-0.15048pt;width:11.9125px;" version="1.1" viewbox="0 0 11.9125 10.75" width="11.9125" xmlns="http://www.w3.org/2000/svg">
是二项分布函数<年代vg height="14.6" id="M27" style="vertical-align:-3.13504pt;width:41.875px;" version="1.1" viewbox="0 0 41.875 14.6" width="41.875" xmlns="http://www.w3.org/2000/svg">
(
,
1
)
和二项<年代vg height="14.6" id="M28" style="vertical-align:-3.13504pt;width:41.875px;" version="1.1" viewbox="0 0 41.875 14.6" width="41.875" xmlns="http://www.w3.org/2000/svg">
(
,
2
)
,分别。我们参考密度<年代vg height="13.4875" id="M29" style="vertical-align:-2.34499pt;width:10.675px;" version="1.1" viewbox="0 0 10.675 13.4875" width="10.675" xmlns="http://www.w3.org/2000/svg">
和<年代vg height="9.9375" id="M30" style="vertical-align:-2.34499pt;width:8.4375px;" version="1.1" viewbox="0 0 8.4375 9.9375" width="8.4375" xmlns="http://www.w3.org/2000/svg">
相对应的概率质量函数<年代vg height="10.325" id="M31" style="vertical-align:-0.0pt;width:12.05px;" version="1.1" viewbox="0 0 12.05 10.325" width="12.05" xmlns="http://www.w3.org/2000/svg">
和<年代vg height="10.75" id="M32" style="vertical-align:-0.15048pt;width:11.9125px;" version="1.1" viewbox="0 0 11.9125 10.75" width="11.9125" xmlns="http://www.w3.org/2000/svg">
,分别。然后,<年代p一个n class="equation" id="eq1">
l
o
g
(
)
(
)
=
l
o
g
1
−
2
1
−
1
+
l
o
g
2
1
−
1
1
1
−
2
。
(
1
。
3
)
例1.2。我>年代p一个n>让<年代vg height="10.325" id="M34" style="vertical-align:-0.0pt;width:12.05px;" version="1.1" viewbox="0 0 12.05 10.325" width="12.05" xmlns="http://www.w3.org/2000/svg">
的分布函数<年代vg height="17.674999" id="M35" style="vertical-align:-3.13504pt;width:60.75px;" version="1.1" viewbox="0 0 60.75 17.674999" width="60.75" xmlns="http://www.w3.org/2000/svg">
(
1
,
2
)
和<年代vg height="10.75" id="M36" style="vertical-align:-0.15048pt;width:11.9125px;" version="1.1" viewbox="0 0 11.9125 10.75" width="11.9125" xmlns="http://www.w3.org/2000/svg">
的分布函数<年代vg height="17.674999" id="M37" style="vertical-align:-3.13504pt;width:60.75px;" version="1.1" viewbox="0 0 60.75 17.674999" width="60.75" xmlns="http://www.w3.org/2000/svg">
(
2
,
2
)
。然后,<年代p一个n class="equation" id="eq2">
l
o
g
(
)
=
1
(
)
2
2
2
1
−
2
2
+
1
2
2
−
1
。
(
1
。
4
)
在实践中,一个可能需要某种转换应用到数据(例如,对数变换)为了证明使用半参数模型的假设(<一个href="#EEq2">1.2一个>)。年代p一个n>
例1.3。我>年代p一个n>让<年代vg height="10.325" id="M39" style="vertical-align:-0.0pt;width:12.05px;" version="1.1" viewbox="0 0 12.05 10.325" width="12.05" xmlns="http://www.w3.org/2000/svg">
和<年代vg height="10.75" id="M40" style="vertical-align:-0.15048pt;width:11.9125px;" version="1.1" viewbox="0 0 11.9125 10.75" width="11.9125" xmlns="http://www.w3.org/2000/svg">
的分布函数<年代vg height="17.674999" id="M41" style="vertical-align:-3.13504pt;width:85.9375px;" version="1.1" viewbox="0 0 85.9375 17.674999" width="85.9375" xmlns="http://www.w3.org/2000/svg">
l
o
g
(
1
,
2
)
和<年代vg height="17.674999" id="M42" style="vertical-align:-3.13504pt;width:85.9375px;" version="1.1" viewbox="0 0 85.9375 17.674999" width="85.9375" xmlns="http://www.w3.org/2000/svg">
l
o
g
(
2
,
2
)
,分别。很明显,密度比是一个线性函数的对数转换数据:<年代p一个n class="equation" id="eq3">
l
o
g
(
)
=
1
(
)
2
2
2
1
−
2
2
+
1
2
2
−
1
l
o
g
。
(
1
。
5
)
例1.4。我>年代p一个n>让<年代vg height="10.325" id="M44" style="vertical-align:-0.0pt;width:12.05px;" version="1.1" viewbox="0 0 12.05 10.325" width="12.05" xmlns="http://www.w3.org/2000/svg">
和<年代vg height="10.75" id="M45" style="vertical-align:-0.15048pt;width:11.9125px;" version="1.1" viewbox="0 0 11.9125 10.75" width="11.9125" xmlns="http://www.w3.org/2000/svg">
的分布函数<年代vg height="14.6" id="M46" style="vertical-align:-3.13504pt;width:97.112503px;" version="1.1" viewbox="0 0 97.112503 14.6" width="97.112503" xmlns="http://www.w3.org/2000/svg">
G
一个
米
米
一个
(
1
,
)
和<年代vg height="14.6" id="M47" style="vertical-align:-3.13504pt;width:97.112503px;" version="1.1" viewbox="0 0 97.112503 14.6" width="97.112503" xmlns="http://www.w3.org/2000/svg">
G
一个
米
米
一个
(
2
,
)
,分别。在这种情况下,<年代p一个n class="equation" id="eq4">
l
o
g
(
)
Γ
(
)
=
l
o
g
1
Γ
2
+
1
−
2
l
o
g
+
2
−
1
l
o
g
。
(
1
。
6
)
半参数建模假设(<一个href="#EEq2">1.2一个>)是非常灵活的,并没有把任何特定的优势函数形式的限制<年代vg height="13.4875" id="M49" style="vertical-align:-2.34499pt;width:10.675px;" version="1.1" viewbox="0 0 10.675 13.4875" width="10.675" xmlns="http://www.w3.org/2000/svg">
。在这种假设下,提出了各种方法来测试同质性的两个示例问题(见[<一个href="#B14">1一个>,4一个>,5一个>)和引用)。本文增加了文学通过引入一种新型的测试数据是基于经验(可能性<一个href="#B11">6一个>,7一个>]。
gydF4y2Ba经验似然(EL)是一种非参数方法可能性有很多很好的属性并联的可能性方法,例如,range-preserving, transform-respect Bartlett矫正和系统方法,将辅助信息(<一个href="#B8">8一个>- - - - - -<一个href="#B1">11一个>]。一般来说,如果参数是可识别的,经验似然比(ELR)测试卡方极限分布在零假设。然而,对于上述的测试问题,下的参数<年代vg height="14.3875" id="M50" style="vertical-align:-3.25793pt;width:19.862499px;" version="1.1" viewbox="0 0 19.862499 14.3875" width="19.862499" xmlns="http://www.w3.org/2000/svg">
0
不识别,导致一个棘手的零极限分布ELR测试。为了规避这一问题,我们将添加一个点球日志EL惩罚<年代vg height="10.8125" id="M51" style="vertical-align:-0.20064pt;width:8.5749998px;" version="1.1" viewbox="0 0 8.5749998 10.8125" width="8.5749998" xmlns="http://www.w3.org/2000/svg">
太接近于零。工作像一个软阈值,惩罚使大约可识别的参数。凭直觉,处罚(或修改)ELR测试应该恢复卡方极限分布。不幸的是两件事阻碍的直接使用惩罚ELR测试。一个是,我们所知,没有可行的算法计算出处罚ELR检验统计量。另一个是,没有研究渐近性质的处罚ELR测试。因此,一个人不能获得关键值惩罚ELR测试无论通过模拟或渐近分布参考。我们发现他们测试(<一个href="#B5">12一个>,13一个>)基于惩罚EL测试问题是一个很好的解决方案。
gydF4y2Ba本文的其余部分组织如下。节<一个href="#sec2">2一个>介绍ELR和处罚ELR。处罚EL-based EM中给出了测试部分<一个href="#sec3">3一个>。他们测试的一个关键计算问题讨论部分<一个href="#sec4">4一个>。部分<一个href="#sec5">5一个>和<一个href="#sec6">6一个>分别包含一个仿真研究和实际数据的应用程序。为了清楚起见,所有的证据都是推迟到附录。
2。经验似然
让<年代vg height="17.5" id="M52" style="vertical-align:-5.41734pt;width:319.5px;" version="1.1" viewbox="0 0 319.5 17.5" width="319.5" xmlns="http://www.w3.org/2000/svg">
{
1
,
…
,
0
,
0
+
1
,
…
,
}
=
{
1
,
…
,
0
,
1
,
…
,
1
}
表示两个示例数据组合,<年代vg height="12.7375" id="M53" style="vertical-align:-3.25793pt;width:72.650002px;" version="1.1" viewbox="0 0 72.650002 12.7375" width="72.650002" xmlns="http://www.w3.org/2000/svg">
=
0
+
1
。安德森的半参数的假设下(<一个href="#EEq2">1.2一个>两个示例数据(的可能性),<一个href="#EEq1">1.1一个>)是<年代p一个n class="equation" id="eq11">
=
0
=
1
=
0
+
1
1
−
+
+
。
(
2
。
1
)
让<年代vg height="14.7125" id="M55" style="vertical-align:-3.22282pt;width:74.300003px;" version="1.1" viewbox="0 0 74.300003 14.7125" width="74.300003" xmlns="http://www.w3.org/2000/svg">
ℎ
=
(
ℎ
)
,<年代vg height="13" id="M56" style="vertical-align:-1.76814pt;width:75.375px;" version="1.1" viewbox="0 0 75.375 13" width="75.375" xmlns="http://www.w3.org/2000/svg">
ℎ
=
1
,
…
,
。EL只是可能性<年代vg height="10.325" id="M57" style="vertical-align:-0.0pt;width:11.1875px;" version="1.1" viewbox="0 0 11.1875 10.325" width="11.1875" xmlns="http://www.w3.org/2000/svg">
与约束<年代vg height="14.7125" id="M58" style="vertical-align:-3.22282pt;width:41.900002px;" version="1.1" viewbox="0 0 41.900002 14.7125" width="41.900002" xmlns="http://www.w3.org/2000/svg">
ℎ
≥
0
,<年代vg height="17.475" id="M59" style="vertical-align:-3.79959pt;width:78.699997px;" version="1.1" viewbox="0 0 78.699997 17.475" width="78.699997" xmlns="http://www.w3.org/2000/svg">
∑
ℎ
=
1
ℎ
=
1
和<年代vg height="18.424999" id="M60" style="vertical-align:-3.79959pt;width:150.47501px;" version="1.1" viewbox="0 0 150.47501 18.424999" width="150.47501" xmlns="http://www.w3.org/2000/svg">
∑
ℎ
=
1
ℎ
(
+
ℎ
−
1
)
=
0
。相应的log-EL<年代p一个n class="equation" id="eq12">
=
ℎ
=
1
l
o
g
ℎ
+
1
=
1
l
o
g
1
−
+
+
。
(
2
。
2
)
我们有兴趣测试<年代p一个n class="equation" id="EEq3">
0
∶
=
0
o
r
(
,
)
=
(
0
,
0
)
。
(
2
。
3
)
在零假设下,约束<年代vg height="18.424999" id="M63" style="vertical-align:-3.79959pt;width:150.47501px;" version="1.1" viewbox="0 0 150.47501 18.424999" width="150.47501" xmlns="http://www.w3.org/2000/svg">
∑
ℎ
=
1
ℎ
(
+
ℎ
−
1
)
=
0
总是,<年代vg height="17.5875" id="M64" style="vertical-align:-5.44238pt;width:120.1375px;" version="1.1" viewbox="0 0 120.1375 17.5875" width="120.1375" xmlns="http://www.w3.org/2000/svg">
年代
u
p
0
=
−
l
o
g
。在备择假设下,对于任何固定的<年代vg height="13.55" id="M65" style="vertical-align:-2.29482pt;width:49.549999px;" version="1.1" viewbox="0 0 49.549999 13.55" width="49.549999" xmlns="http://www.w3.org/2000/svg">
(
,
,
)
,最大化<年代vg height="10.725" id="M66" style="vertical-align:-0.1254pt;width:5.4124999px;" version="1.1" viewbox="0 0 5.4124999 10.725" width="5.4124999" xmlns="http://www.w3.org/2000/svg">
关于<年代vg height="11.0375" id="M67" style="vertical-align:-3.22282pt;width:14.7px;" version="1.1" viewbox="0 0 14.7 11.0375" width="14.7" xmlns="http://www.w3.org/2000/svg">
ℎ
导致的log-EL功能<年代vg height="13.55" id="M68" style="vertical-align:-2.29482pt;width:49.549999px;" version="1.1" viewbox="0 0 49.549999 13.55" width="49.549999" xmlns="http://www.w3.org/2000/svg">
(
,
,
)
:<年代p一个n class="equation" id="EEq4">
(
,
,
)
=
−
ℎ
=
1
l
o
g
1
+
+
ℎ
−
1
−
l
o
g
+
1
=
1
l
o
g
1
−
+
+
,
(
2
。
4
)
在哪里<年代vg height="13.425" id="M70" style="vertical-align:-2.29482pt;width:7.6750002px;" version="1.1" viewbox="0 0 7.6750002 13.425" width="7.6750002" xmlns="http://www.w3.org/2000/svg">
下面的方程的解:<年代p一个n class="equation" id="EEq5">
ℎ
=
1
+
ℎ
−
1
1
+
+
ℎ
−
1
=
0
。
(
2
。
5
)
因此,埃尔比函数<年代vg height="14.2" id="M72" style="vertical-align:-2.73372pt;width:218.6875px;" version="1.1" viewbox="0 0 218.6875 14.2" width="218.6875" xmlns="http://www.w3.org/2000/svg">
(
,
,
)
=
2
{
(
,
,
)
+
l
o
g
}
和ELR来标示<年代vg height="14.075" id="M73" style="vertical-align:-2.72118pt;width:121.5875px;" version="1.1" viewbox="0 0 121.5875 14.075" width="121.5875" xmlns="http://www.w3.org/2000/svg">
=
年代
u
p
(
,
,
)
。
gydF4y2Ba零假设<年代vg height="14.3875" id="M74" style="vertical-align:-3.25793pt;width:19.862499px;" version="1.1" viewbox="0 0 19.862499 14.3875" width="19.862499" xmlns="http://www.w3.org/2000/svg">
0
适用于<年代vg height="10.9375" id="M75" style="vertical-align:-0.20064pt;width:35.787498px;" version="1.1" viewbox="0 0 35.787498 10.9375" width="35.787498" xmlns="http://www.w3.org/2000/svg">
=
0
不管<年代vg height="13.55" id="M76" style="vertical-align:-2.29482pt;width:34.575001px;" version="1.1" viewbox="0 0 34.575001 13.55" width="34.575001" xmlns="http://www.w3.org/2000/svg">
(
,
)
,或<年代vg height="13.55" id="M77" style="vertical-align:-2.29482pt;width:86.525002px;" version="1.1" viewbox="0 0 86.525002 13.55" width="86.525002" xmlns="http://www.w3.org/2000/svg">
(
,
)
=
(
0
,
0
)
不管<年代vg height="10.8125" id="M78" style="vertical-align:-0.20064pt;width:8.5749998px;" version="1.1" viewbox="0 0 8.5749998 10.8125" width="8.5749998" xmlns="http://www.w3.org/2000/svg">
。这意味着参数<年代vg height="13.55" id="M79" style="vertical-align:-2.29482pt;width:49.549999px;" version="1.1" viewbox="0 0 49.549999 13.55" width="49.549999" xmlns="http://www.w3.org/2000/svg">
(
,
,
)
没有可识别的下<年代vg height="14.3875" id="M80" style="vertical-align:-3.25793pt;width:19.862499px;" version="1.1" viewbox="0 0 19.862499 14.3875" width="19.862499" xmlns="http://www.w3.org/2000/svg">
0
,导致相当复杂ELR的渐近性质。一个可以考虑修改或惩罚似然方法(<一个href="#B4">14一个>)和定义惩罚log-EL函数<年代vg height="14.2" id="M81" style="vertical-align:-2.73372pt;width:197.6375px;" version="1.1" viewbox="0 0 197.6375 14.2" width="197.6375" xmlns="http://www.w3.org/2000/svg">
(
,
,
)
=
(
,
,
)
+
l
o
g
(
)
。相应的处罚EL比率函数<年代p一个n class="equation" id="eq13">
(
,
,
)
=
2
{
(
,
,
)
−
(
1
,
0
,
0
)
}
=
−
2
ℎ
=
1
l
o
g
1
+
+
ℎ
−
1
+
2
1
=
1
l
o
g
1
−
+
+
+
2
l
o
g
(
)
,
(
2
。
6
)
在哪里<年代vg height="13.425" id="M83" style="vertical-align:-2.29482pt;width:7.6750002px;" version="1.1" viewbox="0 0 7.6750002 13.425" width="7.6750002" xmlns="http://www.w3.org/2000/svg">
解决方案(<一个href="#EEq5">2。5一个>)。的罚函数<年代vg height="14.2" id="M84" style="vertical-align:-2.73372pt;width:44.174999px;" version="1.1" viewbox="0 0 44.174999 14.2" width="44.174999" xmlns="http://www.w3.org/2000/svg">
l
o
g
(
)
去<年代vg height="6.8499999" id="M85" style="vertical-align:-0.0pt;width:25.299999px;" version="1.1" viewbox="0 0 25.299999 6.8499999" width="25.299999" xmlns="http://www.w3.org/2000/svg">
−
∞
作为<年代vg height="10.8125" id="M86" style="vertical-align:-0.20064pt;width:8.5749998px;" version="1.1" viewbox="0 0 8.5749998 10.8125" width="8.5749998" xmlns="http://www.w3.org/2000/svg">
接近0。因此,<年代vg height="10.8125" id="M87" style="vertical-align:-0.20064pt;width:8.5749998px;" version="1.1" viewbox="0 0 8.5749998 10.8125" width="8.5749998" xmlns="http://www.w3.org/2000/svg">
是有界的远离0,零假设(<一个href="#EEq3">2。3一个>),那么可以降低到<年代vg height="13.55" id="M88" style="vertical-align:-2.29482pt;width:86.525002px;" version="1.1" viewbox="0 0 86.525002 13.55" width="86.525002" xmlns="http://www.w3.org/2000/svg">
(
,
)
=
(
0
,
0
)
。也就是说,处罚log-EL函数中的参数渐近识别。然而,渐近行为的处罚ELR测试仍是复杂的。同时,惩罚ELR的计算检验统计量是另一个惩罚ELR的实现方法的障碍。没有找到可行的和稳定的算法。EL-based EM测试提出了提供了一个有效的方法来解决这个问题。
3所示。EL-Based EM测试
出于陈和李<一个href="#B5">12一个>和李et al。<一个href="#B10">13一个>),我们提出一个EM测试基于惩罚EL测试假说(<一个href="#EEq3">2。3一个>)。EM迭代测试数据导出。我们首先选择一组有限的<年代vg height="14.6625" id="M89" style="vertical-align:-3.13504pt;width:165.2625px;" version="1.1" viewbox="0 0 165.2625 14.6625" width="165.2625" xmlns="http://www.w3.org/2000/svg">
Λ
=
{
1
,
…
,
}
⊂
(
0
,
1
]
例如,<年代vg height="13.575" id="M90" style="vertical-align:-2.26974pt;width:167.91251px;" version="1.1" viewbox="0 0 167.91251 13.575" width="167.91251" xmlns="http://www.w3.org/2000/svg">
Λ
=
{
0
。
1
,
0
。
2
,
…
,
0
。
9
,
1
。
0
}
,一个正整数<年代vg height="10.325" id="M91" style="vertical-align:-0.0pt;width:13.2875px;" version="1.1" viewbox="0 0 13.2875 10.325" width="13.2875" xmlns="http://www.w3.org/2000/svg">
(一般2或3)。为每一个<年代vg height="12.8875" id="M92" style="vertical-align:-1.76814pt;width:74.625px;" version="1.1" viewbox="0 0 74.625 12.8875" width="74.625" xmlns="http://www.w3.org/2000/svg">
=
1
,
…
,
我们继续下面的步骤。
<年代p一个n class="statement" id="step1">步骤1。我>年代p一个n>让<年代vg height="10.8625" id="M93" style="vertical-align:-0.13794pt;width:35.799999px;" version="1.1" viewbox="0 0 35.799999 10.8625" width="35.799999" xmlns="http://www.w3.org/2000/svg">
=
1
和<年代vg height="21" id="M94" style="vertical-align:-4.74748pt;width:54.587502px;" version="1.1" viewbox="0 0 54.587502 21" width="54.587502" xmlns="http://www.w3.org/2000/svg">
(
)
=
。计算<年代vg height="21.0375" id="M95" style="vertical-align:-4.77898pt;width:244.08749px;" version="1.1" viewbox="0 0 244.08749 21.0375" width="244.08749" xmlns="http://www.w3.org/2000/svg">
(
(
)
,
(
)
)
=
一个
r
g
米
一个
x
,
(
(
)
,
,
)
。年代p一个n>
步骤2。我>年代p一个n>更新<年代vg height="13.55" id="M96" style="vertical-align:-2.29482pt;width:49.549999px;" version="1.1" viewbox="0 0 49.549999 13.55" width="49.549999" xmlns="http://www.w3.org/2000/svg">
(
,
,
)
通过使用下面的算法<年代vg height="10.6875" id="M97" style="vertical-align:-0.0pt;width:37.5px;" version="1.1" viewbox="0 0 37.5 10.6875" width="37.5" xmlns="http://www.w3.org/2000/svg">
−
1
次了。子步骤2.1。我>年代p一个n>计算后验分布,<年代p一个n class="equation" id="eq20">
(
)
=
(
)
e
x
p
(
)
+
(
)
1
−
(
)
+
(
)
e
x
p
(
)
+
(
)
,
=
1
,
…
,
1
,
(
3
。
1
)
和更新<年代vg height="10.8125" id="M99" style="vertical-align:-0.20064pt;width:8.5749998px;" version="1.1" viewbox="0 0 8.5749998 10.8125" width="8.5749998" xmlns="http://www.w3.org/2000/svg">
通过<年代p一个n class="equation" id="eq21">
(
+
1
)
=
一个
r
g
米
一个
x
1
=
1
1
−
(
)
l
o
g
(
1
−
)
+
1
=
1
(
)
l
o
g
(
)
+
l
o
g
(
)
。
(
3
。
2
)
子步骤2.2。我>年代p一个n>更新<年代vg height="13.55" id="M101" style="vertical-align:-2.29482pt;width:34.575001px;" version="1.1" viewbox="0 0 34.575001 13.55" width="34.575001" xmlns="http://www.w3.org/2000/svg">
(
,
)
通过<年代vg height="21.0375" id="M102" style="vertical-align:-4.77898pt;width:265.26251px;" version="1.1" viewbox="0 0 265.26251 21.0375" width="265.26251" xmlns="http://www.w3.org/2000/svg">
(
(
+
1
)
,
(
+
1
)
)
=
一个
r
g
米
一个
x
,
(
(
+
1
)
,
,
)
。年代p一个n>子步骤2.3。我>年代p一个n>让<年代vg height="11.325" id="M103" style="vertical-align:-0.51414pt;width:61.924999px;" version="1.1" viewbox="0 0 61.924999 11.325" width="61.924999" xmlns="http://www.w3.org/2000/svg">
=
+
1
并继续。年代p一个n>
步骤3。我>年代p一个n>定义测试统计数据<年代vg height="21" id="M104" style="vertical-align:-4.74748pt;width:193.425px;" version="1.1" viewbox="0 0 193.425 21" width="193.425" xmlns="http://www.w3.org/2000/svg">
(
)
(
)
=
(
(
)
,
(
)
,
(
)
)
。年代p一个n>
EM检验统计量的定义是<年代p一个n class="equation" id="eq22">
E
米
(
)
=
米
一个
x
(
)
,
=
1
,
…
,
。
(
3
。
3
)
我们拒绝零假设<年代vg height="14.3875" id="M106" style="vertical-align:-3.25793pt;width:19.862499px;" version="1.1" viewbox="0 0 19.862499 14.3875" width="19.862499" xmlns="http://www.w3.org/2000/svg">
0
当他们检验统计量大于临界值由下面的极限分布。
<年代p一个n class="statement" id="thm1">定理3.1。年代p一个n>假设<年代vg height="14.6" id="M107" style="vertical-align:-3.13504pt;width:105.275px;" version="1.1" viewbox="0 0 105.275 14.6" width="105.275" xmlns="http://www.w3.org/2000/svg">
=
1
/
∈
(
0
,
1
)
是一个常数。假设零假设<年代vg height="14.3875" id="M108" style="vertical-align:-3.25793pt;width:19.862499px;" version="1.1" viewbox="0 0 19.862499 14.3875" width="19.862499" xmlns="http://www.w3.org/2000/svg">
0
拥有和<年代vg height="14.7125" id="M109" style="vertical-align:-3.22282pt;width:60.724998px;" version="1.1" viewbox="0 0 60.724998 14.7125" width="60.724998" xmlns="http://www.w3.org/2000/svg">
(
ℎ
)
=
0
和<年代vg height="17.7875" id="M110" style="vertical-align:-3.22282pt;width:147.78751px;" version="1.1" viewbox="0 0 147.78751 17.7875" width="147.78751" xmlns="http://www.w3.org/2000/svg">
V
一个
r
(
ℎ
)
=
2
∈
(
0
,
∞
)
为<年代vg height="13" id="M111" style="vertical-align:-1.76814pt;width:75.375px;" version="1.1" viewbox="0 0 75.375 13" width="75.375" xmlns="http://www.w3.org/2000/svg">
ℎ
=
1
,
…
,
。为<年代vg height="12.8875" id="M112" style="vertical-align:-1.76814pt;width:74.625px;" version="1.1" viewbox="0 0 74.625 12.8875" width="74.625" xmlns="http://www.w3.org/2000/svg">
=
1
,
…
,
和任何固定<年代vg height="10.7375" id="M113" style="vertical-align:-0.13794pt;width:8.6000004px;" version="1.1" viewbox="0 0 8.6000004 10.7375" width="8.6000004" xmlns="http://www.w3.org/2000/svg">
,它认为,我><年代p一个n class="equation" id="eq23">
(
)
−
=
(
1
)
,
(
)
=
−
1
,
(
)
=
−
2
+
−
1
/
2
,
(
3
。
4
)
在哪里<年代vg height="19.4375" id="M115" style="vertical-align:-4.82648pt;width:113.6375px;" version="1.1" viewbox="0 0 113.6375 19.4375" width="113.6375" xmlns="http://www.w3.org/2000/svg">
=
(
1
/
0
)
∑
0
=
1
和<年代vg height="21.25" id="M116" style="vertical-align:-6.3714pt;width:114.3125px;" version="1.1" viewbox="0 0 114.3125 21.25" width="114.3125" xmlns="http://www.w3.org/2000/svg">
=
(
1
/
1
)
∑
1
=
1
。我>年代p一个n>
3.2的话。我>年代p一个n>假设<年代vg height="14.7125" id="M117" style="vertical-align:-3.22282pt;width:50.3125px;" version="1.1" viewbox="0 0 50.3125 14.7125" width="50.3125" xmlns="http://www.w3.org/2000/svg">
ℎ
=
0
只是为了方便目的和不必要的。否则,我们可以代替<年代vg height="13" id="M118" style="vertical-align:-3.22282pt;width:11.95px;" version="1.1" viewbox="0 0 11.95 13" width="11.95" xmlns="http://www.w3.org/2000/svg">
ℎ
和<年代vg height="7.1750002" id="M119" style="vertical-align:-0.1254pt;width:8.9375px;" version="1.1" viewbox="0 0 8.9375 7.1750002" width="8.9375" xmlns="http://www.w3.org/2000/svg">
与<年代vg height="14.7125" id="M120" style="vertical-align:-3.22282pt;width:63px;" version="1.1" viewbox="0 0 63 14.7125" width="63" xmlns="http://www.w3.org/2000/svg">
ℎ
−
(
ℎ
)
和<年代vg height="14.7125" id="M121" style="vertical-align:-3.22282pt;width:68.712502px;" version="1.1" viewbox="0 0 68.712502 14.7125" width="68.712502" xmlns="http://www.w3.org/2000/svg">
+
(
ℎ
)
。我>年代p一个n>
定理3.3。年代p一个n>假设条件的定理<一个href="#thm1">3.1一个>持有和<年代vg height="11.1125" id="M122" style="vertical-align:-0.33858pt;width:38.299999px;" version="1.1" viewbox="0 0 38.299999 11.1125" width="38.299999" xmlns="http://www.w3.org/2000/svg">
1
∈
Λ
。在虚假设条件下(<一个href="#EEq3">2。3一个>),
E
米
(
)
→
2
1
在分布<年代vg height="7.25" id="M124" style="vertical-align:-0.10033pt;width:50.724998px;" version="1.1" viewbox="0 0 50.724998 7.25" width="50.724998" xmlns="http://www.w3.org/2000/svg">
→
∞
。我>年代p一个n>
我们完成这部分额外的评论。
<年代p一个n class="statement" id="rem2">3.4的话。我>年代p一个n>我们指出EM-test还可以推广到更一般的模型等<年代vg height="17.7125" id="M125" style="vertical-align:-3.2316pt;width:244.47501px;" version="1.1" viewbox="0 0 244.47501 17.7125" width="244.47501" xmlns="http://www.w3.org/2000/svg">
l
o
g
(
(
)
/
(
)
)
=
+
1
+
⋯
+
对于一些整数<年代vg height="10.7375" id="M126" style="vertical-align:-0.13794pt;width:8.6000004px;" version="1.1" viewbox="0 0 8.6000004 10.7375" width="8.6000004" xmlns="http://www.w3.org/2000/svg">
或<年代vg height="14.825" id="M127" style="vertical-align:-3.2316pt;width:286.375px;" version="1.1" viewbox="0 0 286.375 14.825" width="286.375" xmlns="http://www.w3.org/2000/svg">
l
o
g
(
(
)
/
(
)
)
=
+
1
1
(
)
+
⋯
+
(
)
与<年代vg height="14.7125" id="M128" style="vertical-align:-3.2316pt;width:29.125px;" version="1.1" viewbox="0 0 29.125 14.7125" width="29.125" xmlns="http://www.w3.org/2000/svg">
(
⋅
)
被了解的功能。年代p一个n>
4所示。计算他们的测试
一个关键步骤的测试程序是最大化<年代vg height="13.55" id="M129" style="vertical-align:-2.29482pt;width:68.75px;" version="1.1" viewbox="0 0 68.75 13.55" width="68.75" xmlns="http://www.w3.org/2000/svg">
(
,
,
)
关于<年代vg height="13.55" id="M130" style="vertical-align:-2.29482pt;width:34.575001px;" version="1.1" viewbox="0 0 34.575001 13.55" width="34.575001" xmlns="http://www.w3.org/2000/svg">
(
,
)
固定<年代vg height="10.8125" id="M131" style="vertical-align:-0.20064pt;width:8.5749998px;" version="1.1" viewbox="0 0 8.5749998 10.8125" width="8.5749998" xmlns="http://www.w3.org/2000/svg">
。在本节中,我们提出一种计算策略提供稳定的解决这个优化问题。在本节中,<年代vg height="10.8125" id="M132" style="vertical-align:-0.20064pt;width:8.5749998px;" version="1.1" viewbox="0 0 8.5749998 10.8125" width="8.5749998" xmlns="http://www.w3.org/2000/svg">
抑制是固定的。
gydF4y2Ba目标函数是<年代vg height="14.6" id="M133" style="vertical-align:-3.13504pt;width:153.7px;" version="1.1" viewbox="0 0 153.7 14.6" width="153.7" xmlns="http://www.w3.org/2000/svg">
(
,
,
)
=
(
∗
,
,
)
在哪里<年代p一个n class="equation" id="EEq6">
(
,
,
)
=
−
2
ℎ
=
1
l
o
g
1
+
+
ℎ
−
1
+
2
1
=
1
l
o
g
1
−
+
+
+
2
l
o
g
(
)
(
4
。
1
)
和<年代vg height="14.6" id="M135" style="vertical-align:-3.13504pt;width:80.1875px;" version="1.1" viewbox="0 0 80.1875 14.6" width="80.1875" xmlns="http://www.w3.org/2000/svg">
∗
=
∗
(
,
)
的解决方案是<年代p一个n class="equation" id="EEq7">
=
−
2
ℎ
=
1
+
ℎ
−
1
1
+
+
ℎ
−
1
=
0
。
(
4
。
2
)
如果<年代vg height="13.55" id="M137" style="vertical-align:-2.29482pt;width:34.575001px;" version="1.1" viewbox="0 0 34.575001 13.55" width="34.575001" xmlns="http://www.w3.org/2000/svg">
(
,
)
是最大的<年代vg height="13.55" id="M138" style="vertical-align:-2.29482pt;width:68.75px;" version="1.1" viewbox="0 0 68.75 13.55" width="68.75" xmlns="http://www.w3.org/2000/svg">
(
,
,
)
通常,它应该满足<年代p一个n class="equation" id="EEq8">
=
−
2
ℎ
=
1
+
ℎ
1
+
+
ℎ
−
1
+
2
1
=
1
+
1
−
+
+
=
0
。
(
4
。
3
)
结合(<一个href="#EEq7">4所示。2一个>)和(<一个href="#EEq8">4所示。3一个>)导致<年代p一个n class="equation" id="EEq9">
1
=
1
=
1
+
1
−
+
+
。
(
4
。
4
)
将这个表达式<年代vg height="13.425" id="M141" style="vertical-align:-2.29482pt;width:7.6750002px;" version="1.1" viewbox="0 0 7.6750002 13.425" width="7.6750002" xmlns="http://www.w3.org/2000/svg">
回(<一个href="#EEq6">4所示。1一个>),我们有一个新的函数<年代p一个n class="equation" id="EEq10">
(
,
)
=
−
2
ℎ
=
1
l
o
g
1
+
+
ℎ
1
−
1
1
=
1
+
1
−
+
+
+
2
1
=
1
l
o
g
1
−
+
+
。
(
4
。
5
)
它可以证实<年代vg height="13.55" id="M143" style="vertical-align:-2.29482pt;width:48.224998px;" version="1.1" viewbox="0 0 48.224998 13.55" width="48.224998" xmlns="http://www.w3.org/2000/svg">
(
,
)
几乎肯定是凹的附近吗<年代vg height="13.45" id="M144" style="vertical-align:-2.21957pt;width:32.674999px;" version="1.1" viewbox="0 0 32.674999 13.45" width="32.674999" xmlns="http://www.w3.org/2000/svg">
(
0
,
0
)
鉴于<年代vg height="10.8125" id="M145" style="vertical-align:-0.20064pt;width:8.5749998px;" version="1.1" viewbox="0 0 8.5749998 10.8125" width="8.5749998" xmlns="http://www.w3.org/2000/svg">
,这意味着最大化<年代vg height="13.55" id="M146" style="vertical-align:-2.29482pt;width:48.224998px;" version="1.1" viewbox="0 0 48.224998 13.55" width="48.224998" xmlns="http://www.w3.org/2000/svg">
(
,
)
关于<年代vg height="13.55" id="M147" style="vertical-align:-2.29482pt;width:34.575001px;" version="1.1" viewbox="0 0 34.575001 13.55" width="34.575001" xmlns="http://www.w3.org/2000/svg">
(
,
)
给出了最大的<年代vg height="13.55" id="M148" style="vertical-align:-2.29482pt;width:68.75px;" version="1.1" viewbox="0 0 68.75 13.55" width="68.75" xmlns="http://www.w3.org/2000/svg">
(
,
,
)
固定<年代vg height="10.8125" id="M149" style="vertical-align:-0.20064pt;width:8.5749998px;" version="1.1" viewbox="0 0 8.5749998 10.8125" width="8.5749998" xmlns="http://www.w3.org/2000/svg">
。方法如下面的稳定性的仿真研究。
5。模拟研究
我们考虑两个模型的例子<一个href="#ex3">1.3一个>和<一个href="#ex4">1.4一个>与<年代vg height="14.6" id="M150" style="vertical-align:-3.13504pt;width:42.474998px;" version="1.1" viewbox="0 0 42.474998 14.6" width="42.474998" xmlns="http://www.w3.org/2000/svg">
1
=
0
,<年代vg height="10.725" id="M151" style="vertical-align:-3.13504pt;width:44.174999px;" version="1.1" viewbox="0 0 44.174999 10.725" width="44.174999" xmlns="http://www.w3.org/2000/svg">
2
=
,<年代vg height="13.9375" id="M152" style="vertical-align:-0.13794pt;width:42.599998px;" version="1.1" viewbox="0 0 42.599998 13.9375" width="42.599998" xmlns="http://www.w3.org/2000/svg">
2
=
1
例如<一个href="#ex3">1.3一个>,
1
=
1
,<年代vg height="10.925" id="M154" style="vertical-align:-3.13504pt;width:47.799999px;" version="1.1" viewbox="0 0 47.799999 10.925" width="47.799999" xmlns="http://www.w3.org/2000/svg">
2
=
,<年代vg height="10.8625" id="M155" style="vertical-align:-0.13794pt;width:35.512501px;" version="1.1" viewbox="0 0 35.512501 10.8625" width="35.512501" xmlns="http://www.w3.org/2000/svg">
=
1
例如<一个href="#ex4">1.4一个>。名义水平的0.01、0.05和0.10。对数变换应用于使用EM测试前的原始数据。最初的设置<年代vg height="13.575" id="M156" style="vertical-align:-2.26974pt;width:130.14999px;" version="1.1" viewbox="0 0 130.14999 13.575" width="130.14999" xmlns="http://www.w3.org/2000/svg">
Λ
=
{
0
。
1
,
0
。
2
,
…
,
1
}
和迭代数<年代vg height="10.9125" id="M157" style="vertical-align:-0.17555pt;width:39.237499px;" version="1.1" viewbox="0 0 39.237499 10.9125" width="39.237499" xmlns="http://www.w3.org/2000/svg">
=
3
用于计算检验统计量。
gydF4y2Ba一个竞争方法用于测试同质性半参数下两个示例模型提出的分数测试秦和梁<一个href="#B14">1一个>]。这种方法是基于<年代vg height="0.125" id="M158" style="vertical-align:-0.0pt;width:5.3375001px;" version="1.1" viewbox="0 0 5.3375001 0.125" width="5.3375001" xmlns="http://www.w3.org/2000/svg">
(
,
)
=
(
,
,
)
|
|
|
=
0
=
1
=
1
+
−
1
,
(
5
。
1
)
在哪里<年代vg height="13.55" id="M160" style="vertical-align:-2.29482pt;width:54.512501px;" version="1.1" viewbox="0 0 54.512501 13.55" width="54.512501" xmlns="http://www.w3.org/2000/svg">
(
,
,
)
经验似然函数给定登录(<一个href="#EEq4">2。4一个>)。让<年代vg height="20.025" id="M161" style="vertical-align:-4.77898pt;width:182.16251px;" version="1.1" viewbox="0 0 182.16251 20.025" width="182.16251" xmlns="http://www.w3.org/2000/svg">
(
1
,
̂
1
)
=
一个
r
g
米
一个
x
,
(
1
,
,
)
。比分检验统计量被定义为<年代vg height="18.125" id="M162" style="vertical-align:-3.25793pt;width:163.28751px;" version="1.1" viewbox="0 0 163.28751 18.125" width="163.28751" xmlns="http://www.w3.org/2000/svg">
1
=
(
1
,
̂
1
)
/
(
1
+
1
/
0
)
,它有一个<年代vg height="19.0375" id="M163" style="vertical-align:-4.22832pt;width:16.924999px;" version="1.1" viewbox="0 0 16.924999 19.0375" width="16.924999" xmlns="http://www.w3.org/2000/svg">
2
1
极限分布在零假设下。
gydF4y2Ba我们比较的EM测试和评分测试错误和权力。我们计算每个方法的类型我错误在虚假设条件下基于20000年重复和替代模型下基于2000年重复。对公平的比较,模拟值用于计算能力至关重要。我们考虑两个样本大小:50和200<年代vg height="12.8875" id="M164" style="vertical-align:-1.76814pt;width:67.887497px;" version="1.1" viewbox="0 0 67.887497 12.8875" width="67.887497" xmlns="http://www.w3.org/2000/svg">
=
1
,
2
,
3
。表<一个href="//www.newsama.com/journals/jps/2012/537474/tab1/" target="_blank">1一个>和<一个href="//www.newsama.com/journals/jps/2012/537474/tab2/" target="_blank">2一个>包含对数正态分布模型和仿真结果表<一个href="//www.newsama.com/journals/jps/2012/537474/tab3/" target="_blank">3一个>和<一个href="//www.newsama.com/journals/jps/2012/537474/tab4/" target="_blank">4一个>γ模型。
结果表明,新兴市场测试和测试得分也有类似的类型我错误。对于这两种方法,我错误类型大于名义水平当样本容量<年代vg height="11.1" id="M190" style="vertical-align:-0.17555pt;width:42.912498px;" version="1.1" viewbox="0 0 42.912498 11.1" width="42.912498" xmlns="http://www.w3.org/2000/svg">
=
5
0
;他们正在接近名义水平当样本容量增加<年代vg height="10.9125" id="M191" style="vertical-align:-0.17555pt;width:50.724998px;" version="1.1" viewbox="0 0 50.724998 10.9125" width="50.724998" xmlns="http://www.w3.org/2000/svg">
=
2
0
0
。对数正态分布模型,两种方法有几乎相同的权力选择接近对方等<年代vg height="13.55" id="M192" style="vertical-align:-2.29482pt;width:36.849998px;" version="1.1" viewbox="0 0 36.849998 13.55" width="36.849998" xmlns="http://www.w3.org/2000/svg">
=
1
;EM测试变得更强大时,替代品是遥远和样本容量增加。在的情况下<年代vg height="11.1" id="M193" style="vertical-align:-0.17555pt;width:42.912498px;" version="1.1" viewbox="0 0 42.912498 11.1" width="42.912498" xmlns="http://www.w3.org/2000/svg">
=
5
0
,<年代vg height="10.9375" id="M194" style="vertical-align:-0.20064pt;width:47.5px;" version="1.1" viewbox="0 0 47.5 10.9375" width="47.5" xmlns="http://www.w3.org/2000/svg">
=
0
。
2
,<年代vg height="13.55" id="M195" style="vertical-align:-2.29482pt;width:36.849998px;" version="1.1" viewbox="0 0 36.849998 13.55" width="36.849998" xmlns="http://www.w3.org/2000/svg">
=
3
,和名义水平0.01,他们有一个测试<年代vg height="11.45" id="M196" style="vertical-align:-0.23825pt;width:27.424999px;" version="1.1" viewbox="0 0 27.424999 11.45" width="27.424999" xmlns="http://www.w3.org/2000/svg">
1
0
%
获得权力与分数测试;获得几乎冲到<年代vg height="11.45" id="M197" style="vertical-align:-0.23825pt;width:27.424999px;" version="1.1" viewbox="0 0 27.424999 11.45" width="27.424999" xmlns="http://www.w3.org/2000/svg">
3
0
%
当<年代vg height="10.9375" id="M198" style="vertical-align:-0.20064pt;width:47.5px;" version="1.1" viewbox="0 0 47.5 10.9375" width="47.5" xmlns="http://www.w3.org/2000/svg">
=
0
。
1
,<年代vg height="13.55" id="M199" style="vertical-align:-2.29482pt;width:36.849998px;" version="1.1" viewbox="0 0 36.849998 13.55" width="36.849998" xmlns="http://www.w3.org/2000/svg">
=
3
,增加样本量<年代vg height="10.9125" id="M200" style="vertical-align:-0.17555pt;width:50.724998px;" version="1.1" viewbox="0 0 50.724998 10.9125" width="50.724998" xmlns="http://www.w3.org/2000/svg">
=
2
0
0
。对于γ模型,他们测试的优点是更加明显。对样本大小<年代vg height="11.1" id="M201" style="vertical-align:-0.17555pt;width:42.912498px;" version="1.1" viewbox="0 0 42.912498 11.1" width="42.912498" xmlns="http://www.w3.org/2000/svg">
=
5
0
到200年,新兴市场的测试比得分更强大的测试。
6。真实的例子
我们应用EM测试程序滥用药物的数据(<一个href="#B15">15一个>在吗啡成瘾大鼠的研究。在这项研究中,大鼠吗啡按一个杆和杆的频率按6天治疗后(self-injection利率)与吗啡作为响应变量记录。数据由杆按五组大鼠的数量:4个治疗组用不同剂量水平和一个生理盐水组(对照组)。
gydF4y2Ba我们分析了响应变量(由老鼠杠杆的数量按)治疗组的第一个剂量水平和对照组。表3的数据列表傅et al。<一个href="#B7">5一个>]。下面嘘声和Browine<一个href="#B3">16一个>和傅et al。<一个href="#B7">5一个>),我们分析转换后的数据,<年代vg height="14.9125" id="M202" style="vertical-align:-3.29552pt;width:84.3125px;" version="1.1" viewbox="0 0 84.3125 14.9125" width="84.3125" xmlns="http://www.w3.org/2000/svg">
l
o
g
1
0
(
+
1
)
与<年代vg height="10.325" id="M203" style="vertical-align:-0.0pt;width:11.6875px;" version="1.1" viewbox="0 0 11.6875 10.325" width="11.6875" xmlns="http://www.w3.org/2000/svg">
被老鼠杠杆的数量按。而不是使用参数模型作为嘘声和Browine<一个href="#B3">16一个>和傅et al。<一个href="#B7">5一个>),我们采用安德森的半参数方法。我们假设在对照组来自于响应变量<年代vg height="13.6125" id="M204" style="vertical-align:-2.34499pt;width:27.799999px;" version="1.1" viewbox="0 0 27.799999 13.6125" width="27.799999" xmlns="http://www.w3.org/2000/svg">
(
)
在治疗组,而响应变量的来源<年代vg height="13.725" id="M205" style="vertical-align:-2.34499pt;width:172.35001px;" version="1.1" viewbox="0 0 172.35001 13.725" width="172.35001" xmlns="http://www.w3.org/2000/svg">
ℎ
(
)
=
(
1
−
)
(
)
+
(
)
与<年代vg height="14.075" id="M206" style="vertical-align:-2.72118pt;width:160.2px;" version="1.1" viewbox="0 0 160.2 14.075" width="160.2" xmlns="http://www.w3.org/2000/svg">
(
)
/
(
)
=
e
x
p
(
+
)
。半参数下的EM测试统计数据测试同质性两个示例模型发现<年代vg height="18.5" id="M207" style="vertical-align:-2.73732pt;width:99.3125px;" version="1.1" viewbox="0 0 99.3125 18.5" width="99.3125" xmlns="http://www.w3.org/2000/svg">
E
米
(
1
)
=
1
4
。
0
9
0
,<年代vg height="18.5" id="M208" style="vertical-align:-2.73732pt;width:99.3125px;" version="1.1" viewbox="0 0 99.3125 18.5" width="99.3125" xmlns="http://www.w3.org/2000/svg">
E
米
(
2
)
=
1
4
。
1
5
0
,<年代vg height="18.5" id="M209" style="vertical-align:-2.73732pt;width:99.3125px;" version="1.1" viewbox="0 0 99.3125 18.5" width="99.3125" xmlns="http://www.w3.org/2000/svg">
E
米
(
3
)
=
1
4
。
1
6
7
。校准的<年代vg height="19.0375" id="M210" style="vertical-align:-4.22832pt;width:16.924999px;" version="1.1" viewbox="0 0 16.924999 19.0375" width="16.924999" xmlns="http://www.w3.org/2000/svg">
2
1
极限分布,<年代vg height="10.325" id="M211" style="vertical-align:-0.0pt;width:16.9625px;" version="1.1" viewbox="0 0 16.9625 10.325" width="16.9625" xmlns="http://www.w3.org/2000/svg">
值都是0.02%左右。我们还应用秦和梁的分数测试(<一个href="#B14">1一个>]。比分检验统计量是9.417的<年代vg height="10.325" id="M212" style="vertical-align:-0.0pt;width:11.75px;" version="1.1" viewbox="0 0 11.75 10.325" width="11.75" xmlns="http://www.w3.org/2000/svg">
校准的值等于0.2%<年代vg height="19.0375" id="M213" style="vertical-align:-4.22832pt;width:16.924999px;" version="1.1" viewbox="0 0 16.924999 19.0375" width="16.924999" xmlns="http://www.w3.org/2000/svg">
2
1
极限分布。我们也用得到的排列方法<年代vg height="10.325" id="M214" style="vertical-align:-0.0pt;width:16.9625px;" version="1.1" viewbox="0 0 16.9625 10.325" width="16.9625" xmlns="http://www.w3.org/2000/svg">
两种类型的测试值。基于50000排列<年代vg height="10.325" id="M215" style="vertical-align:-0.0pt;width:11.75px;" version="1.1" viewbox="0 0 11.75 10.325" width="11.75" xmlns="http://www.w3.org/2000/svg">
的三个新兴市场测试统计值都在0.03%左右,和<年代vg height="10.325" id="M216" style="vertical-align:-0.0pt;width:11.75px;" version="1.1" viewbox="0 0 11.75 10.325" width="11.75" xmlns="http://www.w3.org/2000/svg">
价值的测试分数是0.5%左右。按照傅et al。<一个href="#B7">5一个>),这两种方法都显示明显的治疗效果,同时提出了EM测试有很多有力的证据比得分测试。
附录
证明
定理的证明<一个href="#thm1">3.1一个>和<一个href="#thm2">3.3一个>下面是基于给定的三个前题。引理<一个href="#lem1">. 1一个>评估的最大经验似然估计<年代vg height="7.1750002" id="M217" style="vertical-align:-0.1254pt;width:8.9375px;" version="1.1" viewbox="0 0 8.9375 7.1750002" width="8.9375" xmlns="http://www.w3.org/2000/svg">
和<年代vg height="13.425" id="M218" style="vertical-align:-2.29482pt;width:8.8500004px;" version="1.1" viewbox="0 0 8.8500004 13.425" width="8.8500004" xmlns="http://www.w3.org/2000/svg">
与<年代vg height="10.8125" id="M219" style="vertical-align:-0.20064pt;width:8.5749998px;" version="1.1" viewbox="0 0 8.5749998 10.8125" width="8.5749998" xmlns="http://www.w3.org/2000/svg">
下有界从0零假设。引理<一个href="#lem2">a .一个>表明,EM迭代更新的价值<年代vg height="10.8125" id="M220" style="vertical-align:-0.20064pt;width:8.5749998px;" version="1.1" viewbox="0 0 8.5749998 10.8125" width="8.5749998" xmlns="http://www.w3.org/2000/svg">
的秩序<年代vg height="16.6" id="M221" style="vertical-align:-4.74141pt;width:31.475px;" version="1.1" viewbox="0 0 31.475 16.6" width="31.475" xmlns="http://www.w3.org/2000/svg">
(
1
)
。定理<一个href="#thm1">3.1一个>然后证明了迭代使用前题<一个href="#lem1">. 1一个>和<一个href="#lem2">a .一个>。引理<一个href="#lem3">a .一个>给出了一个近似的处罚ELR任何<年代vg height="10.8125" id="M222" style="vertical-align:-0.20064pt;width:8.5749998px;" version="1.1" viewbox="0 0 8.5749998 10.8125" width="8.5749998" xmlns="http://www.w3.org/2000/svg">
有界从0,基于我们证明定理<一个href="#thm2">3.3一个>。
<年代p一个n class="statement" id="lem1">引理背书的。年代p一个n>假设条件的定理<一个href="#thm1">3.1一个>。让<年代vg height="18.1625" id="M223" style="vertical-align:-1.95624pt;width:60.049999px;" version="1.1" viewbox="0 0 60.049999 18.1625" width="60.049999" xmlns="http://www.w3.org/2000/svg">
∈
(
,
1
]
为一个常数<年代vg height="11.0625" id="M224" style="vertical-align:-0.30096pt;width:34.674999px;" version="1.1" viewbox="0 0 34.674999 11.0625" width="34.674999" xmlns="http://www.w3.org/2000/svg">
>
0
和<年代vg height="21.674999" id="M225" style="vertical-align:-4.77898pt;width:184.85001px;" version="1.1" viewbox="0 0 184.85001 21.674999" width="184.85001" xmlns="http://www.w3.org/2000/svg">
(
,
)
=
一个
r
g
米
一个
x
,
(
,
,
)
。然后,我们有我><年代p一个n class="equation" id="EEq11">
=
−
1
,
=
−
2
+
−
1
/
2
(
一个
。
1
)
与<年代vg height="19.4375" id="M227" style="vertical-align:-4.82648pt;width:103.2375px;" version="1.1" viewbox="0 0 103.2375 19.4375" width="103.2375" xmlns="http://www.w3.org/2000/svg">
=
1
/
0
∑
0
=
1
和<年代vg height="21.25" id="M228" style="vertical-align:-6.3714pt;width:103.9125px;" version="1.1" viewbox="0 0 103.9125 21.25" width="103.9125" xmlns="http://www.w3.org/2000/svg">
=
1
/
1
∑
1
=
1
。我>年代p一个n>
证明。我>年代p一个n>自<年代vg height="17.3375" id="M229" style="vertical-align:-1.29163pt;width:62.512501px;" version="1.1" viewbox="0 0 62.512501 17.3375" width="62.512501" xmlns="http://www.w3.org/2000/svg">
≥
>
0
,参数<年代vg height="13.55" id="M230" style="vertical-align:-2.29482pt;width:34.575001px;" version="1.1" viewbox="0 0 34.575001 13.55" width="34.575001" xmlns="http://www.w3.org/2000/svg">
(
,
)
经验似然比的识别。因此,<年代vg height="18.5875" id="M231" style="vertical-align:-2.29482pt;width:34.575001px;" version="1.1" viewbox="0 0 34.575001 18.5875" width="34.575001" xmlns="http://www.w3.org/2000/svg">
(
,
)
是<年代vg height="20.4125" id="M232" style="vertical-align:-4.08177pt;width:22.4px;" version="1.1" viewbox="0 0 22.4 20.4125" width="22.4" xmlns="http://www.w3.org/2000/svg">
√
一致的真正价值<年代vg height="13.45" id="M233" style="vertical-align:-2.21957pt;width:32.674999px;" version="1.1" viewbox="0 0 32.674999 13.45" width="32.674999" xmlns="http://www.w3.org/2000/svg">
(
0
,
0
)
,也就是说,<年代vg height="19.674999" id="M234" style="vertical-align:-4.74141pt;width:86.012497px;" version="1.1" viewbox="0 0 86.012497 19.674999" width="86.012497" xmlns="http://www.w3.org/2000/svg">
=
(
−
1
/
2
)
和<年代vg height="21.637501" id="M235" style="vertical-align:-4.74141pt;width:85.925003px;" version="1.1" viewbox="0 0 85.925003 21.637501" width="85.925003" xmlns="http://www.w3.org/2000/svg">
=
(
−
1
/
2
)
(<一个href="#B13">10一个>]。以下部分的参数<一个href="#sec4">4一个>,最大的经验似然估计<年代vg height="18.5875" id="M236" style="vertical-align:-2.29482pt;width:34.575001px;" version="1.1" viewbox="0 0 34.575001 18.5875" width="34.575001" xmlns="http://www.w3.org/2000/svg">
(
,
)
应满足(这里<年代vg height="10.8125" id="M237" style="vertical-align:-0.20064pt;width:8.5749998px;" version="1.1" viewbox="0 0 8.5749998 10.8125" width="8.5749998" xmlns="http://www.w3.org/2000/svg">
是抑制<年代vg height="15.975" id="M238" style="vertical-align:-0.20064pt;width:8.5749998px;" version="1.1" viewbox="0 0 8.5749998 15.975" width="8.5749998" xmlns="http://www.w3.org/2000/svg">
)<年代p一个n class="equation" id="EEq12">
,
,
=
−
2
ℎ
=
1
+
ℎ
1
+
+
ℎ
−
1
+
2
1
=
1
+
1
−
+
+
=
0
,
(
一个
。
2
)
,
,
=
−
2
ℎ
=
1
+
ℎ
ℎ
1
+
+
ℎ
−
1
+
2
1
=
1
+
1
−
+
+
=
0
(
一个
。
3
)
与<年代p一个n class="equation" id="EEq14">
1
=
1
=
1
+
1
−
+
+
。
(
一个
。
4
)
应用泰勒展开式的右边(<一个href="#EEq14">各一个>),我们得到<年代p一个n class="equation" id="EEq15">
=
1
+
(
1
)
。
(
一个
。
5
)
进一步应用一阶泰勒展开式(<一个href="#EEq12">a .一个>)和使用(<一个href="#EEq14">各一个>),我们得到<年代p一个n class="equation" id="EEq16">
1
−
+
1
−
ℎ
=
1
ℎ
−
1
1
−
−
1
−
1
=
1
=
(
)
2
+
2
。
(
一个
。
6
)
请注意,这两个<年代vg height="12.325" id="M244" style="vertical-align:-0.1254pt;width:8.9375px;" version="1.1" viewbox="0 0 8.9375 12.325" width="8.9375" xmlns="http://www.w3.org/2000/svg">
和<年代vg height="18.5875" id="M245" style="vertical-align:-2.29482pt;width:8.8500004px;" version="1.1" viewbox="0 0 8.8500004 18.5875" width="8.8500004" xmlns="http://www.w3.org/2000/svg">
的订单<年代vg height="19.674999" id="M246" style="vertical-align:-4.74141pt;width:57.8125px;" version="1.1" viewbox="0 0 57.8125 19.674999" width="57.8125" xmlns="http://www.w3.org/2000/svg">
(
−
1
/
2
)
和这两个<年代vg height="17.475" id="M247" style="vertical-align:-3.79959pt;width:48.737499px;" version="1.1" viewbox="0 0 48.737499 17.475" width="48.737499" xmlns="http://www.w3.org/2000/svg">
∑
ℎ
=
1
ℎ
和<年代vg height="21.25" id="M248" style="vertical-align:-6.3714pt;width:48.137501px;" version="1.1" viewbox="0 0 48.137501 21.25" width="48.137501" xmlns="http://www.w3.org/2000/svg">
∑
1
=
1
有订单<年代vg height="19.674999" id="M249" style="vertical-align:-4.74141pt;width:50.3125px;" version="1.1" viewbox="0 0 50.3125 19.674999" width="50.3125" xmlns="http://www.w3.org/2000/svg">
(
1
/
2
)
。结合(<一个href="#EEq15">本一个>)和(<一个href="#EEq16">要求寄出一个>)的收益率<年代vg height="21.637501" id="M250" style="vertical-align:-4.74141pt;width:157.22501px;" version="1.1" viewbox="0 0 157.22501 21.637501" width="157.22501" xmlns="http://www.w3.org/2000/svg">
1
(
−
1
/
)
=
(
1
)
。因此,<年代vg height="19.674999" id="M251" style="vertical-align:-4.74141pt;width:77.5px;" version="1.1" viewbox="0 0 77.5 19.674999" width="77.5" xmlns="http://www.w3.org/2000/svg">
=
(
−
1
)
。同样,一阶泰勒展开式(<一个href="#EEq12">a .一个>)的结果<年代p一个n class="equation" id="EEq17">
0
=
−
ℎ
=
1
ℎ
−
1
−
ℎ
=
1
ℎ
−
1
−
ℎ
=
1
2
ℎ
+
1
=
1
+
1
−
1
=
1
+
1
−
1
=
1
2
+
(
)
2
+
2
。
(
一个
。
7
)
与同样的推理<年代vg height="12.325" id="M253" style="vertical-align:-0.1254pt;width:8.9375px;" version="1.1" viewbox="0 0 8.9375 12.325" width="8.9375" xmlns="http://www.w3.org/2000/svg">
,它遵循从(<一个href="#EEq17">A.7一个>),
1
1
−
1
2
−
1
1
−
2
=
1
=
1
−
1
ℎ
=
1
ℎ
+
1
/
2
。
(
一个
。
8
)
一些代数后,我们有<年代vg height="21.637501" id="M255" style="vertical-align:-4.74141pt;width:182.175px;" version="1.1" viewbox="0 0 182.175 21.637501" width="182.175" xmlns="http://www.w3.org/2000/svg">
=
(
−
)
/
(
2
)
+
(
−
1
/
2
)
,完成了证明。年代p一个n>
假设<年代vg height="15.975" id="M256" style="vertical-align:-0.20064pt;width:8.5749998px;" version="1.1" viewbox="0 0 8.5749998 15.975" width="8.5749998" xmlns="http://www.w3.org/2000/svg">
,<年代vg height="12.325" id="M257" style="vertical-align:-0.1254pt;width:8.9375px;" version="1.1" viewbox="0 0 8.9375 12.325" width="8.9375" xmlns="http://www.w3.org/2000/svg">
,<年代vg height="18.5875" id="M258" style="vertical-align:-2.29482pt;width:8.8500004px;" version="1.1" viewbox="0 0 8.8500004 18.5875" width="8.8500004" xmlns="http://www.w3.org/2000/svg">
在引理给出的属性<一个href="#lem1">. 1一个>。为<年代vg height="14.6" id="M259" style="vertical-align:-3.13504pt;width:78.525002px;" version="1.1" viewbox="0 0 78.525002 14.6" width="78.525002" xmlns="http://www.w3.org/2000/svg">
=
1
,
…
,
1
,让<年代vg height="21.674999" id="M260" style="vertical-align:-4.77652pt;width:298.92499px;" version="1.1" viewbox="0 0 298.92499 21.674999" width="298.92499" xmlns="http://www.w3.org/2000/svg">
=
e
x
p
(
+
)
/
(
1
−
+
e
x
p
(
+
)
)
。更新后的值<年代vg height="10.8125" id="M261" style="vertical-align:-0.20064pt;width:8.5749998px;" version="1.1" viewbox="0 0 8.5749998 10.8125" width="8.5749998" xmlns="http://www.w3.org/2000/svg">
是<年代p一个n class="equation" id="eq26">
∗
=
一个
r
g
米
一个
x
1
=
1
1
−
l
o
g
(
1
−
)
+
1
=
1
l
o
g
(
)
+
l
o
g
(
)
。
(
一个
。
9
)
可以验证,关闭表单<年代vg height="17.025" id="M263" style="vertical-align:-0.20064pt;width:14.925px;" version="1.1" viewbox="0 0 14.925 17.025" width="14.925" xmlns="http://www.w3.org/2000/svg">
∗
是由<年代vg height="24.7125" id="M264" style="vertical-align:-6.3714pt;width:194.875px;" version="1.1" viewbox="0 0 194.875 24.7125" width="194.875" xmlns="http://www.w3.org/2000/svg">
∗
=
(
1
/
(
1
∑
+
1
)
)
(
1
=
1
+
1
)
。我们现在只显示上面的迭代变化的价值<年代vg height="10.8125" id="M265" style="vertical-align:-0.20064pt;width:8.5749998px;" version="1.1" viewbox="0 0 8.5749998 10.8125" width="8.5749998" xmlns="http://www.w3.org/2000/svg">
由一个<年代vg height="16.6" id="M266" style="vertical-align:-4.74141pt;width:31.475px;" version="1.1" viewbox="0 0 31.475 16.6" width="31.475" xmlns="http://www.w3.org/2000/svg">
(
1
)
术语。
<年代p一个n class="statement" id="lem2">引理a。年代p一个n>假设条件的引理<一个href="#lem1">. 1一个>持有。然后,<年代vg height="22.6875" id="M267" style="vertical-align:-4.74141pt;width:91.775002px;" version="1.1" viewbox="0 0 91.775002 22.6875" width="91.775002" xmlns="http://www.w3.org/2000/svg">
∗
=
+
(
1
)
。我>年代p一个n>
证明。我>年代p一个n>让<年代vg height="22.012501" id="M268" style="vertical-align:-6.3714pt;width:98.550003px;" version="1.1" viewbox="0 0 98.550003 22.012501" width="98.550003" xmlns="http://www.w3.org/2000/svg">
̂
∑
=
1
=
1
/
1
。根据引理<一个href="#lem1">. 1一个>,
=
(
1
)
和<年代vg height="21.637501" id="M270" style="vertical-align:-4.74141pt;width:59.587502px;" version="1.1" viewbox="0 0 59.587502 21.637501" width="59.587502" xmlns="http://www.w3.org/2000/svg">
=
(
1
)
。应用一阶泰勒展开,我们有<年代p一个n class="equation" id="eq27">
̂
1
=
1
1
=
1
e
x
p
+
1
−
+
e
x
p
+
=
+
(
1
)
+
=
+
(
1
)
。
(
一个
。
1
0
)
一些简单的代数显示工作<年代p一个n class="equation" id="eq28">
∗
−
̂
=
1
−
1
+
1
=
(
1
)
。
(
一个
。
1
1
)
因此,<年代vg height="22.6875" id="M273" style="vertical-align:-4.74141pt;width:91.775002px;" version="1.1" viewbox="0 0 91.775002 22.6875" width="91.775002" xmlns="http://www.w3.org/2000/svg">
∗
=
+
(
1
)
,这就完成了证明。年代p一个n>
定理的证明<一个href="#thm1">3.1一个>。我>年代p一个n>与上述两种技术引理、定理1的证明是一样的在李et al。<一个href="#B10">13一个>),因此省略了。年代p一个n>
下一个引理是技术准备证明定理<一个href="#thm2">3.3一个>。它调查的处罚ELR的渐近逼近<年代vg height="10.8125" id="M274" style="vertical-align:-0.20064pt;width:8.5749998px;" version="1.1" viewbox="0 0 8.5749998 10.8125" width="8.5749998" xmlns="http://www.w3.org/2000/svg">
有界从0。
<年代p一个n class="statement" id="lem3">引理出具。年代p一个n>假设条件的定理<一个href="#thm1">3.1一个>和<年代vg height="18.1625" id="M275" style="vertical-align:-1.95624pt;width:60.049999px;" version="1.1" viewbox="0 0 60.049999 18.1625" width="60.049999" xmlns="http://www.w3.org/2000/svg">
∈
(
,
1
]
对于一些<年代vg height="11.0625" id="M276" style="vertical-align:-0.30096pt;width:34.674999px;" version="1.1" viewbox="0 0 34.674999 11.0625" width="34.674999" xmlns="http://www.w3.org/2000/svg">
>
0
。然后,我><年代p一个n class="equation" id="eq29">
,
,
=
(
1
−
)
−
2
−
2
+
2
l
o
g
+
(
1
)
。
(
一个
。
1
2
)
证明。我>年代p一个n>与引理<一个href="#lem1">. 1一个>,我们有<年代vg height="19.674999" id="M278" style="vertical-align:-4.74141pt;width:77.5px;" version="1.1" viewbox="0 0 77.5 19.674999" width="77.5" xmlns="http://www.w3.org/2000/svg">
=
(
−
1
)
和<年代vg height="21.637501" id="M279" style="vertical-align:-4.74141pt;width:85.925003px;" version="1.1" viewbox="0 0 85.925003 21.637501" width="85.925003" xmlns="http://www.w3.org/2000/svg">
=
(
−
1
/
2
)
。应用二阶泰勒展开<年代vg height="18.5875" id="M280" style="vertical-align:-2.29482pt;width:68.75px;" version="1.1" viewbox="0 0 68.75 18.5875" width="68.75" xmlns="http://www.w3.org/2000/svg">
(
,
,
)
并指出,<年代vg height="16.6" id="M281" style="vertical-align:-4.74141pt;width:130.16251px;" version="1.1" viewbox="0 0 130.16251 16.6" width="130.16251" xmlns="http://www.w3.org/2000/svg">
/
|
(
,
)
=
(
0
,
0
)
=
0
,我们有<年代p一个n class="equation" id="eq30">
,
,
−
=
2
ℎ
=
1
ℎ
+
1
=
1
−
1
−
ℎ
=
1
2
ℎ
−
1
−
1
=
1
2
2
+
2
l
o
g
+
(
1
)
。
(
一个
。
1
3
)
使用(<一个href="#EEq15">本一个>)和事实<年代vg height="19.225" id="M283" style="vertical-align:-4.37755pt;width:60.849998px;" version="1.1" viewbox="0 0 60.849998 19.225" width="60.849998" xmlns="http://www.w3.org/2000/svg">
∑
ℎ
=
1
2
ℎ
/
和<年代vg height="21.7125" id="M284" style="vertical-align:-6.3714pt;width:66.912498px;" version="1.1" viewbox="0 0 66.912498 21.7125" width="66.912498" xmlns="http://www.w3.org/2000/svg">
∑
1
=
1
2
/
1
收敛到<年代vg height="13.9375" id="M285" style="vertical-align:-0.13794pt;width:15.3875px;" version="1.1" viewbox="0 0 15.3875 13.9375" width="15.3875" xmlns="http://www.w3.org/2000/svg">
2
在概率,上述表达式可以简化<年代p一个n class="equation" id="eq31">
,
,
=
2
1
0
−
−
1
0
2
2
2
+
2
l
o
g
+
(
1
)
。
(
一个
。
1
4
)
插入近似<年代vg height="21.637501" id="M287" style="vertical-align:-4.74141pt;width:182.175px;" version="1.1" viewbox="0 0 182.175 21.637501" width="182.175" xmlns="http://www.w3.org/2000/svg">
=
(
−
)
/
(
2
)
+
(
−
1
/
2
)
,我们得到<年代p一个n class="equation" id="eq32">
,
,
=
1
0
−
2
2
+
2
l
o
g
+
(
1
)
=
(
1
−
)
−
2
−
2
+
2
l
o
g
+
(
1
)
。
(
一个
。
1
5
)
这就完成了证明。年代p一个n>
定理的证明<一个href="#thm2">3.3一个>。我>年代p一个n>不失一般性,我们假设<年代vg height="14.6" id="M289" style="vertical-align:-3.13504pt;width:175.6875px;" version="1.1" viewbox="0 0 175.6875 14.6" width="175.6875" xmlns="http://www.w3.org/2000/svg">
0
<
1
<
2
<
⋯
<
=
1
。根据定理<一个href="#thm1">3.1一个>和引理<一个href="#lem3">a .一个>,因为<年代vg height="12.8875" id="M290" style="vertical-align:-1.76814pt;width:74.625px;" version="1.1" viewbox="0 0 74.625 12.8875" width="74.625" xmlns="http://www.w3.org/2000/svg">
=
1
,
…
,
,我们有<年代p一个n class="equation" id="eq33">
(
)
,
(
)
,
(
)
=
(
1
−
)
−
2
−
2
+
2
l
o
g
+
(
1
)
。
(
一个
。
1
6
)
这将导致<年代p一个n class="equation" id="eq34">
E
米
(
)
=
米
一个
x
1
≤
≤
(
)
,
(
)
,
(
)
=
(
1
−
)
−
2
−
2
+
(
1
)
,
(
一个
。
1
7
)
其余部分仍在哪里<年代vg height="16.6" id="M293" style="vertical-align:-4.74141pt;width:31.475px;" version="1.1" viewbox="0 0 31.475 16.6" width="31.475" xmlns="http://www.w3.org/2000/svg">
(
1
)
由于最大接管一个有限集。注意,当<年代vg height="7.1374998" id="M294" style="vertical-align:-0.10033pt;width:7.8874998px;" version="1.1" viewbox="0 0 7.8874998 7.1374998" width="7.8874998" xmlns="http://www.w3.org/2000/svg">
趋于无穷时,<年代vg height="20.4125" id="M295" style="vertical-align:-4.08177pt;width:225.21249px;" version="1.1" viewbox="0 0 225.21249 20.4125" width="225.21249" xmlns="http://www.w3.org/2000/svg">
√
(
−
)
→
(
0
,
2
/
(
(
1
−
)
]
)
在分布。因此,<年代p一个n class="equation" id="eq35">
E
米
(
)
⟶
2
1
(
一个
。
1
8
)
在分布<年代vg height="7.1374998" id="M297" style="vertical-align:-0.10033pt;width:7.8874998px;" version="1.1" viewbox="0 0 7.8874998 7.1374998" width="7.8874998" xmlns="http://www.w3.org/2000/svg">
趋于无穷。这就完成了证明。年代p一个n>