gydF4y2Ba研究了右截尾数据密度函数和危险率函数的核平滑非参数估计问题。这些函数的“经典”固定对称核型估计在内部区域表现良好,但在边界区域存在偏倚问题。在这里,我们提出了新的估计基于伽玛核的密度和危险率函数。该估计器是无偏差的,并实现了最佳的收敛速度的积分均方误差。研究了平均积分平方误差、渐近正态性和迭代对数定律。通过模拟比较了gamma估计与Müller和Wang(1994)提出的不存在边界偏差的密度函数的局部线性估计和危险率估计。
<年代p一个ncl一个年代年代="end-abs">
1.导言 gydF4y2Ba删失数据出现在许多情况下,例如,在医学随访研究中,个体事件时间(称为生存)的发生可能会被另一个竞争事件(称为删失)的先前发生所阻止。在这些研究中,人们的兴趣集中在估计生存时间的潜在密度和/或危险率。使用核平滑方法的非参数估计在统计文献中受到了相当大的关注。估计密度函数和危险率函数的一种流行方法是使用固定对称具有有界支持度和带宽参数的ic核密度。核决定局部邻域的形状,而带宽控制平滑度。为了得到合理的估计量,必须仔细选择这两个参数,核和带宽参数。有关核平滑的综述,请参见罗奇,我们把读者介绍给西尔弗曼[<一个href="#B22">1一个>]还有伊森曼[<一个href="#B7">2一个>]查阅未经审查的资料及Singpurwalla和Wong [<一个href="#B23">3.一个>]、Tanner和Wong[<一个href="#B25">4一个>],Padgett和McNichols[<一个href="#B20">5一个>],米我eln我czuk [<一个href="#B17">6一个>],和Lo等人[<一个href="#B13">7一个>在权利审查的情况下。
gydF4y2Ba从文献中可以看出,核对结果估计的影响小于带宽。然而,当数据的密度函数有界支持时,使用经典核会导致在端点附近有很大偏差的估计量。当很大一部分采样数据存在于边界区域时,偏差问题,也称为边界效应,就成为一个严重的缺陷。事实上,当我们在端点附近估计底层函数时,由于内核的支持超出了数据的可用范围,因此得到的估计器的偏差变得更大。在生存分析中尤其如此,因为生存时间被假定为非负变量。所以,在接近零的地方,密度的对称核估计量和危险函数会低估真实值。
gydF4y2Ba对于未经审查的数据,文献中有几种方法可以克服这一问题,例如舒斯特反射法[<一个href="#B21">8一个>,则为Müller [<一个href="#B18">9一个>, Lejeune和Sarda的局部线性估计[<一个href="#B12">10一个>],Marron和Ruppert的变换方法[<一个href="#B15">11一个>,琼斯的边界核[<一个href="#B8">12一个>琼斯和福斯特[<一个href="#B9">13一个>]局部线性估计是边界核方法的一种特例。边界核方法的主要思想是在边界区域使用自适应核,在内部区域使用固定对称核。对于非负数据,为了克服边界偏差问题,Chen[<一个href="#B3">14一个>]考虑gamma核估计。Jones的仿真结果[<一个href="#B8">12一个>]和陈[<一个href="#B3">14一个>证明了局部线性估计优于Müller的边界核估计[<一个href="#B18">9一个>].为了解决这一问题,Müller和Wang [<一个href="#B19">15一个>提出了一类新的多项式危险率函数边界核估计器,其中核和带宽参数依赖于估计值的点。Hess等[<一个href="#B6">16一个>]通过广泛的模拟研究,数值显示其性能。
gydF4y2Ba在本文中,我们采用伽玛核平滑方法来估计正独立生存数据的边缘密度和风险函数,这两种估计都是右截尾的。我们证明了这两种估计对边界问题都是鲁棒的。我们还建立了积分均方误差、渐近正态性和此外,通过montecarlo研究,研究了两种估计量在不同情况下的有限样本性能。
gydF4y2Ba本文的组织结构如下<一个href="#sec2">2一个>介绍了密度的伽玛核估计和右截尾数据的危险率函数。节<一个href="#sec3">3.一个>,我们建立了伽玛核估计的渐近性质。节<一个href="#sec4">4一个>,我们研究了伽玛核估计的有限样本性质。部分<一个href="#sec5">5一个>提供经典骨髓移植数据的应用。最后一部分是收集证据的附录。
2.方法gydF4y2Ba让<年代vghe我ght="14.3.25"我d="M1" style="vertical-align:-3.20526pt;width:60.724998px;" version="1.1" viewbox="0 0 60.724998 14.325" width="60.724998" xmlns="http://www.w3.org/2000/svg">
1
,
...
,
(存活时间)和<年代vghe我ght="14.425"我d="M2" style="vertical-align:-3.20526pt;width:64.512497px;" version="1.1" viewbox="0 0 64.512497 14.425" width="64.512497" xmlns="http://www.w3.org/2000/svg">
1
,
...
,
(截尾时间)是两个具有分布函数的I.I.D.非负独立随机序列<年代vghe我ght="10.3.25" id="M3" style="vertical-align:-0.0pt;width:12.05px;" version="1.1" viewbox="0 0 12.05 10.325" width="12.05" xmlns="http://www.w3.org/2000/svg">
和<年代vghe我ght="10.75" id="M4" style="vertical-align:-0.15048pt;width:11.9125px;" version="1.1" viewbox="0 0 11.9125 10.75" width="11.9125" xmlns="http://www.w3.org/2000/svg">
,分别。在截尾模型下,而不是观察<年代vghe我ght="14.3.625"我d="M5" style="vertical-align:-3.2316pt;width:12.75px;" version="1.1" viewbox="0 0 12.75 14.3625" width="12.75" xmlns="http://www.w3.org/2000/svg">
,我们观察这一对<年代vghe我ght="14.7125" id="M6" style="vertical-align:-3.2316pt;width:45.299999px;" version="1.1" viewbox="0 0 45.299999 14.7125" width="45.299999" xmlns="http://www.w3.org/2000/svg">
(
,
)
哪里<年代vghe我ght="14.825"我d="M7" style="vertical-align:-3.2316pt;width:109.4625px;" version="1.1" viewbox="0 0 109.4625 14.825" width="109.4625" xmlns="http://www.w3.org/2000/svg">
=
米
我
n
(
,
)
和<年代vghe我ght="14.7125" id="M8" style="vertical-align:-3.2316pt;width:95.599998px;" version="1.1" viewbox="0 0 95.599998 14.7125" width="95.599998" xmlns="http://www.w3.org/2000/svg">
=
(
≤
)
与<年代vghe我ght="13..45"我d="M9" style="vertical-align:-2.21957pt;width:22.5px;" version="1.1" viewbox="0 0 22.5 13.45" width="22.5" xmlns="http://www.w3.org/2000/svg">
(
⋅
)
为指示函数。我们表示<年代vghe我ght="13..4875" id="M10" style="vertical-align:-2.34499pt;width:10.675px;" version="1.1" viewbox="0 0 10.675 13.4875" width="10.675" xmlns="http://www.w3.org/2000/svg">
的密度函数<年代vghe我ght="10.3.25" id="M11" style="vertical-align:-0.0pt;width:12.05px;" version="1.1" viewbox="0 0 12.05 10.325" width="12.05" xmlns="http://www.w3.org/2000/svg">
并通过<年代vghe我ght="13..725"我d="M12" style="vertical-align:-2.34499pt;width:87.087502px;" version="1.1" viewbox="0 0 87.087502 13.725" width="87.087502" xmlns="http://www.w3.org/2000/svg">
ℎ
=
/
(
1
−
)
相应的危险函数。Kaplan和Meier提出的非参数最大似然方法[<一个href="#B10">17一个>]导致了<年代vghe我ght="10.3.25" id="M13" style="vertical-align:-0.0pt;width:12.05px;" version="1.1" viewbox="0 0 12.05 10.325" width="12.05" xmlns="http://www.w3.org/2000/svg">
给予<年代p一个ncl一个年代年代="equation" id="eq1">
⎧
⎪
⎨
⎪
⎩
(
)
=
1
−
∶
1
≤
≤
,
(
)
≤
−
−
+
1
(
)
我
f
<
(
)
1
,
o
t
h
e
r
w
我
年代
e
,
(
2
.
1
)
哪里<年代vghe我ght="16.174999" id="M15" style="vertical-align:-4.68874pt;width:110px;" version="1.1" viewbox="0 0 110 16.174999" width="110" xmlns="http://www.w3.org/2000/svg">
(
1
)
≤
⋯
≤
(
)
和<年代vghe我ght="16.4125" id="M16" style="vertical-align:-4.68874pt;width:73.824997px;" version="1.1" viewbox="0 0 73.824997 16.4125" width="73.824997" xmlns="http://www.w3.org/2000/svg">
(
1
)
,
...
,
(
)
是对应的<年代vghe我ght="14.5875" id="M17" style="vertical-align:-3.2316pt;width:12.0125px;" version="1.1" viewbox="0 0 12.0125 14.5875" width="12.0125" xmlns="http://www.w3.org/2000/svg">
这一估计量为许多作者所研究。作为参考,我们引用了Breslow和Crowley [<一个href="#B2">18一个>王],[<一个href="#B26">19一个>],以及Stute和Wang [<一个href="#B24">20.一个>]在众多作家中,罗和辛格[<一个href="#B14">21一个>]将KM估计器表示为i.i.d.平均过程,剩余阶数可忽略不计。Lo等人对该结果进行了改进[<一个href="#B13">7一个>]并将有助于在本文中建立未审查和审查案件之间的联系。
gydF4y2Ba从现在起,我们将表示给定(子)分布的右端点<年代vghe我ght="10.3.25" id="M18" style="vertical-align:-0.0pt;width:11.1875px;" version="1.1" viewbox="0 0 11.1875 10.325" width="11.1875" xmlns="http://www.w3.org/2000/svg">
通过<年代vghe我ght="14.23.75" id="M19" style="vertical-align:-3.13504pt;width:17.0875px;" version="1.1" viewbox="0 0 17.0875 14.2375" width="17.0875" xmlns="http://www.w3.org/2000/svg">
就是,<年代vghe我ght="14.6625" id="M20" style="vertical-align:-3.13504pt;width:170.575px;" version="1.1" viewbox="0 0 170.575 14.6625" width="170.575" xmlns="http://www.w3.org/2000/svg">
=
年代
u
p
{
≥
0
,
(
)
<
1
}
.我们还将使用符号<年代vghe我ght="15.4875" id="M21" style="vertical-align:-0.0pt;width:11.1875px;" version="1.1" viewbox="0 0 11.1875 15.4875" width="11.1875" xmlns="http://www.w3.org/2000/svg">
对应的生存函数,即:<年代vghe我ght="18.25"我d="M22" style="vertical-align:-2.21957pt;width:96.862503px;" version="1.1" viewbox="0 0 96.862503 18.25" width="96.862503" xmlns="http://www.w3.org/2000/svg">
(
⋅
)
=
1
−
(
⋅
)
.让<年代vghe我ght="10.3.25" id="M23" style="vertical-align:-0.0pt;width:15.175px;" version="1.1" viewbox="0 0 15.175 10.325" width="15.175" xmlns="http://www.w3.org/2000/svg">
为的分布函数<年代vghe我ght="10.3.25" id="M24" style="vertical-align:-0.0pt;width:13.4125px;" version="1.1" viewbox="0 0 13.4125 10.325" width="13.4125" xmlns="http://www.w3.org/2000/svg">
就是,<年代vghe我ght="15.9125" id="M25" style="vertical-align:-0.15048pt;width:60.875px;" version="1.1" viewbox="0 0 60.875 15.9125" width="60.875" xmlns="http://www.w3.org/2000/svg">
=
1.我们认为<年代vghe我ght="14.3.75" id="M26" style="vertical-align:-3.24037pt;width:54.549999px;" version="1.1" viewbox="0 0 54.549999 14.375" width="54.549999" xmlns="http://www.w3.org/2000/svg">
≤
或同等地<年代vghe我ght="14.23.75" id="M27" style="vertical-align:-3.13504pt;width:56.837502px;" version="1.1" viewbox="0 0 56.837502 14.2375" width="56.837502" xmlns="http://www.w3.org/2000/svg">
=
.在本文的其余部分中,除非另有说明,所有的积分都是在区间内进行的<年代vghe我ght="13..125"我d="M28" style="vertical-align:-1.95624pt;width:33.450001px;" version="1.1" viewbox="0 0 33.450001 13.125" width="33.450001" xmlns="http://www.w3.org/2000/svg">
[
0
,
]
哪里<年代vghe我ght="14.23.75" id="M29" style="vertical-align:-3.13504pt;width:45.674999px;" version="1.1" viewbox="0 0 45.674999 14.2375" width="45.674999" xmlns="http://www.w3.org/2000/svg">
=
.基于平滑核技术,我们建议通过定义如下的伽马核估计器来估计密度:<年代p一个ncl一个年代年代="equation" id="EEq1">
(
)
=
(
,
)
(
)
(
)
=
=
1
(
,
)
(
)
,
(
2
.
2
)
在内核<年代vghe我ght="10.3.25" id="M31" style="vertical-align:-0.0pt;width:13.2875px;" version="1.1" viewbox="0 0 13.2875 10.325" width="13.2875" xmlns="http://www.w3.org/2000/svg">
是由<年代p一个ncl一个年代年代="equation" id="EEq2">
(
,
)
(
)
=
(
)
−
1
e
x
p
(
−
/
)
(
)
Γ
(
)
,
⎧
⎪
⎨
⎪
⎩
(
)
=
1
我
f
≥
2
4
2
[
+
1
我
f
∈
0
,
2
)
,
(
2
.
3.
)
权重<年代vghe我ght="14.5"我d="M33" style="vertical-align:-3.2316pt;width:18.525px;" version="1.1" viewbox="0 0 18.525 14.5" width="18.525" xmlns="http://www.w3.org/2000/svg">
这是我的跳跃<年代vghe我ght="15.2875" id="M34" style="vertical-align:-0.17555pt;width:12.05px;" version="1.1" viewbox="0 0 12.05 15.2875" width="12.05" xmlns="http://www.w3.org/2000/svg">
在<年代vghe我ght="14.3.625"我d="M35" style="vertical-align:-3.2316pt;width:16.5px;" version="1.1" viewbox="0 0 16.5 14.3625" width="16.5" xmlns="http://www.w3.org/2000/svg">
为<年代vghe我ght="12.8875" id="M36" style="vertical-align:-1.76814pt;width:71.212502px;" version="1.1" viewbox="0 0 71.212502 12.8875" width="71.212502" xmlns="http://www.w3.org/2000/svg">
=
2
,
...
,
,<年代vghe我ght="14.6875" id="M37" style="vertical-align:-3.20526pt;width:103.65px;" version="1.1" viewbox="0 0 103.65 14.6875" width="103.65" xmlns="http://www.w3.org/2000/svg">
0
<
≡
→
0
为带宽参数。
gydF4y2Ba自然地,我们为风险率提出的伽马核估计<年代vghe我ght="10.95" id="M38" style="vertical-align:-0.1254pt;width:9.1374998px;" version="1.1" viewbox="0 0 9.1374998 10.95" width="9.1374998" xmlns="http://www.w3.org/2000/svg">
ℎ
是<年代p一个ncl一个年代年代="equation" id="EEq3">
ℎ
(
)
=
(
)
.
1
−
(
)
(
2
.
4
)
我们稍后会看到,这些估计量没有边界偏差;这是由于伽玛核是定义在正实数上的事实,因此没有权重被分配到潜在密度和/或危险率函数的支持之外。核的形状和平滑量不仅受带宽参数的控制,而且随函数估计的位置而变化。对于未经审查的资料,陈[<一个href="#B3">14一个>]结果表明,gamma核密度估计在非负核密度估计类中达到了积分均方误差的最优收敛速度。布埃兹马尼和斯加莱特[<一个href="#B1">22一个>]说明了任意紧集上gamma核估计的一致弱相合性,以及平均积分绝对误差的弱收敛性。在下一节中,我们将证明,即使数据被删失,gamma核估计也在内部和边界区域执行。
3.渐近性质gydF4y2Ba在这一节中,我们陈述了密度和危险率函数的核估计的渐近性质。我们从下面的定理开始,它将在本节剩下的部分中扮演重要的角色。为了简洁起见,下面我们用<年代vghe我ght="10.3.25" id="M40" style="vertical-align:-0.0pt;width:13.2875px;" version="1.1" viewbox="0 0 13.2875 10.325" width="13.2875" xmlns="http://www.w3.org/2000/svg">
密度或危险率函数和<年代vghe我ght="19.3.125" id="M41" style="vertical-align:-3.2316pt;width:19.049999px;" version="1.1" viewbox="0 0 19.049999 19.3125" width="19.049999" xmlns="http://www.w3.org/2000/svg">
或者是密度的核估计或者是危险函数。
<年代p一个ncl一个年代s="statement" id="thm1">定理3.1。年代p一个n><我>假定<年代vghe我ght="13..4875" id="M42" style="vertical-align:-2.34499pt;width:10.675px;" version="1.1" viewbox="0 0 10.675 13.4875" width="10.675" xmlns="http://www.w3.org/2000/svg">
是两次连续可微的。如果(我)<年代vghe我ght="18.0875" id="M43" style="vertical-align:-3.20526pt;width:119.8125px;" version="1.1" viewbox="0 0 119.8125 18.0875" width="119.8125" xmlns="http://www.w3.org/2000/svg">
l
o
g
2
/
(
3.
/
2
)
→
0
的积分均方误差<年代vghe我ght="19.3.125" id="M44" style="vertical-align:-3.2316pt;width:19.049999px;" version="1.1" viewbox="0 0 19.049999 19.3125" width="19.049999" xmlns="http://www.w3.org/2000/svg">
是我><年代p一个ncl一个年代年代="equation" id="eq2">
我
米
年代
E
=
2
2
(
)
+
−
1
−
1
/
2
(
)
+
2
+
−
1
−
1
/
2
,
(
3.
.
1
)
密度函数在哪里<年代vghe我ght="10.3.25" id="M46" style="vertical-align:-0.0pt;width:11.625px;" version="1.1" viewbox="0 0 11.625 10.325" width="11.625" xmlns="http://www.w3.org/2000/svg">
和<年代vghe我ght="10.575" id="M47" style="vertical-align:-0.20064pt;width:12.625px;" version="1.1" viewbox="0 0 12.625 10.575" width="12.625" xmlns="http://www.w3.org/2000/svg">
由我><年代p一个ncl一个年代年代="equation" id="eq3">
1
(
)
=
2
(
)
,
1
(
)
=
2
√
−
1
/
2
(
)
,
(
)
(
3.
.
2
)
对于危险率函数<年代vghe我ght="10.3.25" id="M49" style="vertical-align:-0.0pt;width:11.625px;" version="1.1" viewbox="0 0 11.625 10.325" width="11.625" xmlns="http://www.w3.org/2000/svg">
和<年代vghe我ght="10.575" id="M50" style="vertical-align:-0.20064pt;width:12.625px;" version="1.1" viewbox="0 0 12.625 10.575" width="12.625" xmlns="http://www.w3.org/2000/svg">
由我><年代p一个ncl一个年代年代="equation" id="eq4">
ℎ
(
)
=
(
)
(
)
,
ℎ
(
)
=
(
)
2
.
(
)
(
3.
.
3.
)
使渐近解最小的最优带宽参数<年代vghe我ght="19.3.125" id="M52" style="vertical-align:-3.2316pt;width:66.800003px;" version="1.1" viewbox="0 0 66.800003 19.3125" width="66.800003" xmlns="http://www.w3.org/2000/svg">
我
米
年代
E
(
)
是由我><年代p一个ncl一个年代年代="equation" id="eq5">
∗
=
1
4
∫
(
)
∫
(
)
2
/
5
−
2
/
5
,
(
3.
.
4
)
相应的最优渐近积分均方误差为我><年代p一个ncl一个年代年代="equation" id="eq6">
我
米
年代
E
∼
5
4
4
/
5
∫
(
)
4
/
5
∫
(
)
1
/
5
−
4
/
5
.
(
3.
.
5
)
定理<一个href="#thm1">3.1一个>证明了密度函数和危险率函数的核估计是不存在边界偏差的,并给出了最优带宽的理论公式。然而,在实际数据分析中,为了选择合适的带宽,需要使用数据驱动的过程,例如交叉验证、bootstrap或Bouezmarni和Scaillet提出的方法[<一个href="#B1">22一个>].当然,所有这些方法都需要仔细调整以适应审查情况。而且,从(<一个href="#EEq8">A.25一个>)在附录中,gamma核估计的渐近方差的阶数较大<年代vghe我ght="16.625"我d="M55" style="vertical-align:-2.21957pt;width:64.262497px;" version="1.1" viewbox="0 0 64.262497 16.625" width="64.262497" xmlns="http://www.w3.org/2000/svg">
(
−
1
−
1
)
比那些更接近边界<年代vghe我ght="16.625"我d="M56" style="vertical-align:-2.21957pt;width:72.775002px;" version="1.1" viewbox="0 0 72.775002 16.625" width="72.775002" xmlns="http://www.w3.org/2000/svg">
(
−
1
−
1
/
2
)
在室内。然而,定理<一个href="#thm1">3.1一个>结果表明,边界附近方差的增加对平均积分平方误差的影响可以忽略不计,并且伽马核估计器可以获得最佳的积分平方误差收敛率。
gydF4y2Ba下面的命题涉及伽马核估计的渐近正态性。
<年代p一个ncl一个年代s="statement" id="prop1">命题3.2。年代p一个n><我>在定理相同的条件下<一个href="#thm1">3.1一个>.如果(2)<年代vghe我ght="16.75" id="M57" style="vertical-align:-2.21957pt;width:74.612503px;" version="1.1" viewbox="0 0 74.612503 16.75" width="74.612503" xmlns="http://www.w3.org/2000/svg">
5
/
2
=
(
1
)
,那么任何<年代vghe我ght="7.1624999" id="M58" style="vertical-align:-0.11285pt;width:8.7250004px;" version="1.1" viewbox="0 0 8.7250004 7.1624999" width="8.7250004" xmlns="http://www.w3.org/2000/svg">
以致<年代vghe我ght="13..6125" id="M59" style="vertical-align:-2.34499pt;width:55.012501px;" version="1.1" viewbox="0 0 55.012501 13.6125" width="55.012501" xmlns="http://www.w3.org/2000/svg">
(
)
>
0
和<年代vghe我ght="11.93.75" id="M60" style="vertical-align:-1.29163pt;width:39.200001px;" version="1.1" viewbox="0 0 39.200001 11.9375" width="39.200001" xmlns="http://www.w3.org/2000/svg">
≤
,一个我><年代p一个ncl一个年代年代="equation" id="eq7">
1
/
2
1
/
4
(
)
−
(
)
√
∗
(
)
⟶
(
0
,
1
)
,
我
n
d
我
年代
t
r
我
b
u
t
我
o
n
,
(
3.
.
6
)
哪里我><年代p一个ncl一个年代年代="equation" id="eq8">
∗
⎧
⎪
⎨
⎪
⎩
(
)
=
(
)
我
f
⟶
∞
Γ
(
2
+
1
)
−
1
/
2
2
1
+
2
Γ
2
2
√
(
+
1
)
1
/
2
(
)
我
f
⟶
.
(
3.
.
7
)
在下一个命题中,我们建立了gamma核估计的迭代对数定律。让<年代vghe我ght="17.862499" id="M63" style="vertical-align:-3.21404pt;width:224.675px;" version="1.1" viewbox="0 0 224.675 17.862499" width="224.675" xmlns="http://www.w3.org/2000/svg">
Φ
(
,
)
=
2
−
1
−
1
/
2
∗
(
)
l
o
g
l
o
g
(
)
哪里<年代vghe我ght="11.775"我d="M64" style="vertical-align:-0.20064pt;width:18.975px;" version="1.1" viewbox="0 0 18.975 11.775" width="18.975" xmlns="http://www.w3.org/2000/svg">
∗
定义在命题中<一个href="#prop1">3.2一个>.
<年代p一个ncl一个年代s="statement" id="prop2">命题3.3。年代p一个n><我>在定理相同的条件下<一个href="#thm1">3.1一个>.如果,我><年代p一个ncl一个年代年代="list">(3)年代p一个n><年代p一个ncl一个年代s="list-content">
/
→
1
,
一个
年代
,
→
∞
年代
u
c
h
t
h
一个
t
/
→
1
,<年代vghe我ght="18.1"我d="M66" style="vertical-align:-3.21404pt;width:182.7375px;" version="1.1" viewbox="0 0 182.7375 18.1" width="182.7375" xmlns="http://www.w3.org/2000/svg">
2
l
o
g
4
(
)
/
(
)
2
Φ
(
,
)
→
0
.我>年代p一个n>年代pan>(四)年代p一个n><年代p一个ncl一个年代s="list-content">
=
(
l
o
g
l
o
g
(
)
/
)
2
/
5
,我>年代p一个n>年代pan> 然后我><年代p一个ncl一个年代年代="equation" id="EEq4">
l
我
米
年代
u
p
Φ
(
,
)
−
1
/
2
|
|
|
|
(
)
−
(
)
=
1
,
一个
.
年代
.
(
3.
.
8
)
4.模拟结果 gydF4y2Ba本节研究了所提出方法的有限样本性能。考虑了两个模型。<年代p一个ncl一个年代年代="l是t">(一)年代p一个n><年代p一个ncl一个年代s="list-content">模型我>:生存时间服从指数分布,截尾时间服从均匀分布<年代vghe我ght="13..125"我d="M69" style="vertical-align:-1.95624pt;width:31.35px;" version="1.1" viewbox="0 0 31.35 13.125" width="31.35" xmlns="http://www.w3.org/2000/svg">
[
0
,
]
.<年代vghe我ght="7.1875" id="M70" style="vertical-align:-0.13794pt;width:7.3874998px;" version="1.1" viewbox="0 0 7.3874998 7.1875" width="7.3874998" xmlns="http://www.w3.org/2000/svg">
被选为下列方程的解<年代vghe我ght="14.075" id="M71" style="vertical-align:-2.72118pt;width:114.4875px;" version="1.1" viewbox="0 0 114.4875 14.075" width="114.4875" xmlns="http://www.w3.org/2000/svg">
+
e
x
p
(
−
)
=
1
哪里<年代vghe我ght="9.875" id="M72" style="vertical-align:-2.29482pt;width:7.7624998px;" version="1.1" viewbox="0 0 7.7624998 9.875" width="7.7624998" xmlns="http://www.w3.org/2000/svg">
为所需的审查百分比。年代p一个n>年代p一个n>(2)年代p一个n><年代p一个ncl一个年代s="list-content">模型B我>:生存时间服从带尺度参数的威布尔分布<年代vghe我ght="10.8625" id="M73" style="vertical-align:-0.13794pt;width:34.674999px;" version="1.1" viewbox="0 0 34.674999 10.8625" width="34.674999" xmlns="http://www.w3.org/2000/svg">
=
2
和形状参数<年代vghe我ght="10.8625" id="M74" style="vertical-align:-0.13794pt;width:46.900002px;" version="1.1" viewbox="0 0 46.900002 10.8625" width="46.900002" xmlns="http://www.w3.org/2000/svg">
=
1
.
2
截尾时间也由带有形状参数的威布尔分布生成<年代vghe我ght="7.1750002" id="M75" style="vertical-align:-0.1254pt;width:7.9749999px;" version="1.1" viewbox="0 0 7.9749999 7.1750002" width="7.9749999" xmlns="http://www.w3.org/2000/svg">
给出了一个尺度参数<年代vghe我ght="16.83.75" id="M76" style="vertical-align:-2.29482pt;width:88.012497px;" version="1.1" viewbox="0 0 88.012497 16.8375" width="88.012497" xmlns="http://www.w3.org/2000/svg">
(
(
1
−
)
/
)
1
/
.这就保证了审查的程度等于<年代vghe我ght="9.875" id="M77" style="vertical-align:-2.29482pt;width:7.7624998px;" version="1.1" viewbox="0 0 7.7624998 9.875" width="7.7624998" xmlns="http://www.w3.org/2000/svg">
.年代p一个n>年代p一个n>
首先,我们给出了密度估计的结果。为了评估密度函数的gamma核估计器的性能,我们稍后将其与Jones的局部线性估计器进行比较[<一个href="#B8">12一个>]适用于正确的审查案例。局部线性方法是解决边界偏差问题的一种稳健方法。我们考虑不同的样本大小,<年代vghe我ght="13..075" id="M78" style="vertical-align:-1.76814pt;width:148.39999px;" version="1.1" viewbox="0 0 148.39999 13.075" width="148.39999" xmlns="http://www.w3.org/2000/svg">
=
1
2
5
,
2
5
0
,
5
0
0
,
1
0
0
0
.作为估计误差的度量,我们分析了均值和标准差<年代vghe我ght="14.23.75" id="M79" style="vertical-align:-3.13504pt;width:17.2875px;" version="1.1" viewbox="0 0 17.2875 14.2375" width="17.2875" xmlns="http://www.w3.org/2000/svg">
2
规范。
gydF4y2Ba桌子<一个href="http年代://www.newsama.com/journals/jps/2011/937574/tab1/" target="_blank">1一个>和<一个href="http年代://www.newsama.com/journals/jps/2011/937574/tab2/" target="_blank">2一个>分别提供1000次重复得到的平均值和标准差。首先,如预期的那样,当样本量增加时,两个估计量的平均积分平方误差减小;见表<一个href="http年代://www.newsama.com/journals/jps/2011/937574/tab1/" target="_blank">1一个>。这对于模型和所有程度的截尾都是正确的。例如,在模型A中,我们可以看到,使用10%的截尾和伽马核估计器,当样本大小从125到250时,平均误差从0.0117减少到0.0101。请注意<年代vghe我ght="11.45" id="M80" style="vertical-align:-0.23825pt;width:27.424999px;" version="1.1" viewbox="0 0 27.424999 11.45" width="27.424999" xmlns="http://www.w3.org/2000/svg">
5
0
%
在截尾法中,平均误差减小的速率要小得多<年代vghe我ght="11.45" id="M81" style="vertical-align:-0.23825pt;width:27.424999px;" version="1.1" viewbox="0 0 27.424999 11.45" width="27.424999" xmlns="http://www.w3.org/2000/svg">
5
0
%
在A模型的截尾情况下,gamma核估计优于局部线性核估计。第三,对于模型B,当截尾程度增大时,平均积分平方误差随截尾程度增大而增大。事实上,对于模型B,截尾次数的累积分布随着截尾程度的增大而增大<年代vghe我ght="9.875" id="M82" style="vertical-align:-2.29482pt;width:7.7624998px;" version="1.1" viewbox="0 0 7.7624998 9.875" width="7.7624998" xmlns="http://www.w3.org/2000/svg">
增加。这意味着伽马核估计的平均积分平方误差增加。从表<一个href="http年代://www.newsama.com/journals/jps/2011/937574/tab2/" target="_blank">2一个>,可以看出,对于所有的截尾程度,两种模型和两种估计量的方差都随着样本量的增大而减小。对于模型B, gamma核估计量的方差随截尾程度的增加而增大。另一点需要注意的是,对于模型B,在所有情况下,局部线性估计在方差方面都被gamma核估计所控制。对于模型A, gamma核估计量的方差小于局部线性估计量的方差<年代vghe我ght="13..55" id="M83" style="vertical-align:-2.29482pt;width:46.6875px;" version="1.1" viewbox="0 0 46.6875 13.55" width="46.6875" xmlns="http://www.w3.org/2000/svg">
=
0
.
1
和0.25,但不是为了<年代vghe我ght="13..73.75" id="M84" style="vertical-align:-2.29482pt;width:46.6875px;" version="1.1" viewbox="0 0 46.6875 13.7375" width="46.6875" xmlns="http://www.w3.org/2000/svg">
=
0
.
5
.
=
1
2
5
=
2
5
0
=
5
0
0
=
1
0
0
0
模型 %岑 G 噢 G 噢 G 噢 G 噢
一个 10 1.17 1.55 1.01 1.41 0.94 1.34 0.93 1.31
25 1.48 1.96 1.27 1.83 1.24 1.80 1.18 1.77
50 3.15 2.01 3.11 1.95 3.09 1.90 3.06 1.85
B 10 1.08 1.44 0.76 1.02 0.58 0.73 0.44 0.52
25 1.65 3.50 1.56 3.22 1.50 2.99 1.42 2.72
50 3.08 9.26 3.04 9.16 3.02 9.13 2.91 9.40
G:伽马估计量;LL:局部线性估计;模型A:具有均匀截尾时间的指数生存时间;模型B:威布尔存活时间与威布尔审查时间。这些结果是基于1000次重复实验得出的。