gydF4y2Ba摘要本文研究了在使用排序集合样本时,使用双重抽样处理无响应问题的行为。推导了抽样策略的特点。误差的结构产生了研究策略最优性的需要,进行了一系列的蒙特卡罗实验。
<年代p一个nclass="end-abs">
1.导言 gydF4y2Ba通常的调查抽样理论是在假设人口有限的情况下发展起来的<年代vghe我ght="14.6625" id="M1" style="vertical-align:-3.13504pt;width:108.625px;" version="1.1" viewbox="0 0 108.625 14.6625" width="108.625" xmlns="http://www.w3.org/2000/svg">
=
{
1
,
...
,
}
是由可以被完美识别的个体组成的。一个示例<年代vghe我ght="7.1875" id="M2" style="vertical-align:-0.13794pt;width:7px;" version="1.1" viewbox="0 0 7 7.1875" width="7" xmlns="http://www.w3.org/2000/svg">
大小<年代vghe我ght="11.93.75" id="M3" style="vertical-align:-1.29163pt;width:41.987499px;" version="1.1" viewbox="0 0 41.987499 11.9375" width="41.987499" xmlns="http://www.w3.org/2000/svg">
≤
被选中。利息变量<年代vghe我ght="10.3.25" id="M4" style="vertical-align:-0.0pt;width:11.6125px;" version="1.1" viewbox="0 0 11.6125 10.325" width="11.6125" xmlns="http://www.w3.org/2000/svg">
在每个选定的单位中测量。现实生活中的调查应处理缺失观察值的存在。有三种解决方案来应对这一事实:忽略无应答者、对无应答者进行二次抽样或估算缺失值。忽略无应答者是一个危险的决定,对二次抽样是一个保守且昂贵的解决方案解释。插补通常用于补偿项目无响应。有关主题的讨论,请参见Rueda和González[<一个href="#B9">1一个>],辛格[<一个href="#B13">2一个>例如,]。
gydF4y2Ba部分<一个href="#sec2">2一个>提出了选择单个样本时无响应的问题。
gydF4y2Ba我们考虑使用双重抽样来获取辅助变量的信息<年代vghe我ght="10.3.25" id="M5" style="vertical-align:-0.0pt;width:13.4125px;" version="1.1" viewbox="0 0 13.4125 10.325" width="13.4125" xmlns="http://www.w3.org/2000/svg">
.第一个大样本被选择,它被认为是不昂贵的。的值<年代vghe我ght="10.3.25" id="M6" style="vertical-align:-0.0pt;width:13.4125px;" version="1.1" viewbox="0 0 13.4125 10.325" width="13.4125" xmlns="http://www.w3.org/2000/svg">
用于选择排序集样本(RSS),因为使用第一阶段样本中的值对单位进行排序。选择第二个样本提供了来自初步大样本的子样本。关于使用简单随机双样本(SRS)的文献很多。教科书给出了基本理论,见Singh[<一个href="#B13">2一个>]和科克伦[<一个href="#B3">3.一个>].在本文中,我们考虑了一个排序集抽样(RSS)的双重抽样程序。在本节中有介绍<一个href="#sec3">3.一个>一个估算器家族被认为是替代辛格和库马尔的建议的RSS [<一个href="#B12">4一个>].给出了由我们提出的估计量引起的精度增益的表达式。将估计量与简单均值进行比较,并将辛格和库马尔的建议[<一个href="#B12">4一个>].实际数据用于评估第节中人口平均数的这些替代估计器的行为<一个href="#sec4">4一个>.
2.无响应问题:单个示例gydF4y2Ba一些单位拒绝给出该值的真实值可能会导致不响应<年代vghe我ght="10.3.25" id="M7" style="vertical-align:-0.0pt;width:11.6125px;" version="1.1" viewbox="0 0 11.6125 10.325" width="11.6125" xmlns="http://www.w3.org/2000/svg">
或者其他原因。1946年汉森和赫维茨[<一个href="#B5">5一个>]建议在未被调查者中选择一个子样本,参见Cochran [<一个href="#B3">3.一个>].这个特性很大程度上依赖于所提出的子抽样规则。抽样规则是汉森和赫维茨提出的[<一个href="#B5">5一个>],年代r在一个th[6一个>], Bouza [<一个href="#B1">7一个>].无响应的存在解决了这个问题<年代vghe我ght="10.53.75" id="M8" style="vertical-align:-0.16302pt;width:12.8625px;" version="1.1" viewbox="0 0 12.8625 10.5375" width="12.8625" xmlns="http://www.w3.org/2000/svg">
分为两层:<年代vghe我ght="14.8125" id="M9" style="vertical-align:-3.13504pt;width:107.4px;" version="1.1" viewbox="0 0 107.4 14.8125" width="107.4" xmlns="http://www.w3.org/2000/svg">
1
=
{
∈
∣
第一次访问时回复},<年代vghe我ght="15.125"我d="M10" style="vertical-align:-3.13504pt;width:85.087502px;" version="1.1" viewbox="0 0 85.087502 15.125" width="85.087502" xmlns="http://www.w3.org/2000/svg">
2
=
⧵
1
.类似的<年代vghe我ght="7.1875" id="M11" style="vertical-align:-0.13794pt;width:7px;" version="1.1" viewbox="0 0 7 7.1875" width="7" xmlns="http://www.w3.org/2000/svg">
被划分到<年代vghe我ght="11.05" id="M12" style="vertical-align:-3.2316pt;width:11.025px;" version="1.1" viewbox="0 0 11.025 11.05" width="11.025" xmlns="http://www.w3.org/2000/svg">
⊂
,
=
1
,
2
.该程序是一种特殊的双采样设计,使用Hansen-Hurvitz规则(HHR)如下所述。
<年代p一个nclass="statement" id="step1">步骤1。我>年代p一个n>选择一个样本<年代vghe我ght="7.1875" id="M15" style="vertical-align:-0.13794pt;width:7px;" version="1.1" viewbox="0 0 7 7.1875" width="7" xmlns="http://www.w3.org/2000/svg">
从…起<年代vghe我ght="10.53.75" id="M16" style="vertical-align:-0.16302pt;width:12.8625px;" version="1.1" viewbox="0 0 12.8625 10.5375" width="12.8625" xmlns="http://www.w3.org/2000/svg">
使用srswr。年代p一个n>
步骤2。我>年代p一个n>评估<年代vghe我ght="10.3.25" id="M17" style="vertical-align:-0.0pt;width:11.6125px;" version="1.1" viewbox="0 0 11.6125 10.325" width="11.6125" xmlns="http://www.w3.org/2000/svg">
并确定<年代vghe我ght="14.775" id="M18" style="vertical-align:-3.2316pt;width:115px;" version="1.1" viewbox="0 0 115 14.775" width="115" xmlns="http://www.w3.org/2000/svg">
{
∶
∈
1
⊂
1
,我><年代vghe我ght="14.6" id="M19" style="vertical-align:-3.13504pt;width:21.7875px;" version="1.1" viewbox="0 0 21.7875 14.6" width="21.7875" xmlns="http://www.w3.org/2000/svg">
/
1
/
=
1
}
.我>计算<年代p一个nclass="equation" id="EEq2.1">
1
=
∑
1
=
1
1
.
(
2
.
1
)
步骤3。我>年代p一个n>确定<年代vghe我ght="17.825001" id="M22" style="vertical-align:-4.22832pt;width:64.737503px;" version="1.1" viewbox="0 0 64.737503 17.825001" width="64.737503" xmlns="http://www.w3.org/2000/svg">
2
=
2
/
,我><年代vghe我ght="11.0625" id="M23" style="vertical-align:-0.30096pt;width:39.237499px;" version="1.1" viewbox="0 0 39.237499 11.0625" width="39.237499" xmlns="http://www.w3.org/2000/svg">
>
1
;<年代vghe我ght="14.6"我d="M24" style="vertical-align:-3.13504pt;width:60.237499px;" version="1.1" viewbox="0 0 60.237499 14.6" width="60.237499" xmlns="http://www.w3.org/2000/svg">
/
2
/
=
2
与<年代vghe我ght="10.925" id="M25" style="vertical-align:-3.13504pt;width:13.1px;" version="1.1" viewbox="0 0 13.1 10.925" width="13.1" xmlns="http://www.w3.org/2000/svg">
2
=我><年代vghe我ght="14.8125" id="M26" style="vertical-align:-3.13504pt;width:105.55px;" version="1.1" viewbox="0 0 105.55 14.8125" width="105.55" xmlns="http://www.w3.org/2000/svg">
{
∈
∣
∈
2
}
.我>年代p一个n>
步骤4。我>年代p一个n>选择一个子样本<年代vghe我ght="17.825001" id="M27" style="vertical-align:-4.22832pt;width:18.299999px;" version="1.1" viewbox="0 0 18.299999 17.825001" width="18.299999" xmlns="http://www.w3.org/2000/svg">
2
大小<年代vghe我ght="17.825001" id="M28" style="vertical-align:-4.22832pt;width:13.9875px;" version="1.1" viewbox="0 0 13.9875 17.825001" width="13.9875" xmlns="http://www.w3.org/2000/svg">
2
从…起<年代vghe我ght="10.925" id="M29" style="vertical-align:-3.13504pt;width:13.1px;" version="1.1" viewbox="0 0 13.1 10.925" width="13.1" xmlns="http://www.w3.org/2000/svg">
2
使用srswr。年代p一个n>
第5步。我>年代p一个n>评估<年代vghe我ght="10.3.25" id="M30" style="vertical-align:-0.0pt;width:16.825001px;" version="1.1" viewbox="0 0 16.825001 10.325" width="16.825001" xmlns="http://www.w3.org/2000/svg">
在<年代vghe我ght="17.825001" id="M31" style="vertical-align:-4.22832pt;width:13.1px;" version="1.1" viewbox="0 0 13.1 17.825001" width="13.1" xmlns="http://www.w3.org/2000/svg">
2
{
:年代ub>我><年代vgheight="17.825001" id="M33" style="vertical-align:-4.22832pt;width:74.912498px;" version="1.1" viewbox="0 0 74.912498 17.825001" width="74.912498" xmlns="http://www.w3.org/2000/svg">
∈
2
⊂
2
,我><年代vghe我ght="14.6625" id="M34" style="vertical-align:-3.13504pt;width:57.099998px;" version="1.1" viewbox="0 0 57.099998 14.6625" width="57.099998" xmlns="http://www.w3.org/2000/svg">
2
⊂
2
}
.我>计算<年代p一个nclass="equation" id="EEq2.2">
2
=
∑
”
2
=
1
2
.
(
2
.
2
)
步骤6。我>年代p一个n>估计<我><我>μ我><年代p一个nclass="equation" id="EEq2.3">
=
1
1
+
2
2
=
1
1
+
2
2
.
(
2
.
3.
)
注意(<一个href="#EEq2.1">2.1一个>)是从以下各项中选择的srswr样本的平均值:<年代vghe我ght="14.23.75" id="M37" style="vertical-align:-3.13504pt;width:17.237499px;" version="1.1" viewbox="0 0 17.237499 14.2375" width="17.237499" xmlns="http://www.w3.org/2000/svg">
1
,则其期望值为的平均值<年代vghe我ght="10.3.25" id="M38" style="vertical-align:-0.0pt;width:11.6125px;" version="1.1" viewbox="0 0 11.6125 10.325" width="11.6125" xmlns="http://www.w3.org/2000/svg">
在应答层中:<年代vghe我ght="10.725" id="M39" style="vertical-align:-3.13504pt;width:15.2625px;" version="1.1" viewbox="0 0 15.2625 10.725" width="15.2625" xmlns="http://www.w3.org/2000/svg">
1
.我们有条件的期望(<一个href="#EEq2.2">2.2一个>)是<年代p一个nclass="equation" id="EEq2.4">
2
=
∣
2
,
(
2
.
4
)
作为(<一个href="#EEq2.4">2.4一个>)为从无响应地层中选取的SRSWR样本的平均值<年代vghe我ght="14.23.75" id="M41" style="vertical-align:-3.13504pt;width:17.237499px;" version="1.1" viewbox="0 0 17.237499 14.2375" width="17.237499" xmlns="http://www.w3.org/2000/svg">
2
2
∣
=
2
,
(
2
.
5
)
考虑到这一点<年代vghe我ght="14.7125" id="M43" style="vertical-align:-3.2316pt;width:192.71249px;" version="1.1" viewbox="0 0 192.71249 14.7125" width="192.71249" xmlns="http://www.w3.org/2000/svg">
=
1
,
2
(
)
=
/
=
的无偏性<一个href="#EEq2.3">2.3.一个>)很容易得出。
(的方差<一个href="#EEq2.3">2.3.一个>)通过使用以下技巧推断:<年代p一个nclass="equation" id="EEq2.6">
=
1
1
+
2
2
+
2
2
−
2
,
(
2
.
6
)
第一项是的均值<年代vghe我ght="7.1875" id="M45" style="vertical-align:-0.13794pt;width:7px;" version="1.1" viewbox="0 0 7 7.1875" width="7" xmlns="http://www.w3.org/2000/svg">
,则其方差为<我><我>σ<年代up>2/n。我>在第二个任期内,我们有这样的机会<年代p一个nclass="equation" id="eq1">
2
2
−
2
∣
=
2
2
2
−
2
)
−
(
2
−
2
)
∣
2
=
2
2
2
−
2
∣
2
+
2
−
2
∣
2
−
2
2
−
2
2
−
2
.
∣
(
2
.
7
)
固定条件作用<年代vghe我ght="10.925" id="M47" style="vertical-align:-3.13504pt;width:13.9875px;" version="1.1" viewbox="0 0 13.9875 10.925" width="13.9875" xmlns="http://www.w3.org/2000/svg">
2
我们知道第三个任期的期望是<年代vghe我ght="17.887501" id="M48" style="vertical-align:-3.13504pt;width:63.262501px;" version="1.1" viewbox="0 0 63.262501 17.887501" width="63.262501" xmlns="http://www.w3.org/2000/svg">
(
2
−
2
)
2
. 那我们就有了<年代p一个nclass="equation" id="EEq2.7">
2
2
−
2
∣
=
2
2
2
2
2
−
2
2
2
=
2
2
2
2
2
−
1
2
,
2
2
−
2
=
∣
2
(
−
1
)
2
2
.
(
2
.
8
)
因此,(<一个href="#EEq2.3">2.3.一个>)是由众所周知的短语给出的<年代p一个nclass="equation" id="EEq2.9">
=
2
+
2
(
−
1
)
2
2
.
(
2
.
9
)
我们的建议是考虑获取已知变量提供的信息。<年代vghe我ght="10.3.25" id="M51" style="vertical-align:-0.0pt;width:13.4125px;" version="1.1" viewbox="0 0 13.4125 10.325" width="13.4125" xmlns="http://www.w3.org/2000/svg">
使用RSS。
gydF4y2Ba麦金太尔(<一个href="#B8">8一个>]提出了RSS方法。他注意到,相对于srswr而言,使用样本均值的精度存在增益。戴尔和杂乱[<一个href="#B4">9一个>]还有高桥和和木本[<一个href="#B15">10一个>为他的主张提供了数学上的支持。下面的过程提供了RSS选择的描述。
2.1.RSS过程<年代p一个nclass="statement" id="step10">步骤1。我>年代p一个n>随机选择<年代vghe我ght="13..9"我d="M52" style="vertical-align:-0.10033pt;width:17.3125px;" version="1.1" viewbox="0 0 17.3125 13.9" width="17.3125" xmlns="http://www.w3.org/2000/svg">
2
目标人群的单位。年代p一个n>
步骤2。我>年代p一个n>分配<年代vghe我ght="13..9"我d="M53" style="vertical-align:-0.10033pt;width:17.3125px;" version="1.1" viewbox="0 0 17.3125 13.9" width="17.3125" xmlns="http://www.w3.org/2000/svg">
2
尽可能随机地选择单位<年代vghe我ght="7.13.74998" id="M54" style="vertical-align:-0.10033pt;width:11.225px;" version="1.1" viewbox="0 0 11.225 7.1374998" width="11.225" xmlns="http://www.w3.org/2000/svg">
集合,每个大小<年代vghe我ght="7.13.74998" id="M55" style="vertical-align:-0.10033pt;width:11.225px;" version="1.1" viewbox="0 0 11.225 7.1374998" width="11.225" xmlns="http://www.w3.org/2000/svg">
.年代p一个n>
步骤3。我>年代p一个n>在不知道感兴趣变量的任何值的情况下,根据感兴趣变量对每组中的单位进行排序。这可以基于个人专业判断,也可以使用与感兴趣变量相关的伴随变量进行排序。年代p一个n>
步骤4。我>年代p一个n>通过在第一个集合中包含最小的排名单位,在第二个集合中包含第二个最小的排名单位,选择用于实际量化的样本,该过程以这种方式继续,直到从最后一个集合中选择最大的排名单位。年代p一个n>
第5步。我>年代p一个n>重复步骤<一个href="#step10">1一个>通过<一个href="#step40">4一个>为<年代vghe我ght="7.0124998" id="M56" style="vertical-align:-0.0pt;width:6.5px;" version="1.1" viewbox="0 0 6.5 7.0124998" width="6.5" xmlns="http://www.w3.org/2000/svg">
循环以获得一个大小的样本<年代vghe我ght="7.13.74998" id="M57" style="vertical-align:-0.10033pt;width:17.6px;" version="1.1" viewbox="0 0 17.6 7.1374998" width="17.6" xmlns="http://www.w3.org/2000/svg">
实际的量化。年代p一个n>
RSS样本是顺序统计(OS)<年代vghe我ght="16.4125" id="M58" style="vertical-align:-4.68874pt;width:114.1px;" version="1.1" viewbox="0 0 114.1 16.4125" width="114.1" xmlns="http://www.w3.org/2000/svg">
(
1
∶
1
)
,
...
,
(
∶
)
,我>在哪里<年代vghe我ght="13..725" id="M59" style="vertical-align:-2.34499pt;width:47.1875px;" version="1.1" viewbox="0 0 47.1875 13.725" width="47.1875" xmlns="http://www.w3.org/2000/svg">
(
∶
ℎ
)
表示顺序的统计量<年代vghe我ght="12.675" id="M60" style="vertical-align:-2.34499pt;width:7.1374998px;" version="1.1" viewbox="0 0 7.1374998 12.675" width="7.1374998" xmlns="http://www.w3.org/2000/svg">
在<我>h循环中的样本<年代vghe我ght="12.8875" id="M61" style="vertical-align:-1.76814pt;width:69.849998px;" version="1.1" viewbox="0 0 69.849998 12.8875" width="69.849998" xmlns="http://www.w3.org/2000/svg">
=
1
,
...
,
.我>我们有<年代vghe我ght="7.13.74998" id="M62" style="vertical-align:-0.10033pt;width:44.75px;" version="1.1" viewbox="0 0 44.75 7.1374998" width="44.75" xmlns="http://www.w3.org/2000/svg">
=
观察和<年代vghe我ght="7.0124998" id="M63" style="vertical-align:-0.0pt;width:6.5px;" version="1.1" viewbox="0 0 6.5 7.0124998" width="6.5" xmlns="http://www.w3.org/2000/svg">
他们中的一个是<年代vghe我ght="9.9250002" id="M64" style="vertical-align:-0.13794pt;width:4.9875002px;" version="1.1" viewbox="0 0 4.9875002 9.9250002" width="4.9875002" xmlns="http://www.w3.org/2000/svg">
阶统计量(os)<年代vghe我ght="12.8875" id="M65" style="vertical-align:-1.76814pt;width:74.537498px;" version="1.1" viewbox="0 0 74.537498 12.8875" width="74.537498" xmlns="http://www.w3.org/2000/svg">
=
1
,
...
,
.感兴趣变量的均值的RSS估计量<年代vghe我ght="16.475" id="M66" style="vertical-align:-4.74141pt;width:39.5625px;" version="1.1" viewbox="0 0 39.5625 16.475" width="39.5625" xmlns="http://www.w3.org/2000/svg">
,
是<年代p一个nclass="equation" id="EEq2.10">
(
r
年代
年代
)
=
∑
=
1
∑
=
1
(
∶
)
,
(
2
.
1
0
)
它的方差是<年代p一个nclass="equation" id="EEq2.11">
(
r
年代
年代
)
=
∑
=
1
2
(
∶
)
2
=
2
−
∑
=
1
Δ
2
(
∶
)
2
,
(
2
.
1
1
)
在哪里<年代vghe我ght="23..075001" id="M69" style="vertical-align:-7.4624pt;width:31.674999px;" version="1.1" viewbox="0 0 31.674999 23.075001" width="31.674999" xmlns="http://www.w3.org/2000/svg">
2
(
∶
)
=
[
(
∶
)
−
(
[
(
∶
)
)
]
2
和<年代vghe我ght="16.53.75" id="M71" style="vertical-align:-4.68874pt;width:158.8125px;" version="1.1" viewbox="0 0 158.8125 16.5375" width="158.8125" xmlns="http://www.w3.org/2000/svg">
Δ
(
∶
)
=
(
[
(
∶
)
)
]
−
.
gydF4y2Ba第二学期(<一个href="#EEq2.11">2.11一个>)是由于使用RSS代替srswr而获得的精度增益。
Bouza [11一个>]开发了一种RSS替代方案。没有反应<年代vghe我ght="7.1875" id="M72" style="vertical-align:-0.13794pt;width:7px;" version="1.1" viewbox="0 0 7 7.1875" width="7" xmlns="http://www.w3.org/2000/svg">
是<年代vghe我ght="10.925" id="M73" style="vertical-align:-3.13504pt;width:56.9375px;" version="1.1" viewbox="0 0 56.9375 10.925" width="56.9375" xmlns="http://www.w3.org/2000/svg">
2
=
2
.他通过子样本大小得出了这个结论<年代vghe我ght="17.825001" id="M74" style="vertical-align:-4.22832pt;width:71.400002px;" version="1.1" viewbox="0 0 71.400002 17.825001" width="71.400002" xmlns="http://www.w3.org/2000/svg">
2
=
2
/
,我><年代p一个nclass="equation" id="eq2">
2
r
年代
年代
=
∑
=
1
∑
”
=
1
(
∶
”
2
)
2
,
(
2
.
1
2
)
对平均值没有偏见<年代vghe我ght="10.3.25" id="M76" style="vertical-align:-0.0pt;width:11.6125px;" version="1.1" viewbox="0 0 11.6125 10.325" width="11.6125" xmlns="http://www.w3.org/2000/svg">
在nr层。
gydF4y2Ba交叉期望的期望值为零。在这种情况下,RSS是平衡的,我们可以将顺序统计(OS)的方差表示为<年代vghe我ght="10.3.25" id="M77" style="vertical-align:-0.0pt;width:11.6125px;" version="1.1" viewbox="0 0 11.6125 10.325" width="11.6125" xmlns="http://www.w3.org/2000/svg">
在<年代vghe我ght="14.23.75" id="M78" style="vertical-align:-3.13504pt;width:17.237499px;" version="1.1" viewbox="0 0 17.237499 14.2375" width="17.237499" xmlns="http://www.w3.org/2000/svg">
2
,年代ub>我><年代vgheight="18.825001" id="M79" style="vertical-align:-6.53078pt;width:59.900002px;" version="1.1" viewbox="0 0 59.900002 18.825001" width="59.900002" xmlns="http://www.w3.org/2000/svg">
(
(
∶
”
2
)
)
的测量精度增益<年代vghe我ght="20.975" id="M80" style="vertical-align:-5.63791pt;width:37.950001px;" version="1.1" viewbox="0 0 37.950001 20.975" width="37.950001" xmlns="http://www.w3.org/2000/svg">
Δ
2
2
(
)
,
作为<年代p一个nclass="equation" id="eq3">
2
−
2
r
年代
年代
∣
=
2
2
1
2
−
1
2
−
2
=
1
Δ
2
2
(
)
2
2
.
(
2
.
1
3.
)
替换<年代vghe我ght="17.825001" id="M83" style="vertical-align:-4.22832pt;width:79.287498px;" version="1.1" viewbox="0 0 79.287498 17.825001" width="79.287498" xmlns="http://www.w3.org/2000/svg">
2
=
2
/
2
我们获得以下资料:<年代p一个nclass="equation" id="eq4">
2
r
年代
年代
−
2
r
年代
年代
=
∣
2
2
2
−
1
2
−
2
=
1
Δ
2
2
(
∶
2
)
2
2
−
1
2
=
2
.
(
2
.
1
4
)
以RSS估计器为例<年代p一个nclass="equation" id="EEq2.12">
r
年代
年代
=
1
1
r
年代
年代
+
2
2
r
年代
年代
=
1
r
年代
年代
1
+
2
2
r
年代
年代
,
r
年代
年代
=
2
+
2
(
−
1
)
2
2
−
Ψ
(
)
.
(
2
.
1
5
)
由于RSS的使用,在精确度上有了提高<年代p一个nclass="equation" id="eq5">
Ψ
(
)
=
2
⎛
⎜
⎜
⎝
∑
(
−
1
)
2
=
1
Δ
2
2
∶
2
2
⎞
⎟
⎟
⎠
,
(
2
.
1
6
)
在哪里<年代vghe我ght="21.012501" id="M87" style="vertical-align:-5.63791pt;width:173.25px;" version="1.1" viewbox="0 0 173.25 21.012501" width="173.25" xmlns="http://www.w3.org/2000/svg">
Δ
2
2
(
∶
)
=
(
(
(
∶
)
−
)
2
)
是由于第二阶段使用或RSS而获得的精度增益。
3.无响应问题:双重抽样gydF4y2Ba我们将考虑双重抽样用于获取样本<我>*我>从…起<年代vghe我ght="10.53.75" id="M88" style="vertical-align:-0.16302pt;width:12.8625px;" version="1.1" viewbox="0 0 12.8625 10.5375" width="12.8625" xmlns="http://www.w3.org/2000/svg">
使用srswr。一个廉价的变量<年代vghe我ght="10.3.25" id="M89" style="vertical-align:-0.0pt;width:13.4125px;" version="1.1" viewbox="0 0 13.4125 10.325" width="13.4125" xmlns="http://www.w3.org/2000/svg">
是以<我>*我>.<我>X与<年代vghe我ght="10.3.25" id="M90" style="vertical-align:-0.0pt;width:11.6125px;" version="1.1" viewbox="0 0 11.6125 10.325" width="11.6125" xmlns="http://www.w3.org/2000/svg">
我们可以计算它的均值<年代vghe我ght="12.3.125" id="M91" style="vertical-align:-0.11285pt;width:13.925px;" version="1.1" viewbox="0 0 13.925 12.3125" width="13.925" xmlns="http://www.w3.org/2000/svg">
在第一阶段,没有反应。在第二阶段,我们知道<年代vghe我ght="20.725" id="M92" style="vertical-align:-3.80836pt;width:113.625px;" version="1.1" viewbox="0 0 113.625 20.725" width="113.625" xmlns="http://www.w3.org/2000/svg">
∗
∑
=
(
∗
=
1
)
/
∗
和<年代vghe我ght="22.075001" id="M93" style="vertical-align:-3.80836pt;width:97.75px;" version="1.1" viewbox="0 0 97.75 22.075001" width="97.75" xmlns="http://www.w3.org/2000/svg">
∑
=
(
=
1
)
/
。请注意,这些估算仅在估算过程中使用。
gydF4y2Ba没有回应<年代vghe我ght="10.3.25" id="M94" style="vertical-align:-0.0pt;width:11.6125px;" version="1.1" viewbox="0 0 11.6125 10.325" width="11.6125" xmlns="http://www.w3.org/2000/svg">
存在于第二阶段的样本中,并在非应答者中选择一个子样本。辛格和库马尔[<一个href="#B12">4一个>[用简单随机抽样的方法来考虑这个问题。他们提出了具有以下特征的估计器族<年代p一个nclass="equation" id="EEq3.1">
∗
=
+
∗
+
+
∗
+
,
∑
=
=
1
.
(
3.
.
1
)
采样器固定常数<我><我>α我>和<我><我>β我>以及<年代vghe我ght="7.1750002" id="M96" style="vertical-align:-0.1254pt;width:7.9749999px;" version="1.1" viewbox="0 0 7.9749999 7.1750002" width="7.9749999" xmlns="http://www.w3.org/2000/svg">
和<年代vghe我ght="10.73.75" id="M97" style="vertical-align:-0.13794pt;width:7.4749999px;" version="1.1" viewbox="0 0 7.4749999 10.7375" width="7.4749999" xmlns="http://www.w3.org/2000/svg">
.它们可以是常数或函数,<我>一个我>不同于零。采取<年代p一个nclass="equation" id="eq6">
=
−
,
=
−
,
=
∗
−
,
=
−
.
(
3.
.
2
)
第3.1号提案(见[<一个href="#B12">4一个>])。年代p一个n><我>偏见我><年代p一个nclass="equation" id="eq7">
∗
=
+
∗
+
+
∗
+
(
3.
.
3.
)
是我><年代p一个nclass="equation" id="eq8">
∗
=
1
+
2
,
(
3.
.
4
)
定义我><年代p一个nclass="equation" id="eq9">
1
=
+
−
1
2
+
+
+
−
1
2
2
,
2
=
2
+
−
1
2
2
2
,
(
3.
.
5
)
在哪里我><年代p一个nclass="equation" id="eq10">
1
=
−
1
∗
,
=
2
(
−
1
)
,
2
=
2
2
,
2
2
=
2
2
2
2
,
=
2
,
2
=
2
2
2
2
2
2
,
=
−
−
,
2
=
−
−
2
.
(
3.
.
6
)
方差是我><年代p一个nclass="equation" id="eq11">
∗
=
2
1
+
2
,
(
3.
.
7
)
定义我><年代p一个nclass="equation" id="eq12">
1
=
2
+
(
+
)
(
+
)
+
2
2
,
2
=
2
2
+
+
2
2
2
2
+
2
∗
,
2
=
2
2
,
2
2
=
2
2
2
2
.
(
3.
.
8
)
我们要推导这个家族对应的RSS。第一相样品的选择使用srswr和信息<年代vghe我ght="10.3.25" id="M105" style="vertical-align:-0.0pt;width:13.4125px;" version="1.1" viewbox="0 0 13.4125 10.325" width="13.4125" xmlns="http://www.w3.org/2000/svg">
用于选择初始样本和对非受访者进行二次抽样。我们的建议是<年代p一个nclass="equation" id="EEq3.2">
∗
r
年代
年代
=
r
年代
年代
r
年代
年代
+
∗
+
+
∗
+
,
(
3.
.
9
)
r
年代
年代
的RSS平均值是<年代vghe我ght="10.3.25" id="M108" style="vertical-align:-0.0pt;width:13.4125px;" version="1.1" viewbox="0 0 13.4125 10.325" width="13.4125" xmlns="http://www.w3.org/2000/svg">
在第二阶段和<年代p一个nclass="equation" id="eq13">
r
年代
年代
=
r
年代
年代
−
,
r
年代
年代
=
r
年代
年代
−
,
=
∗
−
,
r
年代
年代
=
r
年代
年代
−
.
(
3.
.
1
0
)
让我们用<年代p一个nclass="equation" id="eq14">
r
年代
年代
=
1
+
r
年代
年代
,
r
年代
年代
=
1
+
r
年代
年代
,
∗
=
(
1
+
)
,
r
年代
年代
=
1
+
r
年代
年代
.
(
3.
.
1
1
)
由于估计量的无偏性<年代vghe我ght="14.73.75" id="M111" style="vertical-align:-3.22281pt;width:171.78751px;" version="1.1" viewbox="0 0 171.78751 14.7375" width="171.78751" xmlns="http://www.w3.org/2000/svg">
(
r
年代
年代
)
=
0
,
=
,
,
,
.
gydF4y2Ba采取<年代p一个nclass="equation" id="eq15">
=
+
.
(
3.
.
1
2
)
我们可以重写(<一个href="#EEq3.2">3.9一个>)作为<年代p一个nclass="equation" id="EEq3.3">
∗
r
年代
年代
=
1
+
r
年代
年代
1
+
r
年代
年代
(
1
+
)
−
1
+
r
年代
年代
(
1
+
)
−
.
(
3.
.
1
3.
)
注意<年代p一个nclass="equation" id="eq16">
r
年代
年代
2
=
r
年代
年代
−
2
2
=
2
/
+
2
(
−
1
)
2
2
/
∗
2
−
2
∑
(
−
1
)
2
=
1
Δ
2
2
(
∶
2
)
/
2
2
,
r
年代
年代
2
=
2
/
+
2
(
−
1
)
2
2
/
2
−
2
∑
(
−
1
)
2
=
1
Δ
2
2
(
∶
2
)
/
2
2
,
(
)
2
=
(
∗
−
)
2
2
=
2
∗
2
,
r
年代
年代
2
=
2
∑
/
−
=
1
Δ
2
(
)
/
2
.
(
3.
.
1
4
)
在假设下<年代vghe我ght="14.73.75" id="M115" style="vertical-align:-3.22281pt;width:193.6375px;" version="1.1" viewbox="0 0 193.6375 14.7375" width="193.6375" xmlns="http://www.w3.org/2000/svg">
/
/
<
1
,
=
r
年代
年代
,
r
年代
年代
,
,
r
年代
年代
的泰勒级数展开<一个href="#EEq3.3">3.13一个>)可能会被解决。方便地分组<年代p一个nclass="equation" id="EEq3.4">
∗
r
年代
年代
−
=
r
年代
年代
+
r
年代
年代
+
r
年代
年代
r
年代
年代
−
r
年代
年代
+
r
年代
年代
+
r
年代
年代
r
年代
年代
−
r
年代
年代
−
(
+
)
+
2
2
+
r
年代
年代
+
r
年代
年代
+
r
年代
年代
−
2
2
r
年代
年代
+
2
r
年代
年代
+
(
+
1
)
2
2
2
+
2
r
年代
年代
+
(
+
1
)
2
2
2
+
2
r
年代
年代
.
(
3.
.
1
5
)
OS的交叉积<年代vghe我ght="16.174999" id="M117" style="vertical-align:-4.68874pt;width:97.025002px;" version="1.1" viewbox="0 0 97.025002 16.174999" width="97.025002" xmlns="http://www.w3.org/2000/svg">
(
)
,
=
,
,表示为<年代p一个nclass="equation" id="eq17">
ℎ
=
1
(
)
−
(
)
(
)
−
”
(
)
=
ℎ
=
1
(
)
∓
−
(
)
(
)
∓
−
”
(
)
=
ℎ
=
1
(
)
−
(
)
−
”
−
ℎ
=
1
(
)
Δ
”
(
)
+
(
)
Δ
(
)
−
Δ
(
)
Δ
”
(
)
=
(
ℎ
−
1
)
”
+
Ψ
”
.
(
3.
.
1
6
)
RSS估计的条件期望是<年代p一个nclass="equation" id="eq18">
r
年代
年代
/
∗
=
r
年代
年代
/
/
∗
=
∗
.
(
3.
.
1
7
)
利用这些结果,我们得到<年代p一个nclass="equation" id="eq19">
r
年代
年代
r
年代
年代
=
+
Ψ
+
2
(
−
1
)
2
+
Ψ
2
,
r
年代
年代
=
+
Ψ
∗
,
r
年代
年代
r
年代
年代
=
+
Ψ
,
(
3.
.
1
8
)
与<年代p一个nclass="equation" id="eq20">
Ψ
2
⎛
⎜
⎜
⎝
∑
=
−
”
2
=
1
(
)
2
Δ
(
)
2
+
(
)
2
Δ
(
)
2
−
Δ
(
)
2
Δ
(
)
2
⎞
⎟
⎟
⎠
,
Ψ
∑
=
−
=
1
(
)
Δ
(
)
+
(
)
Δ
(
)
−
Δ
(
)
Δ
(
)
.
(
3.
.
1
9
)
此外<年代p一个nclass="equation" id="eq21">
r
年代
年代
r
年代
年代
=
2
+
Ψ
2
,
Ψ
∑
=
−
=
1
Δ
2
8
(
)
r
年代
年代
=
2
∗
2
,
r
年代
年代
=
2
∗
2
.
(
3.
.
2
0
)
用(<一个href="#EEq3.4">3.15一个>)经过一些代数运算,得到(<一个href="#EEq3.2">3.9一个>)是<年代p一个nclass="equation" id="eq22">
∗
r
年代
年代
=
1
r
年代
年代
+
2
r
年代
年代
,
(
3.
.
2
1
)
在哪里<年代p一个nclass="equation" id="eq23">
1
r
年代
年代
=
2
+
Ψ
+
−
1
2
2
+
Ψ
2
+
2
+
Ψ
+
2
+
Ψ
2
+
−
1
2
2
Ψ
2
∑
=
−
2
=
1
Δ
2
2
(
∶
2
)
/
2
2
,
=
,
.
(
3.
.
2
2
)
为了一大笔钱<年代vghe我ght="7.13.74998" id="M125" style="vertical-align:-0.10033pt;width:7.8874998px;" version="1.1" viewbox="0 0 7.8874998 7.1374998" width="7.8874998" xmlns="http://www.w3.org/2000/svg">
偏差趋于零。那么我们已经证明了下列命题的第一个陈述。
<年代p一个nclass="statement" id="prop2">命题3.2。年代p一个n><我>的估计量<年代vghe我ght="22.0875" id="M126" style="vertical-align:-3.2316pt;width:356.83749px;" version="1.1" viewbox="0 0 356.83749 22.0875" width="356.83749" xmlns="http://www.w3.org/2000/svg">
∗
r
年代
年代
=
r
年代
年代
(
(
r
年代
年代
+
)
/
(
∗
+
)
)
(
(
r
年代
年代
+
)
/
(
∗
+
)
)
是渐近无偏的吗<年代vghe我ght="7.13.74998" id="M127" style="vertical-align:-0.10033pt;width:7.8874998px;" version="1.1" viewbox="0 0 7.8874998 7.1374998" width="7.8874998" xmlns="http://www.w3.org/2000/svg">
它的方差是我><年代p一个nclass="equation" id="eq24">
∗
r
年代
年代
=
2
+
2
(
(
+
)
)
2
2
+
2
(
+
)
2
+
Ψ
+
2
2
2
2
2
2
+
Ψ
2
2
2
+
2
2
+
Ψ
2
+
2
2
2
2
+
Ψ
2
1
+
Ψ
2
+
2
2
.
(
3.
.
2
3.
)
如果<年代vghe我ght="14.73.75" id="M129" style="vertical-align:-3.22281pt;width:193.6375px;" version="1.1" viewbox="0 0 193.6375 14.7375" width="193.6375" xmlns="http://www.w3.org/2000/svg">
/
/
<
1
,
=
r
年代
年代
,
r
年代
年代
,
,
r
年代
年代
.我>年代p一个n>
证明。我>年代p一个n>泰勒级数的一个展开式<年代vghe我ght="22.387501" id="M130" style="vertical-align:-3.22281pt;width:72.525002px;" version="1.1" viewbox="0 0 72.525002 22.387501" width="72.525002" xmlns="http://www.w3.org/2000/svg">
(
∗
r
年代
年代
−
)
2
也许可以解决。是的,忽略了顺序的条款<年代vghe我ght="11.0625" id="M131" style="vertical-align:-0.30096pt;width:32.224998px;" version="1.1" viewbox="0 0 32.224998 11.0625" width="32.224998" xmlns="http://www.w3.org/2000/svg">
>
2
,<年代p一个nclass="equation" id="eq25">
∗
r
年代
年代
−
2
=
2
1
+
2
+
3.
+
4
,
(
3.
.
2
4
)
在哪里<年代p一个nclass="equation" id="eq26">
1
=
2
r
年代
年代
+
2
2
r
年代
年代
+
2
2
r
年代
年代
+
2
r
年代
年代
r
年代
年代
2
,
2
=
2
r
年代
年代
+
(
+
)
2
2
2
,
3.
=
2
r
年代
年代
r
年代
年代
+
r
年代
年代
r
年代
年代
,
4
=
−
2
(
+
)
(
r
年代
年代
+
2
r
年代
年代
+
r
年代
年代
.
(
3.
.
2
5
)
计算期望值,然后分组<年代p一个nclass="equation" id="eq27">
∗
r
年代
年代
−
2
=
2
+
2
(
(
+
)
)
2
2
+
2
(
+
)
2
+
Ψ
+
2
2
2
2
2
2
+
Ψ
2
2
2
+
2
2
+
Ψ
2
+
2
2
2
2
+
Ψ
2
1
+
Ψ
2
+
2
2
.
(
3.
.
2
6
)
3.3的话。我>年代p一个n>由于使用(<一个href="#EEq3.2">3.9一个>)的方差为<年代p一个nclass="equation" id="eq28">
r
年代
年代
=
2
+
2
Ψ
+
2
Ψ
1
+
Ψ
2
+
Ψ
2
2
.
(
3.
.
2
7
)
因此,作为<年代vghe我ght="22.387501" id="M136" style="vertical-align:-3.22281pt;width:34.849998px;" version="1.1" viewbox="0 0 34.849998 22.387501" width="34.849998" xmlns="http://www.w3.org/2000/svg">
(
∗
r
年代
年代
)<年代vghe我ght="21.225" id="M137" style="vertical-align:-2.29482pt;width:83.3125px;" version="1.1" viewbox="0 0 83.3125 21.225" width="83.3125" xmlns="http://www.w3.org/2000/svg">
=
(
∗
)
+
该方法具有较高的精度<年代vghe我ght="11.0625" id="M138" style="vertical-align:-0.30096pt;width:38.799999px;" version="1.1" viewbox="0 0 38.799999 11.0625" width="38.799999" xmlns="http://www.w3.org/2000/svg">
<
0
.我>
这个结果可以推导出不同的双抽样平均估计量的相对RSS。例如,<年代p一个nclass="equation" id="eq29">
(
,
,
,
)
=
(
−
1
,
0
,
1
,
0
)
⟶
K
h
一个
r
e
-
年代
r
我
v
一个
n
年代
t
一个
v
一个
-
T
一个
b
一个
年代
u
米
-
K
h
一个
n
e
年代
t
我
米
一个
t
o
r
1
,
(
,
,
,
)
=
(
0
,
−
1
,
1
,
0
)
⟶
K
h
一个
r
e
-
年代
r
我
v
一个
n
年代
t
一个
v
一个
-
T
一个
b
一个
年代
u
米
-
K
h
一个
n
e
年代
t
我
米
一个
t
o
r
2
,
(
,
,
,
)
=
(
−
1
,
−
1
,
1
,
0
)
⟶
年代
h
我
n
g
-
K
u
米
一个
r
r
一个
t
我
o
e
年代
t
我
米
一个
t
o
r
,
(
,
,
,
)
=
(
−
1
,
0
,
1
,
0
)
⟶
年代
h
我
n
g
-
K
u
米
一个
r
p
r
o
d
u
c
t
e
年代
t
我
米
一个
t
o
r
.
(
3.
.
2
8
)
见Khare和Srivastava[<一个href="#B6">12一个>,<一个href="#B7">13一个>辛格和库马尔,[<一个href="#B12">4一个>,<一个href="#B10">14一个>,<一个href="#B11">15一个>].
4.数值比较gydF4y2Ba我们比较了提出的RSS方法和使用三个种群数据的SRS方法的行为。它们的描述如下。
<年代p一个nclass="statement" id="head1">人口1我>年代p一个n> 审议了244个账户。上学期他们每个人的余额是<年代vghe我ght="10.3.25" id="M140" style="vertical-align:-0.0pt;width:13.4125px;" version="1.1" viewbox="0 0 13.4125 10.325" width="13.4125" xmlns="http://www.w3.org/2000/svg">
和<年代vghe我ght="10.3.25" id="M141" style="vertical-align:-0.0pt;width:11.6125px;" version="1.1" viewbox="0 0 11.6125 10.325" width="11.6125" xmlns="http://www.w3.org/2000/svg">
由一个听觉系统产生。通过选择120个账户提供第一阶段样本,并报告72个无反应。进行新的听觉测试。第二阶段样本大小为24。年代p一个n>
人口2我>年代p一个n> 射线照片的评估提供了<年代vghe我ght="10.3.25" id="M142" style="vertical-align:-0.0pt;width:13.4125px;" version="1.1" viewbox="0 0 13.4125 10.325" width="13.4125" xmlns="http://www.w3.org/2000/svg">
在350名癌症患者中100个样本提供第一阶段的样本,其中24个提供第二阶段的样本。<我>Y是一个被切除肿瘤的大小。缺少53个测量值。这些测量值需要在病理科查找。年代p一个n>
人口3我>年代p一个n> 1270头猪的身高提供了关于<年代vghe我ght="10.3.25" id="M143" style="vertical-align:-0.0pt;width:13.4125px;" version="1.1" viewbox="0 0 13.4125 10.325" width="13.4125" xmlns="http://www.w3.org/2000/svg">
在人口。第一阶段选出170人,第二阶段选出24人。<年代vghe我ght="10.3.25" id="M144" style="vertical-align:-0.0pt;width:11.6125px;" version="1.1" viewbox="0 0 11.6125 10.325" width="11.6125" xmlns="http://www.w3.org/2000/svg">
是猪的重量,69个初始测量值丢失了。丢失的猪的重量是通过把它们送到屠宰场前的定位得到的。年代p一个n>
的值<年代vghe我ght="7.0124998" id="M145" style="vertical-align:-0.0pt;width:6.5px;" version="1.1" viewbox="0 0 6.5 7.0124998" width="6.5" xmlns="http://www.w3.org/2000/svg">
和<年代vghe我ght="7.13.74998" id="M146" style="vertical-align:-0.10033pt;width:11.225px;" version="1.1" viewbox="0 0 11.225 7.1374998" width="11.225" xmlns="http://www.w3.org/2000/svg">
方便地固定,以获得大小为24的样本。操作系统的均值和方差是通过形成所有可能的样本并计算它们来确定的。由于使用RSS,相对精度增益被测量<年代p一个nclass="equation" id="eq30">
=
r
年代
年代
∗
,
(
4
.
1
)
为<年代vghe我ght="13..0125"我d="M148" style="vertical-align:-1.76814pt;width:67.074997px;" version="1.1" viewbox="0 0 67.074997 13.0125" width="67.074997" xmlns="http://www.w3.org/2000/svg">
=
3.
,
4
,
6
.结果如表所示<一个href="//www.newsama.com/journals/jps/2012/214959/tab1/" target="_blank">1一个>.他们认为使用RSS提供了大于10%的精度增益。
人口
=
3.
=
4
=
6
账户余额 0, 1122 0,1523 0, 1095
肿瘤的大小 0, 1214 0,1207 0, 1105
猪的身高 0, 2672 0, 2998 0, 2159