计算和数学方法在医学

PDF
计算和数学方法在医学/2015年/文章
特殊的问题

2014年医学成像数学方法和应用

把这个特殊的问题

研究文章|开放获取

体积 2015年 |文章的ID 172918年 | https://doi.org/10.1155/2015/172918

Bo Yu Zongda金,Jiayong田,通用电气高, 敏感的比例估计连续抽样的随机响应数据”,计算和数学方法在医学, 卷。2015年, 文章的ID172918年, 6 页面, 2015年 https://doi.org/10.1155/2015/172918

敏感的比例估计连续抽样的随机响应数据

学术编辑器:易高
收到了 2014年10月31日
修改后的 2014年11月22日
接受 2014年12月05
发表 2015年5月18日

文摘

本文考虑了二项比例的估计问题的敏感或羞辱属性感兴趣的人群中。随机响应技术提出了保护被调查者的隐私和减少反应偏差而引起敏感属性的信息。在许多敏感问题调查,同样的人口通常是在每个场合反复采样。在本文中,我们应用连续抽样方案改善敏感比例的估计当前的场合。

1。介绍

社会调查有时包括侮辱或敏感问题的询问,如习惯性逃税、性行为、物质滥用和过度赌博,很难获得有效和值得信赖的信息。如果受访者被要求直接对有争议的问题,它往往导致拒绝或不真实的答案,特别是当他们有侮辱的行为。为了克服这个困难,华纳(1]介绍了随机响应技术来估计的人口比例轴承侮辱或敏感等特性在一个特定的社区。这种技术可以让被申请人如实回答敏感问题没有暴露的令人尴尬的行为。在华纳的开创性工作1),一些研究人员在这个领域作出了重要贡献,比如Christofides [2,3辛格],[4金),和以拦5)、黄(6,7],辛格和Sedory [8),常和郭9),Arnab et al。10]。所有这些结果都是基于样本有一次,在目前的研究并非如此。

在许多敏感问题调查,同样的人口经常反复每一次采样,以便发展随着时间的推移。在这种情况下,使用连续抽样方案可以有吸引力的替代提高水平的估计时间点或测量两个时间点之间的变化。在连续两次采样,先前的理论11,12)旨在提供最优估计量的意思是对当前(第二)。连续采样也被Narain[讨论一些细节13],Raj [14辛格],[15),Ghangurde和饶16],奥卡福[17),Arnab和奥卡福18),Biradar和辛格19辛格),g . n和v . k .辛格(20.),Artes et al。21),等等,辛格et al。22]。但是没有努力已经取得了估计当前时刻敏感的无限的人口的比例。这动机导致作者考虑的问题估计敏感或羞辱属性的二项比例的人口连续两次采样的兴趣。此外,集群抽样时通常是首选的目标人群是地理多样化。在本文中,我们利用旋转集群样品设计构建一个类估计的随机响应的情况下调查。剩下的纸是组织如下。节2,我们提出了一种新的科学调查方法与集群使用西蒙斯模型旋转抽样。节3,相应的公式方法调查发现之后,上述提到的方法和相应的公式成功地设计和应用于婚前性行为的调查在学生中东吴大学的部分4。部分5包含的结论。

2。该调查方法

2.1。西蒙斯模型

西蒙斯模型基于华纳霍维茨提出的随机响应技术et al。23]。基本思想是建立一个随机关系之间的个人和两个不相关的问题。西蒙斯设计由两个不相关的问题,A和B,在概率基础上回答,一个是“你拥有敏感特征”和B是一个非敏感的问题,如“你的生日号码是奇怪的。“两个问题提出了A和B与预设受访者概率 ,分别。简单随机抽样的替换(SRSWR)。选定的被调查者被要求选择一个问题a或B和报告“是”如果他/她的实际地位匹配与选择的问题,否则“不”。

2.2。西蒙斯模型集群旋转抽样

在以下采样两次被认为是估计人口比例与敏感特征二次旋转时抽样单位是集群。西蒙斯模型下的抽样步骤部分集群旋转如下。

首先,人口分为初级抽样单位(或集群)和集群内的单位二级抽样单位(人)。

其次,在第一次的随机样本 集群替换是从人口。绘制集群内的人们被要求选择一个问题a或B和报告“是”如果他/她的实际地位匹配与选择的问题,“不”否则,使用西蒙斯模型。

第三,在第二次 集群随机选择的第一次被保留,其余 集群取而代之的是一个全新的选择。所有的人总在第二次集群内调查使用西蒙斯模型。

3所示。公式推导

3.1。估计量的人口比例在第二次及其方差

考虑的随机样本 集群替代来自人口由 集群和 th群 单位

在第二个(当前)场合 集群随机选择的第一次被保留,其余 集群取而代之的是一个全新的选择。让 的数量 集群(包括保留 单位)与研究第一次下的敏感特性 ,让 的数量 集群(包括旋转 单位)的研究第一次下敏感特性,分别 的数量吗 集群(包括保留 单位)与敏感特征研究第二(当前)的场合 的数量吗 新的集群(包括 单位)与敏感特征研究第二(当前)的场合 。同样,让 的比例 th留存的集群研究第一次下的敏感特性 ,让 的比例 th旋转集群与研究第一次下的敏感特性 ,分别。 的比例吗 th保留第二集群与敏感特征研究(当前)场合 的比例吗 th新鲜集群下的敏感特性研究第二(当前)场合 。假设方差和第一次和第二次之间的相关系数是常数和整体校正系数将被忽略。

定义如下: :敏感特征的人口比例第一次; :敏感特征的人口比例在第二次; 的比例: 保留第一次集群敏感特征; 的比例: 保留与敏感特点第二次集群; 的比例: 旋转集群第一次敏感特征; 的比例: 新的集群与第二次敏感的特征。以下是根据公式和结果由科克伦(24]。

的估计量

的估计量

的估计量

的估计量

的估计量 考虑一个广义估计量 的人口比例的敏感特征第二次或电流场合 在哪里 , , , 是合适的常数。

我们有 因为估计量 是一个无偏估计量的 ,我们有

因此,估计量6的形式 估计量的方差 其他协方差为零。

估计量的方差最小化 关于 是足够大, 然后我们得到 我们得到 一个人

我们有

因此, 定义

我们得到了 通过16,我们得到

一个人 通过1618,我们得到 在哪里

定理1。西蒙斯模型部分集群旋转,下一个 和估计量的方差

备注2。在实践中, 是未知的。的估计量 的估计量

定理3。西蒙斯模型部分集群旋转,下一个最优转速 和最优估计量的方差 实际上,抽样调查的成本通常代表下面的简单函数,根据科克伦(24]: 在哪里 是抽样的总成本, 调查的基本成本, 是调查一个保留集群的平均基本成本第二次,然后呢 是调查一个新鲜的平均基本成本集群第二次。

定理4。在给定的抽样调查的成本 ,一个 和样本大小的估计部分集群旋转 在哪里

3.2。的估计量

被选择的比例 th集群(包括 单位)与非敏感特性研究 th场合; 表示的数量和比例的“是”的答案 th集群,分别 , ,

从总概率公式(参见[25]),我们可以得到的 因此

4所示。应用程序

4.1。调查设计

这项调查是关于婚前性行为在苏州大学独墅湖校区的学生。我们把每个类的集群平均45人/班。在第一次(2011)、12类随机从所有类。所有的人选择调查的12类西蒙斯模型敏感问题。第二次(2013),8的12类随机选择的第一次被保留,其余4类替换为一个新的选择。然后选中的类中的所有人包括8保留类和4新鲜类调查的西蒙斯模型敏感问题。

在我们的设计中,每个人被要求画一个球放回随机从包含6个红球和一袋4白色球与已知的概率(红球的比例是0.6)。如果一个红球是由被申请人选择,那么他或她就会被问到那个敏感的问题,一个是“你是一个组的成员有婚前性行为。“如果一个白色的球被选中,他或她会回答的非敏感问题B, B是“你的学生号码是奇怪的。“被申请人报告“是”如果他/她的实际地位匹配与选择的问题,“不”。

两次的所有问卷都进行了检查,确保它们是独立完成的,没有遗漏的问题。调查的回收率为100%,没有失败的问卷。所有的数据处理和分析通过Excel 2003和SAS 9.13。

4.2。结果
4.2.1。准备调查的结果

在我们的设计中,每个人被要求画一个球放回随机从包含6个红球和一袋4白色球与已知的概率(红球的比例是0.6)。如果一个红球是由被申请人选择,那么他或她就会被问到那个敏感的问题,一个是“你是一个组的成员有婚前性行为。“如果一个白色的球被选中,他或她会回答的非敏感问题B, B是“你的学生号码是奇怪的。“被申请人报告”是的“如果他/她的实际状态匹配与选择的问题,“没有“否则。根据31日,我们得到样本比例的大学生婚前性行为 , ,如表所示1


类数

1 0.2624 0.2348
2 0.1631 0.1945
3 0.2101 0.2264
4 0.2063
5 0.1556 0.1986
6 0.2390
7 0.1783
8 0.1970 0.1550
9 0.0123 0.0114
10 0.0476 0.0738
11 0.0455
12 0.1185 0.1187
13 0.2035
14 0.1587
15 0.1926
16 0.1583

4.2.2。估计量的人口比例在第二次及其方差

通过1的估计人口比例与婚前性行为在第一次如下:

根据24,2,3,我们有 分别。

根据调查的结果,婚前性行为在苏州大学独墅湖校区学生在第二次,从公式45, 通过2324,我们获得 ,分别。

从公式25, ;然后根据公式21,我们得到 使用22,我们得到 。因此,标准偏差如下: 所以,95%置信区间的人口比例与婚前性

5。讨论和结论

总之,在这项研究中,我们提出了一种新的抽样方法解决问题的敏感问题调查重复随着时间的推移,这是第一次尝试由作者在这个方向。那么相应的公式估计的人口比例与敏感特性及其方差提出的抽样方法。此外,公式给出的最优转速和样本容量成本的抽样调查。

上述方法和相应的公式成功地设计和应用于婚前性行为调查在苏州大学独墅湖校区。总之,设计采样方法和相应的公式具有重要的理论和应用价值实现连续测量的敏感问题。

6。定理的证明

定理的证明1使用的最优值 给出的1619,估计量 减少到21
通过9,16,19,我们有

定理的证明3的最优值 给出了进一步最小化22关于 , 所以 替换3922我们有最优估计量的方差 作为

定理的证明4ByTheorem3, 替换4127,我们获得 假设平均集群组成 单位;然后 替换4226,我们有

利益冲突

作者宣称没有利益冲突有关的出版。

确认

作者想表达深深的感谢相关裁判,仔细阅读论文和评论大大改善。本文由国家自然科学基金的资助支持中国。高g . 81273188)。作者感谢高g(通讯作者)他宝贵的帮助。

引用

  1. s . l .华纳“随机响应:一项调查技术消除回避回答偏见,”美国统计协会杂志》上,60卷,不。309年,第69 - 63页,1965年。视图:出版商的网站|谷歌学术搜索
  2. t . c . Christofides“广义随机响应技术,”Metrika卷,57号2、195 - 200年,2003页。视图:出版商的网站|谷歌学术搜索|MathSciNet
  3. t . c . Christofides”在分层抽样的随机响应,”杂志的统计规划和推理,卷128,不。1,第310 - 303页,2005。视图:出版商的网站|谷歌学术搜索|MathSciNet
  4. g·n·辛格(manmohan Singh)”的使用链式连续抽样比率估计量的差别,“应用数学和统计的国际期刊》第六卷,41-49,2006页。视图:谷歌学术搜索
  5. 人类。金姆和m . e .拦,“分层随机响应模型无关的问题,“统计文件,48卷,不。2、215 - 233年,2007页。视图:出版商的网站|谷歌学术搜索|MathSciNet
  6. K.-C。黄,“估计敏感特征使用可选的随机响应技术,”质量和数量,42卷,不。5,679 - 686年,2008页。视图:出版商的网站|谷歌学术搜索
  7. K.-C。黄”,无偏估计量的意思是,方差和敏感水平有限总体抽样量化特征,“Metrika,卷71,不。3、341 - 352年,2010页。视图:出版商的网站|谷歌学术搜索|MathSciNet
  8. 辛格和s . A . Sedory”三个估计的真实模拟研究在随机响应抽样的平等保护的受访者,”Statistica Neerlandica,卷66,不。4、442 - 451年,2012页。视图:出版商的网站|谷歌学术搜索|MathSciNet
  9. 周宏儒。Chang和M.-P。郭”,估计人口比例随机响应采样使用加权置信区间施工时,“Metrika,卷75,不。5,655 - 672年,2012页。视图:出版商的网站|谷歌学术搜索|MathSciNet
  10. r . Arnab s·辛格,d .北”使用两个扑克牌在随机响应技术对于复杂的调查设计,“通信数据。理论和方法第41卷。。16 - 17,3198 - 3210年,2012页。视图:出版商的网站|谷歌学术搜索|MathSciNet
  11. r . j .洁森”获得农场的调查统计调查事实,”爱荷华州农业实验台研究公告卷,304年,页1 - 104,1942。视图:谷歌学术搜索
  12. f·耶茨,人口普查和调查抽样方法查尔斯·格里芬,伦敦,英国,1949年。
  13. r·d·纳拉因“在抽样的递推公式在连续的情况下,“农业统计的印度社会杂志》上5卷,第99 - 96页,1953年。视图:谷歌学术搜索|MathSciNet
  14. d . Raj”抽样与样本大小的概率比例超过两次,”《数理统计36卷,第330 - 327页,1965年。视图:出版商的网站|谷歌学术搜索|MathSciNet
  15. d·辛格,“估计在连续使用多级抽样设计中,“美国统计协会杂志》上卷,63年,第112 - 99页,1968年。视图:谷歌学术搜索|MathSciNet
  16. p·d·Ghangurde j . n . Rao,“一些结果采样两次。”数论派31卷,第472 - 463页,1969年。视图:谷歌学术搜索|MathSciNet
  17. f . c,可以用“抽样的理论和应用两次评估当前的人口比例,”Statistica,42卷,第147 - 137页,1992年。视图:谷歌学术搜索|MathSciNet
  18. r . Arnab f . c .奥卡福,“注意双采样两次。”巴基斯坦《统计,8卷,不。3、9到18,1992页。视图:谷歌学术搜索|MathSciNet
  19. r s Biradar惠普辛格,“连续采样使用辅助信息的场合,“加尔各答统计协会公告,51卷,不。203 - 204,243 - 251年,2001页。视图:谷歌学术搜索|MathSciNet
  20. g·n·辛格和诉k·辛格在连续采样,利用辅助信息”农业统计的印度社会杂志》上,54卷,不。1、1 - 12,2001页。视图:谷歌学术搜索|MathSciNet
  21. r . Artes, m·伊娃·l·加西亚,诉阿米莉亚,“估计当前的人口比例在连续采样,”农业统计的印度社会杂志》上,54卷,不。3、342 - 354年,2001页。视图:谷歌学术搜索|MathSciNet
  22. 惠普辛格,r .裁缝,s·辛格和人类。金”,在连续抽样总体方差估计,”质量和数量,45卷,不。3、477 - 494年,2011页。视图:出版商的网站|谷歌学术搜索
  23. d·g·霍维茨、b . v .沙和w·r·西蒙斯”无关的问题随机响应模型,《社会统计学部分:美国统计协会卷,326年,第72 - 65页,1967年。视图:谷歌学术搜索
  24. w·g·科克伦抽样技术约翰·威利& Sons,纽约,纽约,美国第3版,1977年版。视图:MathSciNet
  25. z杜,抽样技术及其应用,清华大学出版社,北京,中国,第1版,2005年版。

版权©2015 Bo Yu et al。这是一个开放分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。


更多相关文章

PDF 下载引用 引用
下载其他格式更多的
订单打印副本订单
的观点2080年
下载796年
引用

相关文章

文章奖:2020年杰出的研究贡献,选择由我们的首席编辑。获奖的文章阅读