文摘
巴基斯坦仍是一个五个国家导致一半的全球儿童死亡和婴儿生存的比率非常低。贫穷率高,低水平的教育、卫生设施有限,城乡不平等和政治不确定性的主要原因是这种情况。生存模型,评估模型的性能模拟和实际数据集可以作为一个有效的技术来确定精确的复杂系统。本研究提出了一个有效的扩展最近参数技术风险评估的婴儿死亡率来解决复杂的生存系统的极端的观察。这种扩展方法集成四个分布的基本算法使用真实数据集没有极端观察婴儿的生存。提出的模型与标准相比偏最小squares-Cox回归(PLS-CoxR),和更高的效率观察到这些提出的算法来处理复杂的生存时间系统风险评估。该算法还用于分析模拟数据集进行进一步的验证结果。最优模型显示,母亲的年龄、类型的住宅,财富指数,去医疗机构许可,距离一个卫生设施,对肺结核显著影响婴儿的存活时间。的灵活性和连续性扩展参数方法支持公共卫生监测数据有效的实现面向数据的评估。发现可能支持计划有针对性的干预措施,产生意识,和实施政策计划降低婴儿死亡率。
1。介绍
统计生存技术需求强劲的时代真正的和可靠的结果对于深入研究复杂的生存和死亡模式。非参数生存技巧包括kaplan meier采用方法(1),国家的广义Wilcoxon测试(2),和生存率较3)被广泛应用在老年时期。Cox回归模型仍然是最受欢迎和广泛使用的半参数生存技巧,如果比例风险假设是实现(4]。在最近一段时间,灵活的参数化模型(FPM)被认为是一个更好的选择非参数和半参数方法产生更高的效率和更低的标准误差估计(5]。此外,这些模型考虑完整的画更精确的推断可能性、更容易解释的结果。到目前为止,FPM一直采用多种概率分布估计生存函数。概率分布指数支持基线处理生存时间。威布尔,龚帕兹、广义伽马和广义f分布也普遍实行。FPM也能够有效地研究协变量的关系与生存反应(5]。偏最小squares-Cox回归(PLS-CoxR)请与Cox模型集成解决生存时间响应与协变量共线(6]Cox回归以来限制与僵化的累积风险和生存函数的估计是不完整的。因此,PLS-CoxR模型限制的长期评估不平滑的函数。
灵活的参数化模型(fpm)建议来计算风险和累计风险协变量函数推断的生存模式。FPM可以估计持续生存和风险函数,而不是一个步骤表示由于其灵活性7]。
尽管相当大的改进来提高婴儿生存,每年近六百万名儿童死亡记录,获得前五岁(8]。2015年底,一个小比例的发展中国家已经遇到了第四年发展目标(MDG)的目标是为了提高儿童存活率的三分之二(9]。最近描述可持续发展目标(西班牙)寻求前进的目标是目标。第三个西班牙是降低5岁以下儿童死亡率(U5MR) 25人死亡在2030年每1000个活产儿(10]。之前的文献证明,五个国家包括中国、刚果、尼日利亚、印度、巴基斯坦拥有世界上将近一半的5岁以下儿童死亡率(11]。巴基斯坦是世界上第六大人口有1.88亿人12]。2018年,巴基斯坦的婴儿死亡率(IMR)是每1000活产61例死亡。由于政治不稳定,国内冲突,贫穷,教育水平低,不可用的卫生设施,并对区域差距在巴基斯坦,70%目标的目标没有实现13]。理解影响婴儿死亡率的因素是显著的健康专家,从业人员和卫生政策制定者对人口健康状况的改善通过有效的干预措施。
偏最小二乘回归在这条线,开发灵活的参数化模型(PLS-FPM)来分析复杂的生存系统的极端观察对风险和风险评估14]。本研究扩展了PLS-FPM共线的预测有温和的趋势观察使用四个可供选择的概率分布。
结果暴露的灵活的动态扩展方法获得平滑的生存和危险估计存在多重共线性。这个模型可以实现领域的遗传学、生物、工程、医学、社会科学、行为科学的系统的可靠性和风险评估。问题的正式声明如下:(我)选择最佳模型的执行四个分布结合PLS-FPM oversimulated和实际数据集共线的预测和温和的观察(2)识别婴儿死亡率在巴基斯坦的重要危险因素
2。方法
PLS-CoxR模型被认为是基准的方法在目前的研究中,和PLS-FP模型与四个不同的分布是拟议的技术。
2.1。Cox回归模型
Cox模型的形式 在哪里代表了基线风险函数,是向量回归估计,然后呢代表一个 矩阵的预测。
2.2。部分至少Squares-Cox回归模型
PLS-CoxR模型参考方法在目前的研究工作。假设时间是由生存和 的向量协变量相关,样本。模型的估计组件相关的预测和假设风险估计 在哪里代表一个 矩阵的组件。
2.3。灵活的参数生存模型(FPSM)
让表示一个非负连续反应,让生存是向量的预测 在一个样本的大小 。生存时间是活着的概率函数,是由 协变量的向量在一段时间累积分布函数 。然后累积风险或风险函数
任何分布范围 ,它可以作为生存分布。生存分布包括在这项研究FPSM如下:
2.3.1。龚珀兹分布
生存的反应与参数(龚帕兹分布后 , )展览生存函数 和累积风险函数
龚珀兹分布也是一个极端值分布与风险增加的功能。
2.3.2。广义伽马分布
广义伽马分布的参数( )生存函数为
风险函数的广义伽马函数增加,减少,浴缸,弧形(15]。
2.3.3。广义f分布
广义f分布的密度函数和是 在哪里 是β函数然后生存函数 在哪里卡方分布表示。这个分布是用于测试不同的参数形式包括其他发行版限制或特殊的情况。
2.3.4。指数分布
的生存时间有一个与速度参数指数分布有密度函数 然后生存函数 和累计风险函数
可以使用其他几个概率分布在FPM。回归系数的解释FPM半参数模型是一样的。FPM提供了一个更稳定的累积风险函数的半参数模型。例如,威布尔模型产生危害的连续函数作为一个连续的趋势。PLSR模型结合FPM解决广义伽马(GG),广义F (GF)指数,龚帕兹分布是包含在本研究为改进模型协变量共线的性能。
2.4。偏最小二乘灵活的参数(FP)模型
该模型假定一个事件的发生在时间的审查,让的矩阵相关预测因子 样本的大小 。该方法计算的FP模型组件(如 )计算从PLSR反应和生存作为一个矩阵的预测。PLS-FP模型假定一些等于组件被预测的数量(在哪里 ),然后 ,该算法运行:(1)装载重量计算
加载权重归一化长度等于1 (2)得分向量是计算
FPSM的风险函数计算 (3)如果 返回1
PLS-FP模型是一个两阶段的过程。在第一阶段,PLS-FP回归模型计算组件的PLS回归时间作为协变量响应结果和相关的预测。然后,它执行FP模型与生存时间响应和组件的PLSR解释性因素在稍后阶段。这种方法生产效率估计增加了共线的预测精度。因此,推荐使用的共线数据的共轭请和FP模型。PLSR模型还加上一个基于过滤器因子选择方法,即“装载重量”来识别重要因素(16,17]。
2.5。模拟生存从龚帕兹分布生成的数据
R-package即“simsurv”是用于模拟生存数据的生成18)与温和的观察和共线的预测。0.1和0.1的数据遵循龚珀兹分布规模和形状参数,分别。建立预测因子之间的相关性 对100个样本30预测。
2.6。婴儿生存时间数据
本研究使用辅助数据,从人口和健康调查获得(DHS),收集2012 - 2013年期间从巴基斯坦。因此,不需要伦理问题进行研究[19]。目前的分析使用数据集的婴儿在巴基斯坦1 - 12个月。由于缺失和不完整的信息,出生婴儿死在一个月内被排除在分析。总共有697婴儿属于巴基斯坦和83年预测变量是包括在内。
3所示。结果
PLS-FPM参数化与广义伽马,广义F指数,龚帕兹分布建模模拟生成的数据从龚帕兹观察共线数据的效率的变化。图的左面板1显示模型建立了AIC和效率表明,加上PLSR FPM模型在模拟数据显示,更高的效率在已知的相关结构。基于BIC相似的结果,如图1(b),观察到。仿真分析表明,该模型是有效的和可靠的性能相应的分布。分析了模拟建议提出了模型的实际应用研究协变量生存反应以及相关以更灵活的方式。
协变量之间的多重共线性分析实际数据集之前,验证来证明请的应用。为此,检查结构对婴儿的生存数据的相关性。婴儿生存的biplot数据呈现在图2清楚地描绘了协变量之间的相关性显示近点的出现。
婴儿生存的真实数据集与12个月的审查被认为是在这个分析。丢弃异常值,83年共测量超过577的观察(婴儿)包含在最终的样品比较生存模型。数据集随机分成测试(30%)和训练数据可靠的结果(70%)。经过验证的协变量之间的多重共线性,在龚帕兹PLS-FPM参数化,广义伽马,广义F,指数分布进行了分析。存活时间的PLS-Cox模型被认为是参考方法。图3显示模型的效率衡量AIC和BIC证明修改模型的更高的性能相比PLS-Cox在婴儿的生存数据。提出了基于参数模型的方法进行更好的由于他们的额外的灵活性。灵活的参数化模型结合PLSR参数化与广义伽马(GG),广义F (GF)指数,龚帕兹分布显示,增加准确性相比Cox模型结合请。
龚珀兹分布建模innovation-imitation范式,及其风险函数是凸函数。这些属性开发他们的灵活性,使用灵活的参数生存模型中的分布。因此,它增加了模型的性能与请与半参数模型相比,由于其灵活的性质。基于AIC和BIC,得出PLS-FPM参数化在广义F (GF)是最佳模型,从而进一步影响因素选择执行。基于广义f分布PLS-FP模型和位置参数被发现是最有效的模型/婴儿的生存数据。协变量在这个模型中,对相应的参数代表加速失效时间(AFT)模型,加快或减慢时间的流逝。详细说明PLS-FP模型参数化提出了表1描述相应的位置、规模、形状和速度参数的分布有关。
图4显示,累积危害回归估计的参考方法和PLS-FPM结合广义伽马(GG),广义F (GF),指数,为婴儿死亡率数据和龚帕兹分布。拟议中的PLS-FPM交付的顺利回归系数风险函数外推到12个月的时候显示一致的估计。参考模型显示不平滑的危害与特定时间间隔的奇怪的波动趋势图所示4。
生存时间数据建模,PLS-FPM参数化应用广义F (GF),和请一个著名的因子选择方法,即加载重量,用来估计回归系数的重要因素。估计的重要预测因子与婴儿死亡率展示在表相关联2。
80年后分析,28日影响因素的显著影响婴儿生存在巴基斯坦。母亲的年龄的负相关关系,地区,选择家庭暴力,屋顶材料,主要关系到家庭的头,财富指数的蚊子蚊帐,对肺结核(TB),决策权力访问家庭,之前的生育间隔,母乳喂养持续时间、血液与丈夫的关系,和总妊娠结果发现婴儿的生存。此外,积极的协会的省,母亲的教育,卫生间设施,可用性的电视,性的家庭,共享的厕所,总数量的孩子,死亡人数的儿子和女儿,使用避孕措施,获得许可,钱,运输,和服务员对医疗设施和距离观察到医疗设施。
4所示。讨论
评估风险和生存函数灵活解释复杂系统仍然是一个困难和计算具有挑战性的任务。因此,候选模型通常是有限的研究,以便评估和比较。然而,非参数和半参数生存方法可以挪用模型结构不平滑的估计计算。本研究扩展了PLS-FPM [14)相关的预测有温和的趋势观察使用四个可供选择的概率分布。PLS-FPM扩展了先前的生存方法,执行半参数分析或使用非参数方法,虽然以前所有的分析方法是有限的由于他们的本性。管理所有四个形状的风险函数,分布拟合实现模拟生存数据集定义。
大多数以前的文学Cox回归模型用于婴儿生存分析(20.]。最近的研究很少使用FPM检查婴儿生存分析(21]。PLS-FPM与参考方法对模拟和实际数据集协变量共线。一项研究提出了PLS-FPM结合伽马,威布尔,log-logistic,对数正态分布分布数据与极端观察检查四个真实数据集的乳腺癌存活时间和识别显著相关基因签名为每个数据集。研究发现,PLS-FPM有更高的性能比传统的PLS-Cox模型(14]。与之前的研究一致,本研究发现的更高效率相比PLS-FPM PLS-Cox回归方法与温和的观测数据集。PLS-FPM加上龚珀兹分布是发现最优模型来估计风险函数使用AIC模拟生存数据后龚珀兹分布。灵活的算法的效率提高了模型精度甚至在更大程度上考虑相关预测因子。这种精度表明,风险,以及生存功能,可以精确地计算生存反应平稳的趋势。最近的一项研究提出了偏最小二乘样条建模方法通过集成与限制请三次样条模型,并与PLS-Cox模型(22]。这项研究估计婴儿死亡率的危险因素在巴基斯坦使用基于概率PLS-spline模型规模有一个结。本研究也检查婴儿死亡率的重要因素通过执行最优模型,即PLS-FPM参数化在广义F (GF),和确定的影响因素也决定了不同的先前的研究。符合最近的文献,目前的研究证明,母亲的年龄,地区,选择家庭暴力,家庭关系,财富指数,对肺结核(TB),决策权力访问家庭,之前的生育间隔,和血液与丈夫的关系(22与婴儿死亡率显著相关。其他先前的文献也支持主要屋顶材料协会(23,24)、可用性的蚊子蚊帐(25),母乳喂养持续时间(26),和总妊娠结果(27与目前的研究类似婴儿生存。
不同以往的研究还观察到省的积极协会(28),母亲的受教育水平(29日)、卫生间设施类型(30.电视)、可用性(31日家庭头[],性32,共用卫生间33),总数量的孩子(34)、死亡的儿子和女儿35],使用避孕药[36许可的),和可用性、金钱、运输、医疗设施(距离和服务员37,38]婴儿生存这是符合当前的研究。最后但并非最不重要,PLS-FPM不仅可以推断生存反应除了后续信息的可用性,但也赞助商变体危害的形状。PLS-FPM建议作为一个有用的参数估计和预测的生存反应。这个模型推荐使用可靠性理论的风险评估。
数据可用性
数据是免费的https://dhsprogram.com/。
的利益冲突
作者宣称没有利益冲突。