文摘

客观的。比较受限制的平均生存时间(RMST)协变量为基础的方法与传统的生存方法当多个感兴趣的。方法。4405骨肉瘤被捕获的监测、流行病学、最终结果项目数据库。使用kaplan meier RMST-based方法包括组比较(公里)方法,pseudovalue (PV)回归,和逆概率审查概率(IPCW)回归类属特异性的和个人的重量。生存率较Wilcoxon测试、Cox回归与时间变量被选为传统方法的扩展。成比例的风险(PH)假设和审查机制的同质性假设被评估。我们估计风险比RMST(人力资源)和差异,探讨它们之间的关系。结果。当协变量违反PH值假设,时变人力资源被忽视的报告是一个值但PH assumption-free RMST RMST允许报告单一值的差异。在单变量分析中,使用的差异RMST公里计算方法为参考,PV回归( )和IPCW回归类属特异性的重量( )给了一致的估计比IPCW与单个重量( ),此外,PV回归了更健壮的统计力量比IPCW回归类属特异性的权重。在多变量分析中,IPCW回归与类属特异性的重量有限当多个反是违反审查机制的同质性假设。协变量对PH值的假设相遇,修身对数之间的关系的人力资源和不同RMST PV回归估计,观察单变量和多变量分析( ,分别),它支持光伏的健壮性回归和可能两者之间的转换效果的措施。结论。RMST差比时变可翻译的人力资源。支持公里方法和光伏性能回归在RMST-based首选的方法。IPCW回归可以另一种灵敏度分析。我们鼓励采用传统方法和RMST-based方法呈现全面协变量的影响。

1。背景

在肿瘤的研究中,生存数据,涉及生存时间(直到感兴趣的一个事件的发生)和状态(事件或审查),经常采用(1]。审查使生存分析的特点不同,常见的形式审查审查是正确的。一般来说,生存分析从数据描述和探索通过绘制kaplan meier(公里)曲线,然后比较生存曲线;最后,单变量和多变量回归获得执行一个或多个因素的影响(2]。当只有一个因素是感兴趣的(比如干预组),未经调整的报告和调整效果的衡量因素。当专注于多个因素(如风险因素),未经调整和调整效果感兴趣的每个因素的措施。

风险比(人力资源)Cox比例风险回归(称为Cox回归)通常被认为是作为首选的影响措施,但人力资源的解释可能是具有挑战性的,因为它不是一个凭直觉和临床总结统计。注意,Cox回归的关键假设是比例风险(PH)假设需要一个持续的人力资源随时间(3]。如果不满意,PH值假设估计人力资源与Cox回归单值是无效的和不正确的结论可以4]。限制平均生存时间(RMST),存活曲线下的面积0和prespecific之间的时间( ),被提拔为另一种生存和更好的汇总统计数据,它不仅限于PH值的假设5,6]。RMST可以解释在临床上有意义的视角。RMST绝对效应提出了不同长度的平均收益或迷失在预期寿命内prespecific时间( ),负差异意味着生存时间失去了(STL)和积极的差异意味着生存时间增益(STG)。同时,在统一的标准试验报告(配偶)和加强流行病学的观察性研究报告(闪光灯),相对和绝对鼓励效果报告一起提供一个广泛的照片协变量的影响(7,8]。RMST报告人力资源和差异在肿瘤研究中可以是一个有吸引力的移动。

简单性和临床直觉RMST-based RMST促进发展的方法。当只有一个直言协变量是感兴趣的,未经调整的差异可以估计基于RMST kaplan meier曲线,估计和调整一个标准化的生存曲线。当专注于多个因素,基于RMST回归使其可行的探索独立的多个反是对RMST的影响。三个回归已经提出,pseudovalue (PV)回归和逆概率审查权重(IPCW)回归group-specified重量和IPCW与单个重量(9,10]。审查机制的同质性假设决定了选择。

大量的生存方法可能会阻碍研究者和躺的人选择适当的方法方便、有效。了解他们的性能在实际研究和关系两个效应的措施可以促进研究人员报告。在这项研究中,探讨不同方法的性能,我们进行了传统的生存方式和RMST-based方法在肿瘤数据,总结和比较结果,探索人力资源和RMST差异之间的关系。最后,我们总结了这些方法和流程图。

2。方法

2.1。肿瘤数据

监测、流行病学、最终结果(SEER)项目数据库访问和骨肉瘤病例与完整的数据状态和生存时间从1970年代到2000年代被捕。那些病例死亡或审查0时刻被排除在分析,因为不同的处理策略的一般统计软件。

病人的人口协变量包括年龄、性别、诊断,和种族。分为> 60岁≤60年,和种族分为白色和其他人。肿瘤包括肿瘤大小、数据扩展的疾病,和美国癌症分期联合委员会(与)。肿瘤大小分为> 100 mm, < 100海里,“未知”。数据包括手术治疗、化疗和辐射,所有这些都是“是”和“不”。总体生存利益的结果,包括生存状态(各种原因死去或活着)和生存时间几个月。

2.2。统计方法
2.2.1。数据描述

参与者的特点提出了对分类变量(频率和百分比)和连续变量(意味着SD或中位数和四分位范围)。后续几个月的中值和死亡的数量计算。

2.2.2。假设评估

PH值假设和审查机制的同质性假设被评估。三种方法存在了PH值假设评估:(1)图形评估(公里曲线和ln (ln (S (t)))和ln (t)曲线);(2)为协变量之间的相互作用显著性检验 日志(t);和(3)全球健身的好策划和测试排名存活时间和Schoenfeld残差之间的联系(11]。在这项研究中,大样本大小 小偏离值敏感PH值假设,图形评估选择。审查机制的同质性假设被公里曲线或生存率较评估,审查的参数被指定为1,而不是0(0表示审查时间和值1表示一个事件的时间)。大大分开公里曲线或小 值生存率较支持违反审查机制的同质性。

2.2.3。传统的生存方法

生存率较PH值的假设下是最强大的。Non-PH模式所需的替代方法,包括Wilcoxon测试(‘测试),Tarone-Ware测试和综合测试。在这项研究中,生存率较,Wilcoxon测试,和Cox回归,视为传统方法进行估计 价值和小时。不都是感兴趣的。当协变量包括违反了PH值的假设,我们进行了扩展Cox回归变量(随时间变化 )而不是分层Cox回归。

2.2.4。RMST-Based方法

RMST基础方法、不同RMST被选为效果的措施。组比较方法和两种基于公里RMST-based回归了。从RMST-based回归系数估计RMST的差异。 组比较中指定的最小值是跨组- 5个月随访时间最长。 中指定的单变量回归一样,从组比较。在多变量分析中, 是固定在480个月(24岁)的临床比较。

RMST-based回归由PV和IPCW回归,用广义线性建模技术来直接模型RMST。在PV回归,重叠分析估计是用来生成pseudovalues [12]。首先,kaplan meier曲线下的面积了 估计是 在完整的数据 主题,然后删除 - - - - - -th主题,重复上述的评估分析估计量 最后, - - - - - -th pseudovalues的 可以计算出基于完整的样例和分析估计量之间的区别: 为每个主题是用来计算pseudovalue因变量模型协变量的影响在RMST [10]。在IPCW回归,剩下的未经审查的条件概率,直到时间 计算估计的重量为每个参与者和逆权重包含IPCW回归系数的迭代估计(9]。kaplan meier方法用于确定审查分布(建模审查机制)。它假定所有参与者共享相同的审查分布,即同质性的审查机制的假设。IPCW回归扩展到IPCW回归与单个重量和IPCW group-specified权重回归。当直言协变量的兴趣和审查分布在每个水平是不一样的,适当的使用与具体权重,审查机制保持每组同质和权重估计分别为每个组。在多变量分析中,IPCW回归group-specified权重没有选择,因为只有一个直言协变量被允许指定分层审查分布。

2.2.5。的关系探索

测试的一致性差异RMST估计4方法,散点图和安装线出现,使用kaplan meier方法作为一个金色的参考。人力资源之间的关系和区别在RMST可视化共持有PH值的假设。因为人力资源是一个比RMST差差别的时候,一个日志转换非线性回归拟合关系时被认为是(RMST差~日志e(人力资源))。

所有分析都使用windows的SAS软件,版本9.4 TS1M6 (SAS研究所有限公司、卡里、数控)阈值的一个双向的意义 进行了数据可视化在Microsoft PowerPoint 2016和4.03 R(奥地利维也纳)ggplot2包。

3所示。结果

4505名患者从SEER数据库中提取。100 0患者存活时间被排除在最终的分析。4405年,2389例(54.23%)死亡记录在研究结束的中位随访35个月。评估(表2假设1)。年龄、诊断,延长疾病,手术和放疗进行PH值的假设。年龄、性别、种族和辐射了同质性的审查机制的假设。更多细节在图形评估收集辅料(可用在这里)(图形比例风险评估的假设)。

病人的平均年龄是30岁,其中19.09%的人年龄超过60年,超过一半的患者(77.80%)接受手术和化疗(67.17%),在一些情况下(14.10%)接受了辐射(表2)。组比较, 协变量的值从生存率较Wilcoxon测试,和未经调整的差异在RMST相似,除了性别和种族。性别和种族PH值不满足假设,Wilcoxon测试更合适。生存曲线显示男性和女性之间无统计学差异( )但是白色和其他统计差异( )。RMST显示相反的结论,然而,不同男性比女性短住24.31个月( ),和白色和其他人之间不存在显著差异( )。分成两个的年龄是作为一个例子来解释人力资源和RMST。比60岁年轻患者相比,风险率大于60岁的患者增加了282% ( , ),而他们RMST下降了146.64个月( )。

未经调整的差异RMST从四个方法总结成表2,他们的关系是可视化图1。RMST基于kaplan meier使用不同方法参考,PV回归和group-specified IPCW回归权重表现出强烈一致的结果( , ,分别),但IPCW回归与单个重量显示不一致的结果( )。尽管二分年龄、性别、种族和辐射遇到审查机制的同质性假设,IPCW回归与单个重量给不如IPCW回归group-specified体重的一致估计。但是,与类属特异性的重量显示IPCW回归 值性,肿瘤大小,和化疗是无关紧要的,它的统计能力下降。

在多变量回归,IPCW回归group-specified重量不能当多个共进行违反审查机制的同质性假设。我们执行IPCW回归与个人的重量而不是偏见的权重。相比系数和 从PV值回归,IPCW回归与单个重量呈现很大的差异。RMST例如,不同放射治疗为-45.76 (95% CI -67.87至-31.99, )在PV回归和-6.52(95%可信区间-58.84到45.80, )与个人IPCW回归权重(表3)。

Cox回归,估计人力资源协变量违反PH值假设是时间的函数 而不是单个值,因此被视为“时变”而不是价值表(表23)。协变量为满足PH值的假设,一个稳定和修身对数之间的关系的人力资源和不同RMST PV回归估计,观察单变量和多变量回归,差异 ,上的差异 ,分别。然而,它提出了一个less-fitted人力资源之间的关系和区别RMST估计IPCW回归与单个重量( 在单变量回归和 在多变量回归)。的减少 从0.35到0.03是违反假设成多变量协变量同时包含多个IPCW回归与单个重量(图2)。

4所示。讨论

当多个感兴趣的,但违反了PH值的假设,反是时变小时被忽视的报告。PH值assumption-free RMST允许报告测量每个协变量的影响。报告结果来自传统的生存方式和RMST-based方法可以提供一个全面的图片效果。RMST-based回归,从光伏回归估计是比这更可靠、准确IPCW回归和没有限制的同质性的审查机制。此外,协变量包括违反审查机制的同质性假设成IPCW回归将进一步减少估计的准确性RMST和统计能力。健壮的和一致的负对数线性小时之间的关系和差异RMST从PV回归支持光伏的建议回归和可能的两者之间的转换效果的措施。

临床解释人力资源可能不是简单的对临床医师(13]。如果非比例危险出现,一个人力资源价值是有偏见的,因为它是变化无常的。RMST支持是一个强制性的终点在肿瘤研究中(14]。RMST和差异(或比例)在RMST显示几个临床和推理的优势。同时,RMST可以转化为限制意味着生存失去了,就是失去了从开始时间点的平均水平 RMST人力资源一直是一个有吸引力的选择。在一个随机对照试验,以反映Internet-accessed性传播感染的方便测试,不同RMST测试评估测试(时差15]。一个队列研究探索中年心肺适应性之间的关系和慢性阻塞性肺疾病进行Cox模型和RMST-based分析,这增加了其结论的可靠性和可理解性(16]。此外,RMST和RMST差异被认为是影响措施荟萃分析(17,18]。在RMST-based分析中,特定的时间 将决定指定大小的差异或比RMST是否不同或比是否具有统计学意义。幸运的是,关于研究设计一步一步的教程,样本量估算,的决心 与RMST详细说明(19]。

Trinquart等人基于生存曲线重建个体患者数据来自54个随机对照试验,重新估计小时,RMST比率,RMST差异(20.]。在大多数试验协议关于统计学意义的三个效果的措施和方向观察治疗效果。然而,作者不符合人力资源和RMST差异之间的关系,以及他们无法验证的关系调整效果的措施。在这项研究中,一个负数,修身,健壮的对数关系人力资源和不同RMST协变量(未调整和调整)观察会议PH值的假设。隐含的关系构造函数的可能性之间的转换差异RMST和人力资源,这可能在荟萃分析中发挥重要的作用。

混杂因素的存在会扭曲真正的接触和结果之间的关系,confounders-adjusted RMST差异是至关重要的。此外,精度和统计力量可以改善协变量调整后预后RMST[相比21]。Zucker开发的一种方法可以估计covariates-adjusted RMST效应基于Cox回归(22]。但是,它仅限于计算RMST感兴趣的一个二进制变量的影响(实验组和对照组)等混杂因素调整。当感兴趣的变量有两个或两个以上两组,标准化的生存曲线可以另一种方式23]。这个方法有两个步骤:(1)定义一个参考人口混杂因素;(2)评估调整曲线的人口。参考人口的定义是一个关键的步骤确定调整后的存活曲线的概括。两种方法被提出:边际分析(平衡数据混杂因素使用前重新建模)和条件分析(综合整体模型进行建模,得到平均预测曲线的一系列预测生存曲线的任意组合混杂因素)。

Zucker的方法和标准化的协变量的生存曲线必须明确部门感兴趣的变量和干扰因素,并调整差异RMST只能估计分类变量的兴趣。此外,PH值的假设是假定为在Zucker利用Cox回归的方法。同样,如果Cox回归于建模采用标准化的生存曲线的一部分,会议PH值的假设也是必需的。复杂的编程和困难扩展有限的友好的应用程序。RMST-based回归,用广义线性建模技术,研究单因素或多因素影响RMST没有限制变量类型和关键变量和混杂变量之间的区别。基于模型的推理和预测可以练习。此外,允许不同的回归方法,如非线性拟合和互动效果。

在IPCW回归,重量估计是基于一个正确地指定审查分布的关键一步。当一个直言感兴趣的协变量,单个重量或group-specified权重应该依据测试的结果审查机制的同质性假设[24]。IPCW回归与group-specified重量是正确的选择当协变量打破了假设。当直言协变量满足假设、参数审查分布在每个子群类似于一个完整的数据。与此同时,group-specified重量也可以用来获得准确的估计。在这项研究中,group-specified权重给更准确估计比个人重量为协变量分类,满足假设和不满足。然而,在多变量回归,如果不止一个直言不感兴趣的违反了假设,很难指定多个阶层在执行IPCW与类属特异性的权重。在这项研究中,强制采用IPCW与单个重量RMST偏见和误导性的差异。此外,逆概率概率时可能产生极端的重量接近0,和小样本大小可能会使逆概率不稳定(25]。这样限制IPCW回归,PV回归时应首选方法探索多个感兴趣的协变量的影响。编码pseudovalue方法开发了三个主要平台(SAS, R,占据)12,26,27]。

4.1。一个全面的应用程序流程图

全面介绍这些方法,我们画一个流程图两部分,(1)描述和组比较;(2)回归(见图3)。RMST-based方法提出了蓝色背景。

在第1部分中,统计描述生存数据包括总结措施(如事件的数量,平均存活时间,和RMST)和图形描述(如公里曲线)。感兴趣的分类协变量时,应该执行组比较差异的存活率和RMST。当你想要估计不同或比RMST团体之间,截断 需要指定。未经调整的不同或比RSMT直接可以通过公里曲线估计,可以估计一个标准化的公里调整曲线或Zucker的方法。在第2部分中,分类和协变量连续都是允许的。未经调整的,调整人力资源,生存时间比率(加速因子)和差异(或比例)在RMST可以估计目标效果的措施。一般来说,人力资源大于1意味着接触有害生存,加速因子和比例RMST生存意味着暴露的好处。如果PH值的假设是不满意,人力资源可以通过Cox回归估计不随时间变化或分层Cox回归与不同的基线风险率在每个分层。比率的生存时间(加速因子)可以估计加速度故障时间(AFT)模型,这需要prespecify存活时间,检查尾分布的假设,如威布尔分布。最后,PV回归和IPCW回归是用来评估不同RMST(或比例),和 需要指定。

4.2。限制

这项研究有一些局限性。首先, 中指定RMST-based分析确定RMST差异的大小和是否该数据具有统计上的显著差异,一般的策略选择 应用但多变的影响呢 没有研究。其次,估计系数之间的非线性关系人力资源和RMST没有广义差转换在其他研究中,一般的转换函数将被开发。最后,并不是所有的生存分析right-censored数据集成到流程图,生存分析left-censored数据,结局数据,经常性的事件,和竞争风险没有讨论。

5。结论

人力资源和不同RMST应该报道对平等考虑目前的综合影响和改善沟通的临床证据。协变量不止一个的利益时,公里方法和PV回归可以在RMST-based首选的方法。结合传统的生存方法的流程图和RMST-based方法可以帮助临床医生和外行来选择合适的方法。

缩写

人力资源: 风险比
IPCW: 反审查概率的概率
pH值: 成比例的风险
PV: Pseudovalue
RMST: 平均生存时间限制
预言家: 监测、流行病学、最终结果
与: 美国癌症联合委员会举办
STG: 存活时间获得
STL: 存活时间丢失。

数据可用性

数据和情景应用程序代码可以根据客户要求提供所有作者。

信息披露

这手稿已经发布在研究广场作为预印本。

的利益冲突

作者宣称没有利益冲突有关的出版。

作者的贡献

CT负责研究设计和文献综述。QH负责研究设计、数据收集,数据分析,和写作。所有作者都阅读和批准了手稿。

确认

本研究使用了链接SEER-Medicare数据库。这些数据的解释和报告作者的唯一责任。作者承认国家癌症研究所的努力;办公室的研究、开发和信息,CMS;信息管理服务(IMS)有限公司;监测、流行病学、最终结果(SEER)计划肿瘤登记SEER-Medicare数据库的创建。这项工作是支持的人文和社会科学基金会中国教育部(22 yjc630126)和对科学研究的资助项目从武汉市卫生委员会(WY22B08)。

补充材料

图形比例风险评估假设:图形评估(kaplan meier曲线和ln (ln (S (t)))和ln (t)曲线)的比例为协变量包括危险的假设。(补充材料)