文摘

相关生物标记物的识别与治疗效果是相关要求适当治疗分层,因此改善卫生保健管理个体病人最好的治疗。提出了各种统计方法,允许评估连续协变量之间的交互和治疗。然而,连续协变量的分类,例如,通过将数据分拆在观察中值,似乎是在实践中非常普遍。在本文中,我们提出一个模拟研究考虑数据中观察到一个随机临床试验比较结果进行比较这些方法的性质,即考克斯与线性回归互动,互动多变量多项式分段(MFPI),当地Partial-Likelihood引导(LPLB),治疗效果和群模式情节(STEPP)方法,并根据分类的策略连续协变量(分裂的协变量值,分割在四分位数,并使用一个“最佳”分割通过最大化一个相应的测试数据)。在不同的场景中,没有交互,线性相互作用或非线性相互作用,错误概率和检测的权力真正covariate-treatment交互估计。Cox回归方法比其他方法更有效与单调的场景交互,特别是当观察事件的数量是温和的小。当biomarker-treatment交互效应的模式更复杂,MFPI LPLB相比其他方法表现良好。分类的数据通常导致停电,但对于非常复杂的模式,将数据分解到多个类别可能有助于探索相互影响的性质。因此,我们建议应用统计学的方法发展的评估之间的交互连续生物标志物和治疗,而不是任意或数据驱动的连续协变量的分类。

1。介绍

医疗决策、预测各种疾病的生物标记发挥重要作用[1- - - - - -4]。生物标志物是称为“预测,“如果区别两个或两个以上的治疗方案的有效性取决于生物标志物的价值(5,6]。在存在定性biomarker-treatment互动(7),即。,when the choice of the “optimal” treatment for a given patient depends on the patient’s value of a certain biomarker, the biomarker can be used for treatment stratification [8]。生物标志物在临床实践中用于治疗分层,例如,人类表皮生长因子受体- 2 (her - 2)乳腺癌患者的地位(9,10]或表皮生长因子受体(EGFR)的突变在非小细胞肺癌(NSCLC) (11]。因此,鉴定生物标记,使预测治疗效果的不同治疗方案可提高临床决策至关重要的分层或个性化医疗(12]。

在实践中,调查这样的治疗效果异质性在一定的生物标志物的范围从随机临床试验获取的数据通常是由亚组分析(13),学习小组之间的差异的结果,量化,例如,风险比,优势比,或平均差,患者组具有类似特征的估计(14)和使用统计测试交互相比,可以由包括生物标志物和变量的乘积表示治疗分配在一个合适的回归模型15,16]。而这个过程是直观和简单的分类变量,如性别或出现并发症的糖尿病,治疗效果的调查异质性对连续变量,例如,年龄或连续测量血液参数,需要分类变量,当亚组分析。这样分类的连续变量被批评因为信息丢失导致停电检测真正的相互作用,生物难以置信的影响效果,从不同的研究结果缺乏可比性17,18]。因此,提出了各种方法在文献中,允许模型和测试治疗效果的异质性在连续变量的范围,不需要分类的变量19- - - - - -21]。

在本文中,我们描述一个模拟研究比较不同方法检测一个互动(预定义的)连续协变量和治疗。我们模拟的数据,他们将被收集在一个随机临床试验旨在比较两个治疗组的效果或治疗与安慰剂。因此,患者被随机分配到两个治疗手臂和感兴趣的变量的分布(通常称为生物标志物(22])预计将相同的两个治疗组。像大多数预测生物标志物发现治疗癌症的23),一个比较的结果是,通常总生存期或无进展生存被认为是在随机III期肿瘤试验(主要终点24]。结果连续变量的方法依赖于分类等方法,不使用分类进行调查。我们考虑一种方法把连续的生物标记的值来确定两个子组进行进一步分析,使用四子组在四分位数由分割数据,并使用一个“最优”的截断值最大化的瓦尔德统计发现Cox回归模型交互项。另外,我们应用程序处理效应模式情节(STEPP)方法,合并重叠的子组25),Cox回归模型(26)假设一个线性covariate-treatment交互,交互的多变量多项式分段(MFPI)方法,包含交互项的非线性转换(19),和当地Partial-Likelihood引导(LPLB),使用当地的估计治疗效果在不同的感兴趣的变量值27]。不同的场景与biomarker-treatment交互研究的缺失和存在为了估计和比较错误概率和统计的力量给定场景下的不同的方法。样本大小和审查分布不同调查这些特征对结果的影响。

本文组织如下。节2仿真研究。不同的方法用于识别biomarker-treatment交互不久介绍的部分2.1文章,引用原作,进一步包括考虑方法的更详细的描述。仿真研究和相关方面的设置,不同的部分中描述2.2。仿真研究的结果,即观察错误概率的场景没有真正biomarker-treatment交互和估计的统计力量与真正呈现biomarker-treatment场景交互,介绍部分3。结果与结论的讨论并给出我们的模拟研究的优点和局限性的部分4

2。方法

调查的方法模拟研究了部分2.1。细节的设置用于仿真研究和数据生成过程给出了部分2.2。数据生成和分析使用统计软件R [28]。Cox回归使用函数执行coxphR提供的库生存(29日,30.]。为了方便起见,感兴趣的连续协变量将被称为“生物标记”和表示Z整个部分。治疗分配将会由一个二进制变量T ,在哪里 代表,如一个实验性的治疗和 安慰剂控制或标准治疗。因为它似乎是最相关的效果在实践中,学习小组之间的同质性的风险比在感兴趣的生物标志物进行了研究。统计检验,显著性水平 是使用。完全拒绝概率计算95%置信区间。

2.1。方法检测Biomarker-Treatment交互
2.1.1。平均分割

在许多应用程序中调查治疗效果的异质性在连续的生物标志物方面,个人分成两个子组的大小。这是通过把数据值的生物标志物Z。这个过程将在本文中标记为“中间分裂”。一个二进制变量指标分配一如果生物标志物的价值值大于或等于其他观测值和零。为biomarker-treatment交互测试,与这个指标变量Cox回归模型,二进制处理指标,他们的产品(术语)的交互安装数据。的p交互项的瓦尔德测试值被用来决定是否没有biomarker-treatment互动的零假设可以指定的显著性水平上拒绝了

2.1.2。四分位数分裂

作为一种替代方法,个人被分成四组对应的四分位数的分裂感兴趣的生物标志物(“四分位数分裂”)。分类变量指示相应的子群被用作虚拟编码的名义独立变量Cox回归模型。此外,二进制治疗指标和之间的交互项虚拟编码分类变量指示生物标志物包括四分位数和治疗。似然比检验与R图书馆提供的三个自由度(31日)进行测试的biomarker-treatment交互。

2.1.3。“最佳”分割

对于这种方法,从此被称为“最优分割”,一个“最佳”截断值为连续变量分裂成两个子组确定的第一步。所有可能的截止值(最小群大小的限制 总体样本的大小),导致最大的瓦尔德统计值之间的交互项一分为二Cox回归模型中的生物标志物和治疗还包括相应的主要影响为独立变量被用来定义子组治疗效果评估的异质性。在第二步中,这些子组被视为如果他们预先定义的子组,执行和评估biomarker-treatment交互的分割过程中值的描述部分2.1。1

2.1.4。分组人口治疗效果模式情节(STEPP)方法

程序处理效应模式情节(“STEPP”)方法提出了伯内蒂和Gelber25]。STEPP过程,异质性的治疗效果在感兴趣的生物标志物的范围由估计效果评估在多个重叠的子组。此外,同时置信区间估计的方法和用于测试的零假设没有biomarker-treatment交互开发(25,32]。两个不同的版本,一个“tail-oriented”和“滑动窗口”的方法,提出了最初。在我们的模拟研究中,我们使用了“滑动窗口”的方法,在个人的数量在两个连续的子组举行(大约)不断增加和消除相同数量的观察和观测的数量连续两个子组之间的重叠是先天的。对于我们的分析,个人选择在每个子群的数量 和重叠的个体的数量 所以,子群的大小是100,与250年和200年的场景,500年和1000年的观察,和重叠的观测的数量是25日,50和100年,分别。这导致了总数的九子组认为无论样本大小。同质性的测试执行的风险比在所有子组为biomarker-treatment交互测试。一个排列测试推荐(32)是为每个模拟数据集使用500年进行排列。更多细节STEPP过程可以在找到33,34]。图书馆应用STEPP, Rstepp(35使用了)。

2.1.5节讨论。Cox回归模型与线性相互作用

为了避免分类的连续感兴趣的生物标志物ZCox回归模型(26假设一个线性相互作用Z和治疗T被认为是。这个过程意味着log-hazard学习小组之间的比例是线性相关的生物标志物的价值。主要的生物标志物的影响Z,治疗组T和他们的产品 作为独立变量Cox回归模型。的p瓦尔德测试交互项的价值被认为是决定拒绝零假设的biomarker-treatment交互。这个过程将被称为“Cox模型与线性相互作用”或“考克斯(线性Int。)”不久整个文章。

2.1.6。多变量多项式部分互动(MFPI)

允许非线性相互作用项,罗伊斯顿和Sauerbrei提出的多变量多项式部分交互(“MFPI”)的方法(19),这是基于多变量多项式分段(MFP)方法提出了罗伊斯顿和奥特曼36]。的非线性变换是感兴趣的生物标志物,和一个模型包括主处理和转换后的生物标志物的影响以及它们的相互作用而模型只包括相应的主要影响。在最初的出版物中,与两个多项式变换模型 (FP2)的集合 ,在哪里 表明一个对数变换,描述。识别最好的转换提出了确定模型中没有一个交互项通过转换的结合提供(日志)可能性最高的价值(后来称为flex1方法)。基于模拟研究的结果(37,38)考虑持续的结果,另一种方法只有一个多项式变换(FP1)和单独确定最好的转换模型和没有交互(flex3,可能导致嵌套模型)推荐。我们应用这两种方法,FP2-flex1 FP1-flex3方法,我们的模拟数据。测试存在biomarker-treatment交互,似然比测试比较有和没有交互项的模型进行了这两种策略。

2.1.7。本地Partial-Likelihood引导(LPLB)

提出另一种方法在文献中模型非线性交互作用之间的连续的生物标志物和治疗当地Partial-Likelihood球迷提出的估计等。21]。刘等人开发了一个引导的方法,称为当地Partial-Likelihood引导(“LPLB”),允许测试总体治疗效果和测试治疗效果是否在一系列连续的生物标志物(异构27]。在LPLB方法中,线性近似的处理效应估计在给定的生物标记的值是通过使用加权一阶泰勒近似数据在当地附近的生物标志物的价值利益。拟议的引导测试利用残余引导(39]。获得当地log-hazard比率的估计相比,获得的估计从标准Cox回归模型假设一个恒定的治疗效果在生物标记范围。的最大观测标准差异地方估计常数log-hazard比率被认为是检验统计量。在我们的模拟研究中,我们使用了R图书馆lplb(40)应用LPLB过程。当地估计得到的每一等分经验生物标志物分布。带宽,显示附近的观测量用于当地估计,使用0.2内核和Epanechnikov考虑权重。五百年引导样本为每个生成的数据集。

2.2。仿真设置

数据生成的模拟数据中观察到一个随机临床试验主要用于比较两个不同的治疗方案。因此,模拟个体被随机分配到两个治疗组 每组的等概率。感兴趣的协变量从一个均匀分布随机生成零的最小值和最大值。活动时间从个人风险的指数分布率根据分配的治疗组和节中描述了协变量的值2.2。1。审查时间从指数分布与利率节中描述2.2。3。低价值的两个变量被分配为观察时间和观察到的事件表示,如果画的事件时间小于相应的审查时间,和审查观察其他表示。

2.2.1。函数形式

为了估计错误概率和检测的统计力量真正存在交互作用与不同的方法,不同的场景。总的来说,六种不同的功能形式被认为是,两个不存在交互效应(场景1和2)和四个场景考虑不同形状的交互条款(场景3 - 6)。所有的场景都显示在图1,显示事件的风险率用于模拟时间依赖生物标志物的价值(黑色和固体灰色虚线和黑色规模/轴)和由此产生的风险比率(使用对数刻度)治疗组之间(红线和规模/轴)。

场景1。治疗和风险之间没有关联的事件和生物标志物之间的利益和风险事件存在;每个单独的故障率是设置为1时,无论治疗组和生物标志物的价值(图1(一))。 在哪里 表明风险率作为时间的函数。因此,群体之间的风险比所有协变量的值是1,表示没有biomarker-treatment交互。

场景2。在第二个场景中,风险率取决于生物标志物的价值Z两个治疗组,但治疗组之间的风险比为所有生物标记值是相同的,所以没有biomarker-treatment交互存在(图1 (b))。 导致风险比两个Z的所有值。

场景3。在第三个场景中,一个真正的线性相互作用(log-hazard规模)感兴趣的生物标志物和治疗之间的存在,导致治疗组之间的风险比一个生物标志物的价值 和的风险比 的一个值 风险比增加线性对数刻度。 场景显示在图1 (c))。

场景4。在第四个场景中,一个真正的定性biomarker-treatment交互,具有更高的风险事件接受治疗 治疗相比 患者的一个小的价值Z和下一个事件的风险更高 为个人的一个较大的值Z,被认为是(图1 (d))。风险比单调,但不是线性增加的生物标志物。 定性的交互显示的风险比小于一个值 ,比一个大

场景5。场景5,一个事件的风险下治疗的大部分人都很相似,但是风险增加接受治疗 对于大的值Z(图1 (e))。 因此,风险比接近小和适度值Z但增加大值。为 ,风险比达到一个值为2.94。

场景6。在第六个场景中,集团的风险比 根据Z遵循一个u型,而风险率 是负u形(图1 (f))。 这个设置会导致较低的定性biomarker-treatment交互风险事件 小和大的值Z和较低的风险下 ,其他表示由一个反向u型风险比的范围Z

2.2.2。样本大小

为了评估方法的属性是否在考虑相关试验的样本量,样本大小是选择三个不同的设置。生成的数据集包括250、500、或1000个人,这似乎是典型的随机临床试验的样本大小。

2.2.3。审查分布

除了样本大小,审查分布不同的生产场景与不同数量的观察事件。审查时间从指数分布与风险率 ,分别生产场景与审查的比例 ,导致数量约为188、375和750年预期事件场景的审查的观察和较低的83年,167年和333年预期事件大量的不同情况进行审查的观察。

3所示。结果

为每个36节中描述的场景2.21000数据集生成和部分中提出的方法2.1被应用。的p值相应的统计检验biomarker-treatment交互得救了,相比传统的显著性水平 产生频率的第一类错误,即,proportions of simulated datasets for which a statistically significant biomarker-treatment interaction was found, although it is not present in the corresponding scenario (Scenarios 1 and 2), are shown in Figure2所有考虑方法和也与95%的置信区间表列表1。可以看出,该方法使用的“最优”割点定义两个子组相比,假阳性结果的概率 在零假设的场景模拟数据,不考虑样本的大小和数量的审查的观察。交互的多变量分式多项式(MFPI)过程与FP1-flex3策略也提供了错误概率的增加 这主要是由于这些数据集的不同选择生物标志物的多项式变换模型和不考虑biomarker-treatment交互,导致嵌套回归模型的比较。当只有模拟数据集被认为是,相同的转换被用于模型和没有交互项,因此两个嵌套模型比较,估计错误概率不等 相反,对不同的数据集选择转换,零假设是错误地拒绝了 相应的模拟运行。下的模拟场景2低样本容量为250的观察和大量的审查观察,导致预期的数量大约83事件,第一类误差频率超过名义显著性水平观察方法。

在数据3(场景3和4)4(场景5和6)和表2(场景3和4)3(场景5和6),场景与真实biomarker-treatment互动的结果。因此,可以解释为拒绝零假设的频率估计的统计方法在相应的设置。随着过程使用两个子组定义为最优,数据驱动割点(最优分割)和MFPI (FP1-flex3)方法提供错误概率贴切地超过名义水平 ,这些过程不考虑统计力量的对比,因此不会显示在数字34。然而,这项研究的结果发表在表23斜体的完整性。

场景的实现标准Cox回归模型的假设一个线性相互作用项(场景3)Cox模型与线性相互作用优于所有其他调查方法实现最高的观察统计力量(数字3(一个)3 (b)和表2)。MFPI (FP2-flex1)方法执行定义的方法使用两个子组略优于一个分裂的中间变量预期事件的数量大的时候,但情况与1000年的观察和低的审查的观察,观察到的功率低约10百分点这些方法相比Cox回归模型的交互项考虑生物标志物作为连续变量(Cox模型与线性相互作用: ;MFPI (FP2-flex1): ;分裂中位数: )。方法把数据分成4个亚组(四分位数分裂),STEPP, LPLB比其他方法执行的。

在场景4中,考虑情况稍微非线性相互作用,Cox回归模型考虑到连续的生物标志物再次表现最好,之后(至少对于场景与大量的事件)的MFPI (FP2-flex1)的方法。对于中小型的事件数据,数据的方法依赖于分类(平均分割和四分位数)执行类似MFPI (FP2-flex1)。选择设置,估计实力LPLB和STEPP小于其他调查方法(数据3 (c)3 (d)和表2)。

相当复杂的场景5以下事件风险几乎相同的治疗大多数病人和治疗越来越区别大值的生物标志物,这MFPI (FP2-flex1)方法在场景中表现最好与大量的观察事件。对于大量的审查情况观察,Cox模型与线性相互作用表现略好温和的样本大小(小)或非常相似的(大样本大小)MFPI (FP2-flex1)(数据4(一)4 (b)和表3)。审查时低,样本量大,LPLB方法达成了一项观察能力,接近MFPI (FP2-flex1)和略优于Cox回归模型。而分类使用平均分割比其他方法对于大多数设置场景5(例如,观察到的权力 和少量的审查的观察 ),分裂研究人口四子组(四分位数分裂)提供结果,贴切地比平均分割(估计所设置的权力 ),但比MFPI (FP2-flex1) ( ),Cox回归线性相互作用( ),或LPLB ( )。

在场景6,只有研究场景nonmonotonous风险比的范围感兴趣的生物标志物,Cox模型与线性相互作用和过程定义子组观测值(平均分割)无法识别当前biomarker-treatment交互(估计之间的权力 与线性之间的交互和Cox模型 值分割)。LPLB最高的实证观察能力和方法定义四子组观察到的四分位数(四分位数分裂)。STEPP和MFPI能够识别相关的生物标志物和治疗效果之间的关联生成的数据集的数量,但是执行比LPLB和四分位数(数字4 (c)4 (d)和表3)。

4所示。讨论

众所周知,接受不同的病人有不同的反应相同的待遇。因此,治疗决策,病人或疾病的特点,例如,肿瘤,应考虑。预测生物标志物。,variables that are associated with the treatment effect, e.g., a hazard ratio between two treatment groups, play an important role for treatment selection. Evidence, whether a biomarker is truly predictive, can only be derived from randomized trials involving patients with different values of the biomarker of interest [8]。在实践中,治疗效果的异质性在不同因素的分类变量或在一个连续变量的范围收集的数据在一个随机临床试验往往是分析的子群分析,评估患者的治疗效果相似的特征和子组间比较治疗效果上使用一个测试交互(14]。虽然这个过程很简单对于分类变量,它依赖于连续变量的分类。显示为不同的研究问题,分类导致停电检测真正的协会(41,42),基于分类和子群的解释分析连续变量往往是批评因其缺乏生物合理性和增加机会的发现(17,18,43]。一个共同的方法来调查这些连续的生物标记物之间的相互作用和治疗没有分类的包含产品的生物标志物和治疗指标作为自变量的回归模型假设一个线性相互作用项。允许更灵活的造型的治疗效果和生物标记值之间的关系,各种方法放松的线性假设的交互项,例如,治疗效果的群模式情节(STEPP)交互的多变量多项式分段(MFPI) [19),或本地Partial-Likelihood引导(LPLB) [27)方法,开发。

对比这些方法在文献中很少存在。罗伊斯顿和Sauerbrei MFPI和STEPP方法适用于不同的数据集44]。最近,我们调查了年龄和治疗之间的相互作用在随机试验中比较颈动脉支架植入(CAS)和颈动脉内膜切除术(CEA)患者症状,严重颈动脉狭窄(空间试验45,46])。在这个分析中,从不同的方法非常相似的结果包括与线性相互作用,Cox回归STEPP, MFPI, LPLB [47]。我们最好的知识,只有少量的模拟研究进行比较的属性不同的程序在已知场景。罗伊斯顿和Sauerbrei进行了仿真研究,比较不同MFPI策略与其他回归模型和方法依赖于分类设置连续变量的连续的结果(37,38]。在所有的不同的MFPI策略调查下,MFPI (FP1-flex3)方法,使用一个多项式变换和允许不同的功能形式的模型与不考虑covariate-treatment互动,被确认为“最佳”MFPI方法。伯内蒂等人的影响进行了模拟研究来评估STEPP方法的参数设置错误和统计能力和比较结果的Cox回归模型与线性相互作用项(32]。刘等人也比较性能的提议LPLB Cox回归模型的线性方法交互项(27]。由于缺少信息属性可用不同的方法在文献中提出的识别biomarker-treatment交互,我们进行了模拟研究比较估计错误概率和统计相关方法在不同的场景。我们的目的是执行一项研究的“中性”模拟研究中描述(48)我们不支持任何的调查方法和没有参与其中任何一个的发展或出版物。

可以预料到的,我们观察到程序使用一个最优截断值由最大化瓦尔德之间的交互项统计一分为二感兴趣的生物标志物和治疗在Cox回归模型定义的子组导致了一个错误的概率 这是观察到同样的奥特曼等人提出的模拟研究的天真使用最少p分类的一个潜在的预后变量值(49]。有趣的是,错误概率的增加 在这两种场景的数据模拟下的零假设也观察到MFPI (FP1-flex3)方法无论样本大小和审查分布。这是由于不同的转换被选为模型的数据集有或没有一个交互项。罗伊斯顿和Sauerbrei[在仿真研究37),不相关的概率增加假阳性结果被确认为MFPI (FP1-flex3)方法对于大多数调查场景与观察到的相对频率类型从一个错误 只对感兴趣的场景复杂的函数形式和协变量偏态分布(称为“糟糕的表现后的分布x“在[37]),增加错误的概率 被发现。也许这个问题不明显与定量的结果比线性回归设置为我们的调查比较端点。最初提出MFPI (FP2-flex1)方法没有执行导致假阳性结果的概率增加,通常对所有场景。时优于所有其他方法与风险比恒定在一个场景中广泛的生物标志物和增加个人值大事件的数量大时,效率略低于一个Cox回归模型与线性相互作用项的存在一个真正的线性或接近线性biomarker-treatment交互。通常,Cox回归模型与线性相互作用项表现得比其他调查方法对许多场景。它提供了一个可接受的假阳性结果的概率和统计能力高于所有其他方法与一个真正的线性相互作用的场景。对于中小型的事件数量,Cox回归模型也优于其他方法与非线性单调的场景交互影响。在一个场景中生成的数据提供一个nonmonotonous相互影响的范围感兴趣的生物标志物,Cox回归模型假设一个线性相互作用项无法发现这种联系。LPLB过程,错误频率不超过名义出示相关的显著性水平和足够的统计能力比其他方法观察场景的复杂函数形式的风险比生物标志物。程序把数据分成两个子组(中位数分裂)导致减少权力对大多数场景,也为其他研究问题处理分类描述连续协变量(41,42]。对于复杂的关联,分成一个小数量的子组可能是一个适当的数据探索的第一步,也是在EMA指南推荐的子群分析(14),或可用于验证非线性关联发现相应的方法还建议在38]。

我们的模拟研究也有一些局限性。由于有限的时间和空间,只有一小部分不同的场景可以调查。我们考虑两个场景的数据生成的零假设下没有biomarker-treatment交互和四个设置不同形状的真正biomarker-treatment交互。此外,我们不同的样本大小和使用两个不同数量的审查的观察。我们没有改变数据生成过程的进一步方面感兴趣的协变量的分布或进一步协变量的影响。虽然有些方法作为Cox回归模型拟合的线性MFPI方法的交互的数据或应用程序不依赖于优化参数的规范,其他方法如STEPP或LPLB允许更大程度的用户参与,让申请人选择,例如,子组的大小或重叠的个体数量STEPP或点的数量用于LPLB当地的估计和带宽。我们只使用一个设置每一节中描述的方法2.1,我们的发现只是这些具体有效的选择,但可能不会转移到一般的方法。还需要进一步的模拟研究调查不同的调优参数的作用这些方法的性能。在实际应用中,可以允许更多的学科知识足够的规范,这可能提高性能的方法相比,我们的固定设置。另外,我们只研究了一个潜在的预测生物标志物和治疗,如果调查的相互作用,生物标志物和治疗是指定的主要研究问题。在实践中,这些分析通常会进行探索性二级或附加分析,可能涉及多个感兴趣的生物标志物,和多重性问题通常在这些情况中发展必须充分解决。如果测试一个预定义的生物标志物和治疗之间的交互的主要兴趣,这被认为是计划阶段的临床试验,因此样本容量的计算,样本量大,经常需要检测biomarker-treatment互动(50]。

它必须是认为我们的模拟研究只针对检测biomarker-treatment交互。据陈et al .,需要三个步骤来建立一个预测生物标志物在临床实践:生物标记的识别,选择适当的子组治疗分层,和评估的临床效用。因此,预测生物标记的识别之后,子组,应该采用不同的治疗方案。连续生物标志物,这可以通过应用分类技术(51]或处理效应估计的探索模式在生物标记的值的范围。直观的可视化STEPP或所提供的“治疗效果阴谋”(52]MFPI的过程是很有帮助的。此外,进一步的潜在风险等方面,病人接受,必须考虑成本。临床实用程序可能被随机临床试验研究了使用biomarker-stratified或biomarker-strategy设计描述的昂德拉et al。53]。

作为我们的模拟研究的结论,我们建议执行更详细和复杂的分析检测biomarker-treatment比一般交互执行子群分析涉及连续变量的二分。Cox回归模型考虑线性相互作用项的概率将增加检测真正的互动相比一分为二变量的使用在许多应用程序中。方法开发检测的非线性相互作用可以帮助识别预测生物标志物的存在复杂的模式。我们相信,更好地利用可用的统计方法将有助于识别和建立预测生物标志物和增加,到目前为止有限(54生物标志物在临床实践中用于治疗),分层,从而有助于改善健康照顾个别病人。

数据可用性

所有的发现是基于模拟数据。R数据生成的代码可以从相应的作者在获得合理的请求。

的利益冲突

作者宣称没有利益冲突有关这篇文章的出版。

确认

这项工作是支持的德国研究基金会(DFG)和慕尼黑工业大学在开放获取出版资助项目。