regularizations, to select key risk factors in the Cox’s proportional hazards model using microarray gene expression data. The harmonic regularization method can be efficiently solved using our proposed direct path seeking approach, which can produce solutions that closely approximate those for the convex loss function and the nonconvex regularization. Simulation results based on the artificial datasets and four real microarray gene expression datasets, such as real diffuse large B-cell lymphoma (DCBCL), the lung cancer, and the AML datasets, show that the harmonic regularization method can be more accurate for variable selection than existing Lasso series methods."> 小说谐波正则化方法Cox比例风险模型的变量选择 - raybet雷竞app,雷竞技官网下载,雷电竞下载苹果

计算和数学方法在医学

PDF
计算和数学方法在医学/2014年/文章

研究文章|开放获取

体积 2014年 |文章的ID 857398年 | https://doi.org/10.1155/2014/857398

Ge-Jin楚,勇梁,Jia-Xuan王, 小说谐波正则化方法Cox比例风险模型的变量选择”,计算和数学方法在医学, 卷。2014年, 文章的ID857398年, 9 页面, 2014年 https://doi.org/10.1155/2014/857398

小说谐波正则化方法Cox比例风险模型的变量选择

学术编辑器:Andrzej Kloczkowski
收到了 2014年4月23日
修改后的 2014年7月13日
接受 2014年7月25日
发表 2014年11月24日

文摘

变量的选择是一个重要的问题在回归和大量的变量选择方法提出了涉及凸惩罚函数。在本文中,我们研究一种新型谐波正则化方法,可以近似凸 合法化,选择关键风险因素Cox比例风险模型的使用微阵列基因表达数据。谐波正则化方法可以有效地解决了使用我们提出的直接路径寻求方法,可以产生解决方案,密切近似凸损失函数和非凸正规化。仿真结果的基础上,人工数据集和四个真正的微阵列基因表达数据集,如真正的弥漫型大b细胞淋巴瘤(DCBCL),肺癌,AML的数据集,表明谐波正则化方法可以更准确比现有的套索系列变量选择方法。

1。介绍

生存分析的最重要的一个目标是选择少量的关键风险因素从许多潜在的预测1]。通常,Cox比例风险模型(2,3是用于研究预测变量和生存时间之间的关系。假设一个数据集的样本大小 研究生存时间 在协变量 ;我们使用的数据形式 代表个人的样本,存活时间 被完成 并对审查如果 。在回归中, 是一个潜在的预测向量。

Cox比例风险模型,给出风险函数 基线风险函数在哪里 未指定的, 是回归系数向量的 变量。考克斯的部分对数似是表示为 在哪里 表示的指标集个体生存的时间

在实践中,只有少量的预测变量对风险率的影响。的目标变量Cox比例风险模型的选择是选择的关键风险因素。最近一系列的处罚偏似然方法,等 (4- - - - - -7), ( )[8), (9,10]惩罚方法提出了对Cox比例风险模型。这些处罚偏似然方法找到重要的风险因素通过减少一些回归系数为零。

标准的处罚方法不能直接适用于非线性Cox模型获得参数估计。因此,Tibshirani [11)提出了一个迭代过程将考克斯的部分对数似函数(2)线性回归问题。让 , ,表示 预测变量矩阵, , , , ,在那里 是一个广义逆的 。因为一般二次规划不能直接解决的情况下 、Gui和李12]Choleski分解获得应用 这样 , , 。泰勒展开式,部分对数似 由二阶近似形式: 因此,正则化方法可以直接解决处罚回归的问题: 在哪里 是调优参数。

Tibshirani [5)提出了套索(至少绝对收缩和选择算子)方法,它 点球 减少小系数为零,因此导致解决方案的稀疏表示。风扇和李4]提出了顺利剪绝对偏差(许多)点球,这避免了过度惩罚系数大,喜欢甲骨文属性。张(7)提出了极大极小凹+ (MCP)方法,这是一个连续和近无偏在高维线性回归方法。张先生和陆6拉索)提出一种自适应与自适应方法 损失估计的参数,它使用惩罚 ,重量 选择自适应的数据。邹和Hastie13)提出了一个弹性网相结合的方法 ( )处罚。

上述一系列正规化回归方法是基于 点球。最近,一些工作学习稀疏模型强调其他惩罚措施的需要实现更好的稀疏概要文件。例如,安全,朱14建议使用 点球,这只是在于取代 规范与凸 规范 。张(15)提出了一种多级凸放松计划,可以轻松的平滑 正则化。Mazumder et al。16追求一个coordinate-descent方法与非凸惩罚(SparseNet)和研究其收敛性能。徐et al。9,10)的属性进行进一步探究 ( )点球和显示的极端重要性和特殊作用 正则化。在我们以前的工作(17,18),我们开发了几个使用快速算法 罚款来解决逻辑回归模型和Cox模型。我们的计算结果表明 正则化优于一些 正则化方法。在本文中,我们提出一种新型谐波近似的正则化方法 ( )处罚。我们也调查快速谐波正则化算法来解决高维度低Cox模型(“大样本容量问题 问题”)。

剩下的纸是组织如下。部分2描述了谐波正则化方法。部分3给出了谐波正则化算法来获取表单Cox模型估计。部分4评估我们的方法通过仿真研究和应用四个真正的微阵列数据集,如弥漫型大b细胞淋巴瘤(DLBCL)数据集的生存时间和基因表达数据。部分5总结了论文的一些有用的评论。

2。谐波正规化

一般来说,一个统一的框架正规化的机器学习形式: 在哪里 是一个损失函数, 是罚函数, 是一个调优参数。不同的 这是在对应不同的惩罚约束模型,所以不同的解决方案。惩罚约束是最弱的时候 和变得更强 增加。

显然一个正规化(5)可以除以两个元素,损失函数 和罚函数 。此外,不同的损失函数和惩罚会导致不同的算法。例如,当损失函数是铰链的损失和罚款 ,结果是一个支持向量机算法。让平方损失和损失函数使用 表示 正则化方法,如果 ,是岭回归(19),可以用来解决病态问题。如果 ,是子集回归(20.],它适用于 用罚函数正则化 。当 ,套索算法(21),应用 正则化。套索及其变化(或套索式算法),如弹性网(13,竹荚鱼4],MCP [7),自适应套索(6),和级间套索22)是近年来广泛研究和应用领域的统计和机器学习。

众所周知, 正规化是理想的变量选择。不幸的是, 正则化是一个组合优化问题,很难得到解决。相比之下, 正则化会导致一个凸优化问题,很容易解决,但它不收益率充分稀疏的变量选择。Donoho et al。23,24)表明, 正规化相当于 在某些条件下正规化。因此这些强加的条件无论如何描述这些问题 正则化,会产生相同的稀疏的解决方案。然而,对许多实际问题,稀疏的解决方案获得通过 正规化是远不是等价的。特别是,发现与解决方案 正规化是经常发现少一样稀疏的解决方案 正则化。

事实上,当 , 正则化自动执行变量选择通过消除预测与估计很小的非零系数。越小 是,稀疏的发现与解决的方法 正则化。这导致研究人员研究 正则化与 因为它可以找到比发现更稀疏的解决方案 正规化和容易得到解决 正则化。例如,张(15)提出了一种多级凸松弛与非凸目标函数方案解决问题。学习与稀疏正则化配方,他们分析了特定的行为多级放松计划。

然而,应用程序的 罚函数与 不常吸引了太多的关注主要是由于原因,当完成的 ,罚函数的变化从一个凸凸函数,所以相应的优化问题并不容易解决。事实上与此同时,另一个困难是,罚函数的微商的起源 导致的失效通常优化算法。

在本文中,我们提出了谐波正规化可以近似的 惩罚与 ,因为一些研究表明,工作 点球可以作为代表 ( )处罚22]。谐波正规化方案可以表示为 在哪里 。当收缩参数 接近1, 、谐波正规化接近 正则化。当参数 接近2, 和谐波正规化接近 正则化。此外,比较的 ( )处罚,谐波正规化的财产,它的一阶导数在起源是有限的,这意味着相应的正则化问题可以通过直接寻求有效的解决方法。

3所示。考克斯的谐波正则化算法模型

在本节中,我们提出一个广义路径寻找算法的谐波正规化考克斯的模型。正如在上一节中提到的,当 ( )正则化应用,不可避免的困难是如何有效解决造成的非凸优化问题 ( )正规化(很容易看到的 ( )正规化,惩罚项变成凸)。幸运的是,直接路径寻求可以克服这种困难。寻求直接的路径,进而构造一个路径直接在参数空间中,密切接近,罚函数,而无需反复求解数值优化问题。受欢迎的路径寻求基于平方误差包括偏最小二乘回归(请,23]),提出了逐步回归22),至少角回归(25),分段线性路径(14),梯度增加。弗里德曼(26)提出了广义路径寻求,可以产生解决方案,密切近似任何凸损失函数和凸约束。路径寻求方法的优势为我们提供一种新的方式来解决这个问题的正则化凸点球。我们将提出一个新的广义路径寻求方法解决谐波正规化。

我们让 在哪里 。请注意, 这表明每个添加剂术语 是一个单调递增函数的绝对值的论点。这意味着净正规化罚函数我们建议符合一般路径寻找算法的有效性(11]。让 沿着路径和测量长度 一个小的增量。定义 ,让 然后,我们把谐波Cox模型的正则化算法程序如下:(1)初始化 , , ;(2)计算 基于(3使用当前值) , ;(3)循环{(4)计算 , ;(5) ;(6)如果 ;(7)其他的 ;(8) ;(9) , ;(10) ;(11)},直到 , ;(12) ,回到第2步,直到满足收敛性判据。

在上面的算法步骤2后,每一步的系数 与相应相反的迹象 识别。当一组 是空的,相对应的系数的最大组成部分 选择,绝对的值在步骤6。当有一个或多个元素集 相应的系数最大 而是选择在这个子集。选择的系数是少量的增量的方向相应的迹象 尽管所有其他系数保持不变,屈服点解下一个路径 。迭代继续,直到所有的组件 然后该算法达到正规化谐波正规化Cox模型的解决方案。

4所示。模拟

4.1。收缩参数的选择 和调优参数

选择收缩参数和调优参数 ,我们使用交叉验证部分的最大化(CVPL)方法提出的可能性van Houwelingen et al。27),它被定义为 在哪里 代表了估计 基于谐波参数正则化过程 从没有数据 主题。条款 是日志部分和所有的科目,没有可能吗 分别th主题。参数的最优值 选择每个主题的贡献之和最大化到日志部分网格的可能性 。CVPL是更一般的特殊情况旨在方法模型选择和可能性已经证明在预测表现良好的背景下处罚Cox回归。

4.2。模型验证措施

的性能措施审查生存数据更为复杂:测量只能计算如果案件审查的做法是不正确的。因此,一些特别设计的测量方法已经提出了文献。在本文中,我们采用集成荆棘得分(IBS) (28)和一致性指数(CI) (29日)评估的正则化方法的预测能力。

野蔷薇的分数(IBS)集成。荆棘分数(BS)被定义为时间的函数 通过 在哪里 表示kaplan meier估计的分布和审查 估计病人的生存率 。请注意, 依赖于时间点 ,它的值在0和1之间。良好的预测时间 导致小b的值。集成的荆棘得分(IBS)给出 肠易激综合症是用来评估预测生存函数的善良的观察每次和0之间

一致性指数(CI)。一致性指数(CI)可以理解为所有对科目的分数预测生存时间是正确的命令在所有科目,实际上可以命令。通过词的定义,我们可以确定 ,在那里 是生存函数。的对 也不 可以确定被排除在CI的计算。因此,CI的定义是 注意,CI的值在0和1之间,建筑的完美的预测模型会导致1而随机的CI值0.5。

4.3。模拟数据的分析

在本节中,我们评估的性能谐波Cox模型的正则化方法在模拟研究。我们生成高维样本量和低数据包含许多无关的特性。六个方法比较与我们提出的谐波正则化方法(HRA):套索罚款( ),顺利剪绝对偏差点球(竹荚鱼)、极大极小凹点球(MCP),自适应拉索(索),弹性网( ), 罚款( )。

我们采用Cox模型模拟方案在弯曲机的工作30.]。数据生成过程如下。

步骤1。我们生成的向量 独立标准正态分布和预测向量 是由 ,在那里 相关参数的预测向量。

步骤2。的生存时间 ( , 表明样本大小)是由一个均匀分布变量 通过 ,在那里 是形状参数, 尺度参数, 是地面真回归系数, 独立随机误差生成的 , 是控制信号噪声参数。

步骤3。审查时间点 获得的指数分布 ,在那里 由指定审查决定。

步骤4。在这里,我们定义 ,观察到的数据表示为 Cox模型(1)生成。

在每个模拟,维度 的预测向量 1000年,前五个真正的系数是零: , , , , , 。大约25%的数据是正确的审查。我们考虑的情况下训练样本大小 、150、200、相关系数 、0.5和噪声控制参数 ,分别0.5。评估实验的可变性,每个方法评估测试组包括100随机生成的样本。

最优调优参数的估计 在正则化模型可以在很多方面,常常是通过完成 倍交叉验证(简历)。注意的选择 将取决于训练集的大小。在我们的实验中,我们使用10倍交叉验证 。弹性网方法有两个调优参数;我们需要旨在在一个二维表面。

1显示的平均数量变量选择和每个正则化方法回收率在500年运行。恢复率被定义为所选的平均数量的比率相关变量( )所选变量的平均数(9]。如表所示1,当样本容量 增加,所有的七个方法的预测性能改善。例如,当 ,选择的变量的平均值谐波正则化方法从6.6下降到5.8,其回收率提高与样本大小从0.72到0.86 从100增加到200。当相关参数 和噪声参数 增加,变量选择表演的七个方法降低了。例如,当 ,平均回收率的谐波方法从0.86下降到0.71,在其中 从0.2增加到0.5。当 ,平均回收率的谐波方法减少从0.63到0.50,在其中 从0.1增加到0.5。此外,在我们的模拟中,噪声的影响可能比变量相关的所有七个方法的预测性能。另一方面,在同一参数设置情况下,回收率和谐波的方法 罚款几乎比其他五个方法的结果。例如,当 , 谐波方法的回收率是0.72比0.14,0.43,0.54,0.28,和0.13的套索,竹荚鱼,MCP,适应性套索,和弹性网,分别比0.71了 惩罚的方法。


相关系数。 大小 平均变量选择
竹荚鱼 MCP Len 极品


One hundred. 33.4 11.6 9.2 17.8 35.8 6.6 6.6
150年 29.7 9.8 7.9 12.8 31.2 5。9 6.3
200年 24.4 8.4 6.1 9.4 24.8 5。7 5。8


One hundred. 43.2 14.8 11.7 22.9 46.9 9.9 9.7
150年 34.5 11.2 8.7 16.5 36.3 7.2 7.3
200年 26.7 9.7 7.7 11.4 28.2 6.5 7


One hundred. 45.1 15.1 12.2 27.2 47.8 10.8 10.9
150年 39.3 11.9 10.8 20.1 44.3 8.4 8.3
200年 27.1 10.1 8.4 12.6 30.6 7.3 7.7


One hundred. 55.6 17.7 16 32.7 56.3 13.9 15.2
150年 47.3 15.9 14.8 25.9 48.6 9.4 10
200年 36.8 13.7 12.5 19.5 41.6 7.8 7.8

相关系数。 大小 回收率
竹荚鱼 MCP Len 极品


One hundred. 0.14 0.43 0.54 0.28 0.13 0.71 0.72
150年 0.16 0.51 0.63 0.39 0.16 0.8 0.79
200年 0.2 0.59 0.81 0.53 0.2 0.87 0.86


One hundred. 0.11 0.33 0.42 0.21 0.1 0.5 0.51
150年 0.14 0.44 0.57 0.3 0.13 0.65 0.63
200年 0.18 0.51 0.64 0.43 0.17 0.7 0.71


One hundred. 0.11 0.33 0.4 0.18 0.1 0.46 0.45
150年 0.12 0.42 0.46 0.24 0.11 0.59 0.6
200年 0.18 0.49 0.59 0.39 0.16 0.62 0.63


One hundred. 0.08 0.28 0.31 0.15 0.08 0.35 0.32
150年 0.1 0.31 0.33 0.19 0.1 0.51 0.5
200年 0.13 0.36 0.4 0.25 0.12 0.61 0.61

评估七个正则化方法的预测性能Cox模型,我们提出了他们的平均IBC和CI值之间的模拟数据集表500倍2


相关系数。 大小 平均肠易激综合症
竹荚鱼 MCP Len 极品


One hundred. 0.084 0.094 0.086 0.084 0.082 0.091 0.086
150年 0.081 0.087 0.084 0.08 0.08 0.084 0.079
200年 0.078 0.086 0.079 0.083 0.076 0.078 0.076


One hundred. 0.096 0.092 0.097 0.096 0.094 0.098 0.093
150年 0.092 0.091 0.094 0.094 0.087 0.089 0.09
200年 0.088 0.088 0.086 0.087 0.085 0.086 0.086


One hundred. 0.105 0.098 0.101 0.102 0.097 0.101 0.094
150年 0.098 0.096 0.099 0.102 0.092 0.098 0.091
200年 0.091 0.092 0.096 0.096 0.089 0.095 0.09


One hundred. 0.108 0.103 0.108 0.106 0.099 0.01 0.098
150年 0.101 0.097 0.1 0.096 0.093 0.094 0.097
200年 0.084 0.094 0.086 0.084 0.082 0.091 0.086

相关系数。 大小 平均词
竹荚鱼 MCP Len 极品


One hundred. 0.749 0.788 0.822 0.757 0.851 0.838 0.845
150年 0.832 0.853 0.869 0.838 0.868 0.865 0.87
200年 0.85 0.847 0.857 0.859 0.864 0.859 0.862


One hundred. 0.728 0.758 0.767 0.716 0.727 0.761 0.763
150年 0.82 0.841 0.833 0.831 0.853 0.847 0.837
200年 0.847 0.857 0.862 0.846 0.869 0.862 0.866


One hundred. 0.726 0.758 0.752 0.745 0.752 0.758 0.748
150年 0.781 0.818 0.821 0.793 0.819 0.813 0.821
200年 0.786 0.835 0.826 0.792 0.839 0.824 0.828


One hundred. 0.699 0.712 0.701 0.685 0.719 0.716 0.714
150年 0.766 0.777 0.817 0.788 0.814 0.818 0.814
200年 0.776 0.801 0.82 0.808 0.821 0.819 0.819

IBC和CI,对不同参数的设置,没有方法几乎比其他人表现的更好,但是他们的预测性能只有微小的差异。例如,当 , , IBS的谐波方法的,平均为0.079,比0.081,0.087,0.084,0.08,0.08,和0.084的套索,竹荚鱼,MCP,适应性套索,弹性网 点球。当 , , ,CI的谐波方法的平均是0.845,比0.749,0.788,0.822,0.757,和0.838的套索,竹荚鱼,MCP,适应性套索, ,但轻微的比0.851通过弹性净损失的方法。

结合研究结果报道在表1我们得出的结论是,谐波处罚方法显示,或等价的预测性能优于其他正则化的方法。

4.4。真正的微阵列数据集的分析

在本节中,我们评估谐波性能的正则化方法对实体生存基因表达数据集。四个公开数据集用于这部分。下面给出这些数据集的简要描述和总结在表3


数据 数量的基因 数量的样品 审查的数量

DLBCL (2002) 7399年 240年 102年
DLBCL (2003) 8810年 92年 28
肺癌 7129年 86年 62年
AML 6283年 116年 49

数据集弥漫型大b细胞淋巴瘤(DLBCL) 2002。这个数据集出版的罗森沃尔德et al。31日]。数据集由240名样本病人。对于每一个样本,7399个基因表达测量得到。临床结果存活时间,观察或审查。

数据集弥漫型大b细胞淋巴瘤(DLBCL) 2003。这个数据集来自罗森沃尔德et al。32]。它由92淋巴瘤患者,每个病人都有8810个基因。

肺癌的数据集。肺癌数据集来自啤酒等。33]。它由83名患者的4966个基因的基因表达式。存活时间以及审查状态。

AML的数据集。AML数据集来自布林格et al。34]。它包含了6283个基因表达谱的116名患者,和审查的数量情况下是49。

我们七个估计正则化方法的预测精度评估使用随机分区:训练集约2/3的病人用于评估和测试集约1/3的病人用于测试的预测能力。估算 ,我们采用5倍交叉验证方案使用训练集,我们每个步骤重复200次。

4报告基因选择每个方法的平均数量。谐波正则化方法执行更好的比 类型方法(套索、竹荚鱼、MCP适应性套索,和精英网),并略比 点球。如表所示4,DLBCL(2002)的数据集,谐波处罚方法选定的大约71个基因,到174年相比,129年,129年,146年和180年五套索,竹荚鱼,MCP,适应性套索和精英网,略优于76了 点球。对DLBCL AML(2003)和数据集,最好的一个 处罚和第二个是谐波方法。


数据 竹荚鱼 MCP Len 极品

DLBCL (2002) 174年 129年 129年 146年 180年 76年 71年
DLBCL (2003) 138年 106年 95年 168年 142年 32 37
肺癌 188年 104年 97年 233年 196年 56 48
AML 161年 120年 110年 176年 166年 65年 70年

粗体是最好的性能。

评估预测性能,我们总结的结果肠易激综合症和CI获得的七个方法,分别在表5。IBS的结果和CI,所有正则化方法的结果,并没有太多不同,精英网和谐波处罚方法几乎比其他五个处罚方法优于。结合研究结果报道在表45,我们得出的结论是,谐波处罚方法选择较小的子集的关键基因同时给最好的或等价的预测性能。


数据集 平均肠易激综合症
竹荚鱼 MCP Len 极品

DLBCL (2002) 0.207 0.205 0.205 0.205 0.198 0.203 0.205
DLBCL (2003) 0.121 0.119 0.12 0.12 0.12 0.118 0.119
肺癌 0.169 0.161 0.167 0.164 0.169 0.163 0.161
AML 0.174 0.174 0.173 0.172 0.171 0.173 0.171

数据集 平均词
竹荚鱼 MCP Len 极品

DLBCL (2002) 0.553 0.554 0.564 0.555 0.568 0.563 0.566
DLBCL (2003) 0.583 0.604 0.586 0.589 0.606 0.603 0.606
肺癌 0.628 0.634 0.666 0.646 0.675 0.673 0.674
AML 0.599 0.611 0.634 0.626 0.641 0.638 0.643

在bold-the最佳性能。

5。结论

变量选择在统计和机器学习的一个基本问题,正则化方法是一种方式来解决这个问题。一般来说,一个正则化算法总是损失函数和罚函数的组合在过去的研究和应用。特别是在变量选择的过程,谐波正规化就像一个网,总能抓住正确的模型。这证明了强稀疏和更好的谐波正规化的正确性。我们提供了模拟证明的浆液 类型正则化方法效率不高;谐波正规化, 惩罚方法被证明是有效的和有效的。

在仿真部分,我们使用四个真实的数据集。有DLBCL (2002), DLBCL(2003),肺癌,AML。结果表明,我们的谐波正则化算法是很有竞争力的在生存分析高维数据的稀疏。仿真结果表明谐波处罚Cox模型是竞争非常激烈的生存分析高维数据,因为它能够减少的大小进一步预测在温和的成本预测精度8]。谐波处罚Cox模型将提供一个有效的工具在建立预测模型基于高维生物的存活时间数据。

利益冲突

作者宣称没有利益冲突有关的出版。

确认

这项研究受到了澳门科学技术发展基金(批准号099/2013 / A3)澳门特别行政区的中华人民共和国。

引用

  1. e . l .梁z . w .曹江z h, h .周和l .刘“基于网络的药物发现通过集成系统生物学和计算技术,”简报的生物信息学,14卷,不。4、491 - 505年,2013页。视图:出版商的网站|谷歌学术搜索
  2. d·r·考克斯”回归模型和生命表”,皇家统计学会杂志》的方法论,34卷,不。2、187 - 220年,1972页。视图:谷歌学术搜索
  3. d·r·考克斯”部分的可能性,“生物统计学,卷62,不。2、269 - 276年,1975页。视图:出版商的网站|谷歌学术搜索|MathSciNet
  4. j .风扇和r·李”变量选择通过nonconcave惩罚可能性及其甲骨文属性,“美国统计协会杂志》上,卷96,不。456年,第1360 - 1348页,2001年。视图:出版商的网站|谷歌学术搜索
  5. r . Tibshirani“回归通过套索收缩和选择,”皇家统计学会杂志》的方法论,卷。58岁的没有。1,第288 - 267页,1996。视图:谷歌学术搜索
  6. h·h·张和w·鲁,”Cox比例风险模型自适应套索,”生物统计学,卷94,不。3、691 - 703年,2007页。视图:出版商的网站|谷歌学术搜索|Zentralblatt数学|MathSciNet
  7. c·h·张,“近无偏变量选择下极大极小凹点球,”统计年报,38卷,不。2、894 - 942年,2010页。视图:出版商的网站|谷歌学术搜索|MathSciNet
  8. 江z . Liu f, g .田et al .,“稀疏与Lp惩罚逻辑回归生物标志物识别、”统计应用遗传学和分子生物学》第六卷,没有。1,2007。视图:出版商的网站|谷歌学术搜索|MathSciNet
  9. z . b .徐h .张x y, y . Wang和y .梁,“L 1/2正规化,”科学在中国系列F:信息科学,53卷,不。6,1159 - 1169年,2010页。视图:谷歌学术搜索
  10. z . b .徐、张x y和f·m·徐”L-1/2正规化:理论和快速解算器阈值表示,“IEEE事务在神经网络和学习系统,23卷,不。7,1013 - 1027年,2012页。视图:谷歌学术搜索
  11. r . Tibshirani“套索Cox模型中的变量选择方法,”医学统计》16卷,第395 - 385页,1997年。视图:谷歌学术搜索
  12. j . Gui和h·李,“处罚Cox回归分析在高维low-sample大小设置,应用微阵列基因表达数据,”生物信息学,21卷,不。13日,3001 - 3008年,2005页。视图:出版商的网站|谷歌学术搜索
  13. h .邹和t . Hastie正规化和变量选择通过弹性网”英国皇家统计学会杂志》上的B:统计方法,卷67,不。2、301 - 320年,2005页。视图:出版商的网站|谷歌学术搜索|MathSciNet
  14. 美国安全,j·朱分段线性正则化解决方案的路径,”统计年鉴,35卷,不。3、1012 - 1030年,2007页。视图:出版商的网站|谷歌学术搜索
  15. t·张,”分析的多级凸松弛稀疏正则化”,机器学习研究期刊》的研究(JMLR)11卷,第1107 - 1081页,2010年。视图:谷歌学术搜索|Zentralblatt数学|MathSciNet
  16. r . Mazumder j·h·弗里德曼,t . Hastie“SparseNet:坐标下降与非凸惩罚,”美国统计协会杂志》上,卷106,不。495年,第1138 - 1125页,2011年。视图:出版商的网站|谷歌学术搜索|MathSciNet
  17. 梁y, c . Liu X.-Z。鸾et al .,“稀疏与L1/2惩罚逻辑回归的基因选择癌症分类”BMC生物信息学,14卷,不。1,第198条,2013。视图:出版商的网站|谷歌学术搜索
  18. 梁y . c . Liu, x z的菜肴et al .,“L1/2正规化方法Cox模型中的变量选择,”应用软计算,14卷,第503 - 498页,2013年。视图:谷歌学术搜索
  19. w·j·福”,处罚回归:桥和套索,”计算和图形统计杂志》上,7卷,不。3、397 - 416年,1998页。视图:出版商的网站|谷歌学术搜索|MathSciNet
  20. t . Blumensath m . Yaghoobi m·e·戴维斯,“迭代硬阈值和L0regularisation”《IEEE国际会议音响、演讲和信号处理(ICASSP ' 07),3卷,第880 - 877页,2007年4月。视图:出版商的网站|谷歌学术搜索
  21. 孙i, j·金,工程学系。荣格,c .公园“梯度套索Cox比例风险模型,”生物信息学,25卷,不。14日,第1781 - 1775页,2009年。视图:出版商的网站|谷歌学术搜索
  22. p .赵和b . Yu阶梯的套索,”机器学习研究杂志》上,8卷,第2726 - 2701页,2007年。视图:谷歌学术搜索
  23. d . l . Donoho x霍,“不确定性原则和理想的原子分解,”IEEE信息理论卷,47号7,2845 - 2862年,2001页。视图:出版商的网站|谷歌学术搜索
  24. d . l . Donoho和e·兰德通过L1最小化最大稀疏表示,“美国国家科学院院刊》上的美利坚合众国,卷100,不。5,2197 - 2202年,2003页。视图:谷歌学术搜索
  25. b·埃夫隆、t . Hastie。约翰斯通,r . Tibshirani“最小角回归,”统计年报,32卷,不。2、407 - 499年,2004页。视图:出版商的网站|谷歌学术搜索|MathSciNet
  26. j·h·弗里德曼“快速稀疏的回归和分类,”科技。代表,斯坦福大学Deptartment统计,2008。视图:谷歌学术搜索
  27. h·c·范·Houwelingen t . Bruinsma a . a . m .哈特l . j .凡不转向,l .鞋号,“微阵列基因表达数据,旨在Cox回归”医学统计,25卷,不。18日,第3216 - 3201页,2006年。视图:出版商的网站|谷歌学术搜索|MathSciNet
  28. e·格拉夫c . Schmoor w . Sauerbrei, m·舒马赫“评估和预后生存的分类方案的比较数据,”医学统计,18卷,不。17 - 18,2529 - 2545年,1999页。视图:出版商的网站|谷歌学术搜索
  29. f . e . Harrel回归建模策略,应用线性模型,逻辑回归和生存分析施普林格,纽约,纽约,美国,2001年。
  30. r·本德、t·奥古斯汀和m . Blettner”生成的生存*模拟Cox比例风险模型,”医学统计,24卷,不。11日,第1723 - 1713页,2005年。视图:出版商的网站|谷歌学术搜索|MathSciNet
  31. a·罗森沃尔德g·赖特,w·c·陈et al .,“使用的分子分析来预测生存为弥漫型大b细胞淋巴瘤化疗后,“《新英格兰医学杂志》上卷,346年,第1946 - 1937页,2002年。视图:谷歌学术搜索
  32. a·罗森沃尔德g·赖特,a Wiestner et al .,“扩散基因表达签名是一种定量积分器的致癌事件预测在套细胞淋巴瘤生存,”癌症细胞,3卷,不。2、185 - 197年,2003页。视图:出版商的网站|谷歌学术搜索
  33. d . g .啤酒,单反Kardia, c c。黄et al .,“基因预测肺腺癌患者的生存,”自然医学,8卷,不。8,816 - 824年,2002页。视图:出版商的网站|谷歌学术搜索
  34. l .布林格k·多恩,大肠拜尔et al .,“使用基因表达分析确定成人急性髓系白血病预后子类,”《新英格兰医学杂志》上,卷350,不。16,1605 - 1616年,2004页。视图:出版商的网站|谷歌学术搜索

版权©2014 Ge-Jin楚等。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。


更多相关文章

PDF 下载引用 引用
下载其他格式更多的
订单打印副本订单
的观点1150年
下载648年
引用

相关文章

文章奖:2020年杰出的研究贡献,选择由我们的首席编辑。获奖的文章阅读