研究文章

FAM171B作为新型生物标志物提供中介组织的免疫微环境在肺动脉高血压

图7

构造多个机器学习模型基于度的表达式。(a)的影响决策树的错误率。的 - - - - - -轴表示数量的决策树, - - - - - -轴显示了错误率。大约100个使用决策树时,出错率通常是稳定的。(b)基尼系数方法的结果在一个随机森林分类器。的 - - - - - -轴显示遗传变量,和 - - - - - -轴指数的意义。(c)微调最绝对的收缩和选择算子(套索)模型的特征选择。套索回归是用来缩小度,导致28变量的潜在标志物的发现多环芳烃。纵坐标代表的价值系数,较低的横坐标代表日志(λ),上层横坐标代表当前的非零系数模型。(d)阴谋说明选择生物标记的过程使用支持向量machine-recursive特性消除(SVM-RFE)技术。SVM-RFE技术被用来确定37度的特性的一个子集。度:差异表达基因;多环芳烃:肺动脉高血压。
(一)
(b)
(c)
(d)