CMMMgydF4y2Ba 计算和数学方法在医学gydF4y2Ba 1748 - 6718gydF4y2Ba 1748 - 670 xgydF4y2Ba Hindawi出版公司gydF4y2Ba 876545年gydF4y2Ba 10.1155 / 2012/876545gydF4y2Ba 876545年gydF4y2Ba 研究文章gydF4y2Ba 再使用的分类算法在胃癌淋巴结转移gydF4y2Ba 李gydF4y2Ba 曹国伟gydF4y2Ba 1gydF4y2Ba 张gydF4y2Ba ShuhenggydF4y2Ba 1gydF4y2Ba 张gydF4y2Ba 黄ydF4y2Ba 2gydF4y2Ba 庞gydF4y2Ba 贾丽芳gydF4y2Ba 2gydF4y2Ba 林gydF4y2Ba KinmangydF4y2Ba 3gydF4y2Ba 回族gydF4y2Ba 春gydF4y2Ba 1gydF4y2Ba 张gydF4y2Ba 苏gydF4y2Ba 1gydF4y2Ba 刘gydF4y2Ba 华峰gydF4y2Ba 1gydF4y2Ba 生物医学工程学院gydF4y2Ba 上海交通大学,上海200030gydF4y2Ba 中国gydF4y2Ba sjtu.edu.cngydF4y2Ba 2gydF4y2Ba 放射学、瑞金医院gydF4y2Ba 上海交通大学医学院,上海200025gydF4y2Ba 中国gydF4y2Ba sjtu.edu.cngydF4y2Ba 3gydF4y2Ba 信号处理中心gydF4y2Ba 电子与信息工程系gydF4y2Ba 香港理工大学gydF4y2Ba 香港gydF4y2Ba polyu.edu.hkgydF4y2Ba 2012年gydF4y2Ba 24gydF4y2Ba 10gydF4y2Ba 2012年gydF4y2Ba 2012年gydF4y2Ba 01gydF4y2Ba 06gydF4y2Ba 2012年gydF4y2Ba 19gydF4y2Ba 09年gydF4y2Ba 2012年gydF4y2Ba 2012年gydF4y2Ba 版权©2012(李等。gydF4y2Ba 这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。gydF4y2Ba

准确的肿瘤、节点和转移TNM分期,尤其是N分期胃癌或转移淋巴结的诊断,是一个受欢迎的问题在临床医学图像分析宝石的光谱成像(GSI)可以提供更多的信息给医生比传统计算机断层扫描(CT)。在本文中,我们应用机器学习方法GSI分析胃癌的淋巴结转移。首先,我们使用一些特征选择或度量学习方法来降低数据维数和特征空间。然后我们再使用分类器来区分从nonlymph节点转移淋巴结转移。实验涉及38个淋巴结胃癌样本,显示96.33%的整体精度。与传统的诊断方法相比,如螺旋CT(敏感性75.2%,特异性41.8%),经由电脑断层(82.09%),淋巴结转移的诊断准确性高。GSI-CT可以最优选择患者的术前诊断胃癌的N分期。gydF4y2Ba

1。介绍gydF4y2Ba

根据全球癌症统计2011年,估计有989600新的胃癌病例和738000例死亡发生在2008年,占总病例的8%和总死亡人数的10%。超过70%的新病例和死亡记录在发展中国家(gydF4y2Ba 1gydF4y2Ba,gydF4y2Ba 2gydF4y2Ba]。最常用的肿瘤分期系统是美国癌症联合委员会,节点,和转移(TNM) [gydF4y2Ba 3gydF4y2Ba- - - - - -gydF4y2Ba 5gydF4y2Ba]。影响生存最重要的两个因素中可切除的胃癌患者癌症的深度入侵胃壁和淋巴结的数量。地区不筛查胃癌,晚期诊断显示节点参与的高频率。即使在早期胃癌淋巴结转移的发生率超过10%。据报道,总发病率14.1%和4.8%至23.6%取决于癌症的深度(gydF4y2Ba 6gydF4y2Ba]。淋巴结状态必须手术评估适当的治疗。然而,各种模式无法获得足够的结果。淋巴结状态是最重要的一个贫穷的生存预后指标(gydF4y2Ba 7gydF4y2Ba,gydF4y2Ba 8gydF4y2Ba]。gydF4y2Ba

术前检查、内镜和钡餐检查通常用来评估癌症病变的腹部。腹部超音波,电脑断层扫描(CT)检查,和磁共振成像(MRI)通常用于检查入侵到其他器官的存在和转移病灶。然而,他们的诊断精度是有限的。内镜超声是最可靠的非手术方法评价原发肿瘤的65% - 77% N分期的准确性由于有限的渗透淋巴结的超声远处转移的能力。尽管较高的图像质量和动态对比增强磁共振成像只有一个N分期的准确性65%到70%。多排ct (MDCT) (gydF4y2Ba 9gydF4y2Ba)扫描仪使薄准直和更快的扫描,这明显提高成像分辨率和支持快速图像重建的处理。此外,静脉注射丸管理对比材料允许精确评价癌增强,和冲水方法允许负反差增强胃壁。因此,MDCT N更高精度高达82%,成为胃癌术前分期的主要检查方法(gydF4y2Ba 10gydF4y2Ba]。Fukuya et al。gydF4y2Ba 11gydF4y2Ba)显示在他们的研究至少5毫米的淋巴结检测转移积极节点的敏感性为75.2%,特异性检测转移负面节点是41.8%。大规模的中国研究gydF4y2Ba 10gydF4y2Ba)由瑞金医院表明整体诊断敏感性,特异性,和多层螺旋ct确定淋巴结转移的准确性为86.26%,76.17%,和82.09%,分别。然而,随着临床价值的光谱扫描协议CT成像技术,我们可以获得更多的信息与宝石光谱成像(GSI)比任何传统CT(例如,多层螺旋CT)。gydF4y2Ba

在常规CT成像,我们测量x射线的衰减通过一个对象。我们一般定义x射线光束质量的公斤电压峰值(千伏峰值),表示最大的光子能量,随着x射线由x射线光子能量的混合物。助教(gydF4y2Ba 12gydF4y2Ba与光谱CT),传统的衰减数据可能被转换为有效的材料密度、增强CT的组织特性的能力。此外,通过光谱CT的单色表示,beam-hardening工件可以大大减少,这是一个一步定量成像对考试更加一致的图像测量,患者和扫描仪。gydF4y2Ba

在这篇文章中,我们打算使用机器学习的方法来处理大量信息提供的GSI和提高精度测定胃癌的淋巴结转移。gydF4y2Ba

论文安排如下,部分gydF4y2Ba 2gydF4y2Ba描述了本文中使用的方法的细节,部分gydF4y2Ba 3gydF4y2Ba介绍了框架和实验结果,部分gydF4y2Ba 4gydF4y2Ba总结目前的研究和讨论潜在的未来研究。gydF4y2Ba

2。方法gydF4y2Ba

图gydF4y2Ba 1gydF4y2Ba显示了一个流程图说明整个框架的分类在胃癌的淋巴结转移。gydF4y2Ba

流程图分类在胃癌的淋巴结转移。gydF4y2Ba

2.1。预处理gydF4y2Ba

GSI-CT检查患者中使用通用电气执行发现CT750高清(通用电气医疗集团)扫描仪gydF4y2Ba 13gydF4y2Ba]。每个病人收到20毫克的肌内政府山莨菪碱减少蠕动肠道运动和喝1000到1200毫升自来水胃填满5到10分钟前扫描。患者仰卧位。获取定位器后CT射线照片(如前后和/或侧),我们捕捉到了unenhanced扫描的上腹部,然后采用增强的GSI扫描两个阶段。一个80毫升到100毫升丸非离子型碘造影剂是管理ante-cubital静脉流量的2毫升/秒到3毫升/秒通过20量度使用自动注射器针头。CT的收购进行动脉相(开始延迟40年代)和门户中静脉阶段(70秒的启动延迟)。动脉期扫描整个胃和门户静脉阶段检查从顶部的胃腹主动脉分叉平面膜片。GSI-CT扫描参数如下:扫描光谱成像模式与快速管电压切换80千伏峰值和140千伏峰值,220毫安的电流640毫安,切片厚度5毫米,旋转速度为1.6到0.8年代,和螺距比0.984:1。gydF4y2Ba

2.2。特征提取gydF4y2Ba

感兴趣的淋巴结区域(roi)划定由经验丰富的医生。并不是所有的淋巴结可以捕获图像,因为节点的大小或位置。图gydF4y2Ba 2gydF4y2Ba显示淋巴结和主动脉动脉和静脉期阶段在70 keV能量单色。图上的淋巴结gydF4y2Ba 2 (b)gydF4y2Ba因其小尺寸是很难找到。单色的值(胡)和物质基础的均值对(gydF4y2Ba μgydF4y2Ba克/厘米gydF4y2Ba3gydF4y2Ba)计算。本文使用的特点是单色CT值(40 keV 140 keV)和物质基础对(Calcium-Iodine、Calcium-Water Iodine-Calcium, Iodine-Water, Water-Calcium, Water-Iodine,有效核电荷)。gydF4y2Ba

胃淋巴结70 keV能量。gydF4y2Ba

动脉相gydF4y2Ba

静脉期gydF4y2Ba

在图像采集过程中,不同注入速度、剂量的造影剂及其体内循环的患者可引起CT数值的差异。消除差异,动脉CT值相同的部分在同时被记录,然后标准化工作是由使用以下公式:gydF4y2Ba (1)gydF4y2Ba 规范gydF4y2Ba =gydF4y2Ba ROIgydF4y2Ba 的意思是gydF4y2Ba CTgydF4y2Ba 价值gydF4y2Ba 主动脉gydF4y2Ba 的意思是gydF4y2Ba CTgydF4y2Ba 价值gydF4y2Ba 。gydF4y2Ba

2.3。特征选择gydF4y2Ba 2.3.1。mRMR算法gydF4y2Ba

最大相关最小冗余(mRMR)提出的是一个特征选择方案gydF4y2Ba 14gydF4y2Ba]mRMR使用信息理论作为标准更好的泛化和特征选择的效率和准确性。每一个功能都可以排名根据其相关性对目标变量,和排名过程考虑了冗余的这些特性。一个有效的功能是定义为一个最好的权衡之间的最小冗余的特性和最大关联到目标变量(gydF4y2Ba 15gydF4y2Ba]。互信息(MI),衡量两个变量间的相互依赖是用来量化相关性和冗余在这个方法(gydF4y2Ba 16gydF4y2Ba]。mRMR标准使用的两个最是互信息差异(中期)和互信息商(筛选),gydF4y2Ba (2)gydF4y2Ba 中期gydF4y2Ba :gydF4y2Ba 马克斯gydF4y2Ba 我gydF4y2Ba ∈gydF4y2Ba ΩgydF4y2Ba 年代gydF4y2Ba (gydF4y2Ba HgydF4y2Ba (gydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba cgydF4y2Ba )gydF4y2Ba - - - - - -gydF4y2Ba 1gydF4y2Ba |gydF4y2Ba 年代gydF4y2Ba |gydF4y2Ba ∑gydF4y2Ba jgydF4y2Ba ∈gydF4y2Ba 年代gydF4y2Ba HgydF4y2Ba (gydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba jgydF4y2Ba )gydF4y2Ba ]gydF4y2Ba ,gydF4y2Ba 进行筛选gydF4y2Ba :gydF4y2Ba 马克斯gydF4y2Ba 我gydF4y2Ba ∈gydF4y2Ba ΩgydF4y2Ba 年代gydF4y2Ba {gydF4y2Ba HgydF4y2Ba (gydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba cgydF4y2Ba )gydF4y2Ba (gydF4y2Ba (gydF4y2Ba 1gydF4y2Ba /gydF4y2Ba |gydF4y2Ba 年代gydF4y2Ba |gydF4y2Ba )gydF4y2Ba ∑gydF4y2Ba jgydF4y2Ba ∈gydF4y2Ba 年代gydF4y2Ba HgydF4y2Ba (gydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba jgydF4y2Ba )gydF4y2Ba ]gydF4y2Ba }gydF4y2Ba ,gydF4y2Ba 在哪里gydF4y2Ba HgydF4y2Ba (gydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba cgydF4y2Ba )gydF4y2Ba 之间的MI特性gydF4y2Ba 我gydF4y2Ba 和分类gydF4y2Ba cgydF4y2Ba ,gydF4y2Ba HgydF4y2Ba (gydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba jgydF4y2Ba )gydF4y2Ba 之间MI特性gydF4y2Ba 我gydF4y2Ba 和gydF4y2Ba jgydF4y2Ba ,gydF4y2Ba 年代gydF4y2Ba 当前的特性集,gydF4y2Ba |gydF4y2Ba 年代gydF4y2Ba |gydF4y2Ba 特性集的长度。gydF4y2Ba

2.3.2。SFS算法gydF4y2Ba

顺序向前选择(SFS)是一种传统的启发式特征选择算法(gydF4y2Ba 17gydF4y2Ba,gydF4y2Ba 18gydF4y2Ba]。SFS始于一个空的特征子集gydF4y2Ba 年代gydF4y2Ba 我gydF4y2Ba 。在每个迭代中只有一个特征添加到特征子集。确定哪些功能增加,算法初步将一个未经选择的特性添加到候选特征子集和测试分类器建立在初步的准确性特征子集。最后展品最高精度的功能添加到特征子集。迭代过程停止后没有功能可以添加,导致精度的改善。gydF4y2Ba

2.4。度量学习算法gydF4y2Ba

学习良好的距离度量特征空间是至关重要的许多机器学习工作(例如,分类)。很多现有的工作表明,设计恰当的距离度量可以大大提高资讯分类精度比标准的欧氏距离。根据训练样本的可行性,距离度量学习算法可分为两类:监督距离度量距离度量学习和无监督学习。表gydF4y2Ba 1gydF4y2Ba显示了几个距离度量学习算法。其中,主成分分析(PCA)是最常用的算法降维的问题这样的大型数据集在人脸识别中的应用gydF4y2Ba 19gydF4y2Ba),图像检索(gydF4y2Ba 20.gydF4y2Ba]。gydF4y2Ba

距离度量学习方法用于这项工作。gydF4y2Ba

无人监督的距离度量学习方法gydF4y2Ba 主成分分析(PCA) (gydF4y2Ba 19gydF4y2Ba,gydF4y2Ba 21gydF4y2Ba]gydF4y2Ba
监督距离度量学习方法gydF4y2Ba 全球gydF4y2Ba 费舍尔区别的分析(FDA) (gydF4y2Ba 21gydF4y2Ba]gydF4y2Ba
相关成分分析(RCA) (gydF4y2Ba 22gydF4y2Ba]gydF4y2Ba
当地的gydF4y2Ba 社区成分分析(NCA) (gydF4y2Ba 23gydF4y2Ba]gydF4y2Ba
当地渔民区别的分析(LFDA) (gydF4y2Ba 24gydF4y2Ba]gydF4y2Ba
大边缘最近的邻居(LMNN) [gydF4y2Ba 25gydF4y2Ba]gydF4y2Ba

2.5。分类gydF4y2Ba

再邻居(资讯)gydF4y2Ba 21gydF4y2Ba,gydF4y2Ba 26gydF4y2Ba)算法是最简单的机器算法之一。在该算法中,一个对象分类的多数票邻国。因此对象分配给类,其资讯中最为普遍,gydF4y2Ba KgydF4y2Ba 是一个正整数,通常是小的。如果gydF4y2Ba KgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ,然后分配给类的对象仅仅是其最近的邻居。gydF4y2Ba

然而,算法首先实现了通过引入一些符号gydF4y2Ba 年代gydF4y2Ba =gydF4y2Ba (gydF4y2Ba xgydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba ygydF4y2Ba 我gydF4y2Ba )gydF4y2Ba ,gydF4y2Ba 我gydF4y2Ba =gydF4y2Ba 1、2gydF4y2Ba ,gydF4y2Ba …gydF4y2Ba NgydF4y2Ba 被认为是训练集,在哪里gydF4y2Ba xgydF4y2Ba 我gydF4y2Ba 是gydF4y2Ba dgydF4y2Ba维特征向量,gydF4y2Ba ygydF4y2Ba 我gydF4y2Ba ∈gydF4y2Ba {gydF4y2Ba +gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba - - - - - -gydF4y2Ba 1gydF4y2Ba }gydF4y2Ba 与观察到的类标签。为简单起见,我们考虑一个二进制分类。我们通常假设所有训练数据iid随机变量的样本gydF4y2Ba (gydF4y2Ba XgydF4y2Ba ,gydF4y2Ba YgydF4y2Ba )gydF4y2Ba 与未知分布。gydF4y2Ba

与之前标记样本训练集gydF4y2Ba 年代gydF4y2Ba ,然而算法构造一个当地的次区域gydF4y2Ba RgydF4y2Ba (gydF4y2Ba xgydF4y2Ba )gydF4y2Ba ⊆gydF4y2Ba ℜgydF4y2Ba dgydF4y2Ba 输入空间的位于估计点gydF4y2Ba xgydF4y2Ba 。预测区域gydF4y2Ba RgydF4y2Ba (gydF4y2Ba xgydF4y2Ba )gydF4y2Ba 包含最近的训练点gydF4y2Ba xgydF4y2Ba ,这是写如下:gydF4y2Ba (3)gydF4y2Ba RgydF4y2Ba (gydF4y2Ba xgydF4y2Ba )gydF4y2Ba =gydF4y2Ba {gydF4y2Ba xgydF4y2Ba ^gydF4y2Ba ∣gydF4y2Ba DgydF4y2Ba (gydF4y2Ba xgydF4y2Ba ,gydF4y2Ba xgydF4y2Ba ^gydF4y2Ba )gydF4y2Ba ≤gydF4y2Ba dgydF4y2Ba (gydF4y2Ba kgydF4y2Ba )gydF4y2Ba }gydF4y2Ba ,gydF4y2Ba 在哪里gydF4y2Ba dgydF4y2Ba (gydF4y2Ba kgydF4y2Ba )gydF4y2Ba 是gydF4y2Ba kgydF4y2Ba th顺序统计量的gydF4y2Ba {gydF4y2Ba DgydF4y2Ba (gydF4y2Ba xgydF4y2Ba ,gydF4y2Ba xgydF4y2Ba ^gydF4y2Ba )gydF4y2Ba }gydF4y2Ba 1gydF4y2Ba NgydF4y2Ba ,gydF4y2Ba DgydF4y2Ba (gydF4y2Ba xgydF4y2Ba ,gydF4y2Ba xgydF4y2Ba ^gydF4y2Ba )gydF4y2Ba 是距离度量。gydF4y2Ba kgydF4y2Ba (gydF4y2Ba ygydF4y2Ba ]gydF4y2Ba 表示样品的数量gydF4y2Ba RgydF4y2Ba (gydF4y2Ba xgydF4y2Ba )gydF4y2Ba ,这是标记gydF4y2Ba ygydF4y2Ba 。然而算法统计为后验概率的估计gydF4y2Ba pgydF4y2Ba (gydF4y2Ba ygydF4y2Ba ∣gydF4y2Ba xgydF4y2Ba )gydF4y2Ba 的观察点gydF4y2Ba xgydF4y2Ba :gydF4y2Ba (4)gydF4y2Ba pgydF4y2Ba (gydF4y2Ba ygydF4y2Ba ∣gydF4y2Ba xgydF4y2Ba )gydF4y2Ba =gydF4y2Ba pgydF4y2Ba (gydF4y2Ba xgydF4y2Ba ∣gydF4y2Ba ygydF4y2Ba )gydF4y2Ba pgydF4y2Ba (gydF4y2Ba ygydF4y2Ba )gydF4y2Ba pgydF4y2Ba (gydF4y2Ba xgydF4y2Ba )gydF4y2Ba ≅gydF4y2Ba kgydF4y2Ba (gydF4y2Ba ygydF4y2Ba ]gydF4y2Ba kgydF4y2Ba 。gydF4y2Ba 对于一个给定的观察gydF4y2Ba xgydF4y2Ba ,这一决定gydF4y2Ba ggydF4y2Ba (gydF4y2Ba xgydF4y2Ba )gydF4y2Ba 制定评估的值吗gydF4y2Ba kgydF4y2Ba (gydF4y2Ba ygydF4y2Ba ]gydF4y2Ba 并选择最高的类gydF4y2Ba kgydF4y2Ba (gydF4y2Ba ygydF4y2Ba ]gydF4y2Ba 价值gydF4y2Ba (5)gydF4y2Ba ggydF4y2Ba (gydF4y2Ba xgydF4y2Ba )gydF4y2Ba =gydF4y2Ba {gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba kgydF4y2Ba (gydF4y2Ba ygydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ]gydF4y2Ba ≥gydF4y2Ba kgydF4y2Ba (gydF4y2Ba ygydF4y2Ba =gydF4y2Ba - - - - - -gydF4y2Ba 1gydF4y2Ba ]gydF4y2Ba ,gydF4y2Ba - - - - - -gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba kgydF4y2Ba (gydF4y2Ba ygydF4y2Ba =gydF4y2Ba - - - - - -gydF4y2Ba 1gydF4y2Ba ]gydF4y2Ba ≥gydF4y2Ba kgydF4y2Ba (gydF4y2Ba ygydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ]gydF4y2Ba 。gydF4y2Ba 因此,相关的后验概率最大化的决定是受雇于资讯算法。二元分类问题中gydF4y2Ba ygydF4y2Ba 我gydF4y2Ba ∈gydF4y2Ba {gydF4y2Ba +gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba - - - - - -gydF4y2Ba 1gydF4y2Ba }gydF4y2Ba ,然而算法产生决策规则如下:gydF4y2Ba (6)gydF4y2Ba ggydF4y2Ba (gydF4y2Ba xgydF4y2Ba )gydF4y2Ba =gydF4y2Ba 胡志明市gydF4y2Ba (gydF4y2Ba avgydF4y2Ba egydF4y2Ba xgydF4y2Ba 我gydF4y2Ba ∈gydF4y2Ba RgydF4y2Ba (gydF4y2Ba xgydF4y2Ba )gydF4y2Ba ygydF4y2Ba 我gydF4y2Ba )gydF4y2Ba 。gydF4y2Ba

3所示。实验结果和讨论gydF4y2Ba 3.1。实验gydF4y2Ba

我们工作中使用的图像数据从通用电气医疗集团获得的设备在瑞金医院2010年4月。我们收集了38个胃淋巴结的数据集。数据中有27个淋巴结转移(正面)和11 nonlymph节点转移(负)。所有淋巴结数据后病理结果淋巴结解剖(淋巴切除术)的病人。gydF4y2Ba

3.1.1。单变量分析gydF4y2Ba

在这项研究中,我们通过探索变量进行单变量分析(功能)。我们分析每个特性通过计算其淋巴结转移的相关性。在这里,我们使用下面的测量:gydF4y2Ba

双尾学习任务gydF4y2Ba:双尾检验是统计检验中使用的推理,在一个给定的统计假设,H0(零假设),被拒绝当检验统计量的值足够小或足够大。gydF4y2Ba

点二列相关系数gydF4y2Ba(gydF4y2Ba rgydF4y2Ba pbgydF4y2Ba ):gydF4y2Ba (7)gydF4y2Ba rgydF4y2Ba pbgydF4y2Ba =gydF4y2Ba AvgydF4y2Ba ggydF4y2Ba pgydF4y2Ba - - - - - -gydF4y2Ba AvgydF4y2Ba ggydF4y2Ba 问gydF4y2Ba 圣gydF4y2Ba dgydF4y2Ba ygydF4y2Ba pgydF4y2Ba 问gydF4y2Ba 。gydF4y2Ba 在方面gydF4y2Ba pgydF4y2Ba ,gydF4y2Ba 问gydF4y2Ba 符号公式gydF4y2Ba AvgydF4y2Ba ggydF4y2Ba pgydF4y2Ba 的意思是nondichotomous值与变量编码1,然后呢gydF4y2Ba AvgydF4y2Ba ggydF4y2Ba 问gydF4y2Ba 的意思是non-dichotomous variable-coded 0值相同。gydF4y2Ba 圣gydF4y2Ba dgydF4y2Ba ygydF4y2Ba 是所有non-dichotomous条目的标准差,gydF4y2Ba pgydF4y2Ba 和gydF4y2Ba 问gydF4y2Ba 是二分variable-coded 1和0的比例,分别。gydF4y2Ba

信息增益(IG)gydF4y2Ba:搞笑计算熵的特性gydF4y2Ba XgydF4y2Ba ,gydF4y2Ba HgydF4y2Ba (gydF4y2Ba XgydF4y2Ba )gydF4y2Ba -条件熵gydF4y2Ba YgydF4y2Ba 鉴于gydF4y2Ba XgydF4y2Ba ,gydF4y2Ba HgydF4y2Ba (gydF4y2Ba XgydF4y2Ba ∣gydF4y2Ba YgydF4y2Ba )gydF4y2Ba (8)gydF4y2Ba 搞笑gydF4y2Ba (gydF4y2Ba XgydF4y2Ba ∣gydF4y2Ba YgydF4y2Ba )gydF4y2Ba =gydF4y2Ba HgydF4y2Ba (gydF4y2Ba XgydF4y2Ba )gydF4y2Ba - - - - - -gydF4y2Ba HgydF4y2Ba (gydF4y2Ba XgydF4y2Ba ∣gydF4y2Ba YgydF4y2Ba )gydF4y2Ba 。gydF4y2Ba

曲线下面积(AUC)。gydF4y2Ba

对称的不确定性(苏)gydF4y2Ba苏:是搞笑的正常化gydF4y2Ba (gydF4y2Ba 0gydF4y2Ba ,gydF4y2Ba 1gydF4y2Ba ]gydF4y2Ba ,苏的高价值显示了更高的相关性特征gydF4y2Ba XgydF4y2Ba和类gydF4y2Ba YgydF4y2Ba(作为衡量之间的相关特性和概念目标)gydF4y2Ba (9)gydF4y2Ba 苏gydF4y2Ba (gydF4y2Ba XgydF4y2Ba ,gydF4y2Ba YgydF4y2Ba )gydF4y2Ba =gydF4y2Ba 2gydF4y2Ba (gydF4y2Ba 我gydF4y2Ba GgydF4y2Ba (gydF4y2Ba XgydF4y2Ba ∣gydF4y2Ba YgydF4y2Ba )gydF4y2Ba HgydF4y2Ba (gydF4y2Ba XgydF4y2Ba )gydF4y2Ba +gydF4y2Ba HgydF4y2Ba (gydF4y2Ba YgydF4y2Ba )gydF4y2Ba ]gydF4y2Ba 。gydF4y2Ba

单变量分析的实验结果如表所示gydF4y2Ba 2gydF4y2Ba和gydF4y2Ba 3gydF4y2Ba。基于表、Iodine-Water Iodine-Calcium Calcium-Iodine和有效核电荷特性显示高与淋巴结转移的相关性。在这些特性中,高与淋巴结转移的相关性被临床证实Iodine-Water和有效核电荷特性。Iodine-Water和Iodine-Calcium特性反映的浓度碘化造影剂周围组织吸收,因此它们与淋巴结转移有关。Calcium-Iodine特性表明组织钙化,很少存在于淋巴结。然而,实验结果表明,该Calcium-Iodine特性是高度与淋巴结转移有关,必须通过临床结果进一步验证。gydF4y2Ba

单变量分析动脉期胃癌淋巴结转移的特点。gydF4y2Ba

不。gydF4y2Ba 功能gydF4y2Ba 的意思是gydF4y2Ba ±gydF4y2Ba 标准gydF4y2Ba PgydF4y2Ba 1gydF4y2Ba PgydF4y2Ba 2gydF4y2Ba rgydF4y2Ba pbgydF4y2Ba AUCgydF4y2Ba 苏gydF4y2Ba 搞笑gydF4y2Ba
负gydF4y2Ba 积极的gydF4y2Ba
1gydF4y2Ba 40岁的凯文gydF4y2Ba 114.97gydF4y2Ba ±gydF4y2Ba 29.84gydF4y2Ba 177.79gydF4y2Ba ±gydF4y2Ba 46.25gydF4y2Ba 0.000gydF4y2Ba 0.000gydF4y2Ba 0.569gydF4y2Ba 0.875gydF4y2Ba 0.174gydF4y2Ba 0.186gydF4y2Ba
2gydF4y2Ba 50岁的凯文gydF4y2Ba 85.55gydF4y2Ba ±gydF4y2Ba 18.81gydF4y2Ba 123.69gydF4y2Ba ±gydF4y2Ba 30.44gydF4y2Ba 0.000gydF4y2Ba 0.000gydF4y2Ba 0.540gydF4y2Ba 0.869gydF4y2Ba 0.174gydF4y2Ba 0.186gydF4y2Ba
3gydF4y2Ba 60岁的凯文gydF4y2Ba 67.49gydF4y2Ba ±gydF4y2Ba 13.36gydF4y2Ba 90.63gydF4y2Ba ±gydF4y2Ba 21.15gydF4y2Ba 0.000gydF4y2Ba 0.002gydF4y2Ba 0.488gydF4y2Ba 0.845gydF4y2Ba 0.186gydF4y2Ba 0.208gydF4y2Ba
4gydF4y2Ba 70 keVgydF4y2Ba 56.74gydF4y2Ba ±gydF4y2Ba 11.53gydF4y2Ba 68.93gydF4y2Ba ±gydF4y2Ba 15.63gydF4y2Ba 0.000gydF4y2Ba 0.025gydF4y2Ba 0.362gydF4y2Ba 0.774gydF4y2Ba 0.106gydF4y2Ba 0.104gydF4y2Ba
5gydF4y2Ba 80 keVgydF4y2Ba 49.93gydF4y2Ba ±gydF4y2Ba 11.53gydF4y2Ba 54.84gydF4y2Ba ±gydF4y2Ba 13.68gydF4y2Ba 0.001gydF4y2Ba 0.302gydF4y2Ba 0.172gydF4y2Ba 0.596gydF4y2Ba 0.070gydF4y2Ba 0.071gydF4y2Ba
6gydF4y2Ba 90 keVgydF4y2Ba 45.30gydF4y2Ba ±gydF4y2Ba 12.05gydF4y2Ba 45.27gydF4y2Ba ±gydF4y2Ba 13.55gydF4y2Ba 0.025gydF4y2Ba 0.994gydF4y2Ba −0.001gydF4y2Ba 0.502gydF4y2Ba 0.001gydF4y2Ba 0.001gydF4y2Ba
7gydF4y2Ba 100 keVgydF4y2Ba 42.01gydF4y2Ba ±gydF4y2Ba 12.18gydF4y2Ba 39.08gydF4y2Ba ±gydF4y2Ba 13.46gydF4y2Ba 0.114gydF4y2Ba 0.537gydF4y2Ba −0.103gydF4y2Ba 0.552gydF4y2Ba 0.013gydF4y2Ba 0.015gydF4y2Ba
8gydF4y2Ba 110 keVgydF4y2Ba 39.71gydF4y2Ba ±gydF4y2Ba 12.37gydF4y2Ba 34.68gydF4y2Ba ±gydF4y2Ba 13.54gydF4y2Ba 0.272gydF4y2Ba 0.295gydF4y2Ba −0.174gydF4y2Ba 0.599gydF4y2Ba 0.014gydF4y2Ba 0.015gydF4y2Ba
9gydF4y2Ba 120 keVgydF4y2Ba 38.13gydF4y2Ba ±gydF4y2Ba 12.56gydF4y2Ba 31.62gydF4y2Ba ±gydF4y2Ba 13.68gydF4y2Ba 0.434gydF4y2Ba 0.182gydF4y2Ba −0.221gydF4y2Ba 0.623gydF4y2Ba 0.025gydF4y2Ba 0.027gydF4y2Ba
10gydF4y2Ba 130 keVgydF4y2Ba 36.83gydF4y2Ba ±gydF4y2Ba 12.73gydF4y2Ba 29.25gydF4y2Ba ±gydF4y2Ba 13.86gydF4y2Ba 0.570gydF4y2Ba 0.127gydF4y2Ba −0.252gydF4y2Ba 0.653gydF4y2Ba 0.079gydF4y2Ba 0.086gydF4y2Ba
11gydF4y2Ba 140 keVgydF4y2Ba 35.89gydF4y2Ba ±gydF4y2Ba 12.86gydF4y2Ba 27.41gydF4y2Ba ±gydF4y2Ba 14.00gydF4y2Ba 0.673gydF4y2Ba 0.092gydF4y2Ba −0.277gydF4y2Ba 0.660gydF4y2Ba 0.079gydF4y2Ba 0.086gydF4y2Ba
12gydF4y2Ba 有效核电荷gydF4y2Ba 8.18gydF4y2Ba ±gydF4y2Ba 0.26gydF4y2Ba 8.71gydF4y2Ba ±gydF4y2Ba 0.35gydF4y2Ba 0.000gydF4y2Ba 0.000gydF4y2Ba 0.601gydF4y2Ba 0.896gydF4y2Ba 0.317gydF4y2Ba 0.336gydF4y2Ba
13gydF4y2Ba Calcium-IodinegydF4y2Ba 819.69gydF4y2Ba ±gydF4y2Ba 10.39gydF4y2Ba 810.02gydF4y2Ba ±gydF4y2Ba 10.70gydF4y2Ba 0.284gydF4y2Ba 0.015gydF4y2Ba −0.391gydF4y2Ba 0.754gydF4y2Ba 0.126gydF4y2Ba 0.127gydF4y2Ba
14gydF4y2Ba Calcium-WatergydF4y2Ba 14.05gydF4y2Ba ±gydF4y2Ba 5.77gydF4y2Ba 27.26gydF4y2Ba ±gydF4y2Ba 9.12gydF4y2Ba 0.000gydF4y2Ba 0.000gydF4y2Ba 0.594gydF4y2Ba 0.899gydF4y2Ba 0.315gydF4y2Ba 0.343gydF4y2Ba
15gydF4y2Ba Iodine-CalciumgydF4y2Ba - - - - - -gydF4y2Ba 579.62gydF4y2Ba ±gydF4y2Ba 8.65gydF4y2Ba - - - - - -gydF4y2Ba 568.30gydF4y2Ba ±gydF4y2Ba 9.31gydF4y2Ba 0.000gydF4y2Ba 0.001gydF4y2Ba 0.500gydF4y2Ba 0.822gydF4y2Ba 0.174gydF4y2Ba 0.165gydF4y2Ba
16gydF4y2Ba Iodine-WatergydF4y2Ba 10.10gydF4y2Ba ±gydF4y2Ba 4.11gydF4y2Ba 19.20gydF4y2Ba ±gydF4y2Ba 6.22gydF4y2Ba 0.000gydF4y2Ba 0.000gydF4y2Ba 0.596gydF4y2Ba 0.896gydF4y2Ba 0.315gydF4y2Ba 0.343gydF4y2Ba
17gydF4y2Ba Water-CalciumgydF4y2Ba 1021.57gydF4y2Ba ±gydF4y2Ba 15.74gydF4y2Ba 1000.17gydF4y2Ba ±gydF4y2Ba 18.21gydF4y2Ba 0.000gydF4y2Ba 0.002gydF4y2Ba −0.494gydF4y2Ba 0.818gydF4y2Ba 0.174gydF4y2Ba 0.165gydF4y2Ba
18gydF4y2Ba Water-IodinegydF4y2Ba 1030.55gydF4y2Ba ±gydF4y2Ba 13.74gydF4y2Ba 1017.24gydF4y2Ba ±gydF4y2Ba 15.20gydF4y2Ba 0.291gydF4y2Ba 0.017gydF4y2Ba −0.386gydF4y2Ba 0.734gydF4y2Ba 0.174gydF4y2Ba 0.165gydF4y2Ba

单变量分析胃癌淋巴结转移的特点静脉阶段。gydF4y2Ba

不。gydF4y2Ba 功能gydF4y2Ba 的意思是gydF4y2Ba ±gydF4y2Ba 标准gydF4y2Ba PgydF4y2Ba 1gydF4y2Ba PgydF4y2Ba 2gydF4y2Ba rgydF4y2Ba pbgydF4y2Ba AUCgydF4y2Ba 苏gydF4y2Ba 搞笑gydF4y2Ba
负gydF4y2Ba 积极的gydF4y2Ba
19gydF4y2Ba 40岁的凯文gydF4y2Ba 168.56gydF4y2Ba ±gydF4y2Ba 45.67gydF4y2Ba 199.95gydF4y2Ba ±gydF4y2Ba 51.33gydF4y2Ba 0.000gydF4y2Ba 0.087gydF4y2Ba 0.282gydF4y2Ba 0.684gydF4y2Ba 0.070gydF4y2Ba 0.072gydF4y2Ba
20.gydF4y2Ba 50岁的凯文gydF4y2Ba 117.94gydF4y2Ba ±gydF4y2Ba 29.61gydF4y2Ba 137.13gydF4y2Ba ±gydF4y2Ba 32.85gydF4y2Ba 0.000gydF4y2Ba 0.102gydF4y2Ba 0.269gydF4y2Ba 0.673gydF4y2Ba 0.070gydF4y2Ba 0.072gydF4y2Ba
21gydF4y2Ba 60岁的凯文gydF4y2Ba 86.91gydF4y2Ba ±gydF4y2Ba 20.03gydF4y2Ba 98.71gydF4y2Ba ±gydF4y2Ba 22.14gydF4y2Ba 0.000gydF4y2Ba 0.135gydF4y2Ba 0.247gydF4y2Ba 0.653gydF4y2Ba 0.086gydF4y2Ba 0.092gydF4y2Ba
22gydF4y2Ba 70 keVgydF4y2Ba 67.54gydF4y2Ba ±gydF4y2Ba 13.52gydF4y2Ba 73.94gydF4y2Ba ±gydF4y2Ba 14.14gydF4y2Ba 0.000gydF4y2Ba 0.209gydF4y2Ba 0.209gydF4y2Ba 0.620gydF4y2Ba 0.106gydF4y2Ba 0.104gydF4y2Ba
23gydF4y2Ba 80 keVgydF4y2Ba 55.09gydF4y2Ba ±gydF4y2Ba 11.10gydF4y2Ba 57.96gydF4y2Ba ±gydF4y2Ba 11.31gydF4y2Ba 0.000gydF4y2Ba 0.481gydF4y2Ba 0.118gydF4y2Ba 0.559gydF4y2Ba 0.110gydF4y2Ba 0.122gydF4y2Ba
24gydF4y2Ba 90 keVgydF4y2Ba 46.76gydF4y2Ba ±gydF4y2Ba 10.95gydF4y2Ba 47.02gydF4y2Ba ±gydF4y2Ba 11.50gydF4y2Ba 0.000gydF4y2Ba 0.949gydF4y2Ba 0.011gydF4y2Ba 0.535gydF4y2Ba 0.018gydF4y2Ba 0.018gydF4y2Ba
25gydF4y2Ba 100 keVgydF4y2Ba 41.08gydF4y2Ba ±gydF4y2Ba 11.04gydF4y2Ba 39.90gydF4y2Ba ±gydF4y2Ba 12.06gydF4y2Ba 0.000gydF4y2Ba 0.781gydF4y2Ba −0.047gydF4y2Ba 0.562gydF4y2Ba 0.018gydF4y2Ba 0.020gydF4y2Ba
26gydF4y2Ba 110 keVgydF4y2Ba 37.08gydF4y2Ba ±gydF4y2Ba 11.29gydF4y2Ba 34.81gydF4y2Ba ±gydF4y2Ba 12.73gydF4y2Ba 0.003gydF4y2Ba 0.611gydF4y2Ba −0.085gydF4y2Ba 0.599gydF4y2Ba 0.011gydF4y2Ba 0.011gydF4y2Ba
27gydF4y2Ba 120 keVgydF4y2Ba 34.25gydF4y2Ba ±gydF4y2Ba 11.56gydF4y2Ba 31.27gydF4y2Ba ±gydF4y2Ba 13.30gydF4y2Ba 0.012gydF4y2Ba 0.521gydF4y2Ba −0.107gydF4y2Ba 0.613gydF4y2Ba 0.011gydF4y2Ba 0.011gydF4y2Ba
28gydF4y2Ba 130 keVgydF4y2Ba 32.10gydF4y2Ba ±gydF4y2Ba 11.86gydF4y2Ba 28.56gydF4y2Ba ±gydF4y2Ba 13.79gydF4y2Ba 0.028gydF4y2Ba 0.461gydF4y2Ba −0.123gydF4y2Ba 0.613gydF4y2Ba 0.011gydF4y2Ba 0.011gydF4y2Ba
29日gydF4y2Ba 140 keVgydF4y2Ba 30.37gydF4y2Ba ±gydF4y2Ba 12.09gydF4y2Ba 26.42gydF4y2Ba ±gydF4y2Ba 14.19gydF4y2Ba 0.052gydF4y2Ba 0.423gydF4y2Ba −0.134gydF4y2Ba 0.626gydF4y2Ba 0.018gydF4y2Ba 0.019gydF4y2Ba
30.gydF4y2Ba 有效核电荷gydF4y2Ba 8.61gydF4y2Ba ±gydF4y2Ba 0.38gydF4y2Ba 8.87gydF4y2Ba ±gydF4y2Ba 0.42gydF4y2Ba 0.000gydF4y2Ba 0.081gydF4y2Ba 0.286gydF4y2Ba 0.680gydF4y2Ba 0.087gydF4y2Ba 0.088gydF4y2Ba
31日gydF4y2Ba Calcium-IodinegydF4y2Ba 812.48gydF4y2Ba ±gydF4y2Ba 9.36gydF4y2Ba 807.83gydF4y2Ba ±gydF4y2Ba 11.88gydF4y2Ba 0.651gydF4y2Ba 0.254gydF4y2Ba −0.190gydF4y2Ba 0.643gydF4y2Ba 0.025gydF4y2Ba 0.026gydF4y2Ba
32gydF4y2Ba Calcium-WatergydF4y2Ba 24.65gydF4y2Ba ±gydF4y2Ba 9.57gydF4y2Ba 31.44gydF4y2Ba ±gydF4y2Ba 11.52gydF4y2Ba 0.000gydF4y2Ba 0.093gydF4y2Ba 0.276gydF4y2Ba 0.673gydF4y2Ba 0.086gydF4y2Ba 0.087gydF4y2Ba
33gydF4y2Ba Iodine-CalciumgydF4y2Ba - - - - - -gydF4y2Ba 570.78gydF4y2Ba ±gydF4y2Ba 8.89gydF4y2Ba - - - - - -gydF4y2Ba 565.23gydF4y2Ba ±gydF4y2Ba 11.43gydF4y2Ba 0.005gydF4y2Ba 0.159gydF4y2Ba 0.233gydF4y2Ba 0.650gydF4y2Ba 0.037gydF4y2Ba 0.042gydF4y2Ba
34gydF4y2Ba Iodine-WatergydF4y2Ba 17.56gydF4y2Ba ±gydF4y2Ba 6.43gydF4y2Ba 22.25gydF4y2Ba ±gydF4y2Ba 7.71gydF4y2Ba 0.000gydF4y2Ba 0.084gydF4y2Ba 0.284gydF4y2Ba 0.667gydF4y2Ba 0.074gydF4y2Ba 0.073gydF4y2Ba
35gydF4y2Ba Water-CalciumgydF4y2Ba 1005.60gydF4y2Ba ±gydF4y2Ba 17.73gydF4y2Ba 994.85gydF4y2Ba ±gydF4y2Ba 22.22gydF4y2Ba 0.011gydF4y2Ba 0.162gydF4y2Ba −0.231gydF4y2Ba 0.657gydF4y2Ba 0.037gydF4y2Ba 0.042gydF4y2Ba
36gydF4y2Ba Water-IodinegydF4y2Ba 1021.14gydF4y2Ba ±gydF4y2Ba 13.95gydF4y2Ba 1014.62gydF4y2Ba ±gydF4y2Ba 17.03gydF4y2Ba 0.631gydF4y2Ba 0.270gydF4y2Ba −0.184gydF4y2Ba 0.636gydF4y2Ba 0.011gydF4y2Ba 0.011gydF4y2Ba

基于统计的结果gydF4y2Ba rgydF4y2Ba pbgydF4y2Ba ,AUC,苏和搞笑,而单色能量高,低能耗特性有较高的相关性显示淋巴结转移的临床结果。如图gydF4y2Ba 3gydF4y2Ba、低能图像显示淋巴结转移之间的差异(正面)和non-lymph节点转移(负面),单色能源与更高的能量,产生更少的对比材料和更多的对比度较低的能量。然而,低能耗带来更多噪音高对比度图像。因此,医生们通常选择70 keV作为临床诊断的权衡。gydF4y2Ba

单色能量CT值的动脉和静脉阶段胃淋巴结转移。gydF4y2Ba

原始数据在动脉相gydF4y2Ba

原始数据在静脉相gydF4y2Ba

在动脉相规范化数据gydF4y2Ba

规范化数据在静脉相gydF4y2Ba

3.1.2。SFS-KNN结果gydF4y2Ba

图gydF4y2Ba 4gydF4y2Ba和表gydF4y2Ba 4gydF4y2Ba现在资讯的分类精度(ACC)算法和不同的邻域大小SFS算法随着长度的特性集,ACC第一长度增大而增大的特性集,然后降低。SFS算法的应用程序后,功能变得更短,而精度就高而原始的特性集,解释了SFS的有效性。从表gydF4y2Ba 4gydF4y2Ba与不同的邻域大小,我们可以检查ACC和选择功能。当gydF4y2Ba KgydF4y2Ba =gydF4y2Ba 5gydF4y2Ba ,性能保持稳定之前和之后的数据标准化,规范化后,ACC达到96.58%,最后选择12(有效核电荷在动脉相),30(静脉有效核电荷的阶段),31 (Calcium-Iodine在静脉相),33 (Iodine-Calcium静脉阶段),和14 (Calcium-Water在动脉相)的特性集。这些选择特性高度相关的分类结果(淋巴结转移)。其中12个(有效核电荷在动脉相),30(静脉有效核电荷的阶段),33 (Iodine-Calcium静脉阶段)特性集符合病理理论和临床经验的医生。至于其他的特性集,需要进一步的研究验证了它们的有效性。然而,SFS-KNN算法不是全局优化的解决方案,它可能导致过度拟合问题,解释ACC的减少。在我们的实验中,样品的数量是不够的,因此,大型社区规模未能反映地方特色的资讯分类器。因此,gydF4y2Ba KgydF4y2Ba =gydF4y2Ba 9gydF4y2Ba 不是选为最优规模。gydF4y2Ba

SFS-KNN算法的分类性能不同的邻域大小。gydF4y2Ba

邻域大小gydF4y2Ba KgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba KgydF4y2Ba =gydF4y2Ba 3gydF4y2Ba KgydF4y2Ba =gydF4y2Ba 5gydF4y2Ba KgydF4y2Ba =gydF4y2Ba 7gydF4y2Ba KgydF4y2Ba =gydF4y2Ba 9gydF4y2Ba
Pre-normgydF4y2Ba 选择功能gydF4y2Ba 14、16gydF4y2Ba 14日,31日,5日,15日,26日,4日,27日,21日,24日,9日,32岁的2,25日8日28日,3日,16岁gydF4y2Ba 14日,31日,36岁,3,25岁,2gydF4y2Ba 3 8 12日31日,29日,15日,33岁,1gydF4y2Ba 3 12日31日,23日,26日,24日,30日,16岁gydF4y2Ba
精度gydF4y2Ba 88.29%gydF4y2Ba 93.68%gydF4y2Ba 93.29%gydF4y2Ba 91.71%gydF4y2Ba 92.24%gydF4y2Ba

规范gydF4y2Ba 选择功能gydF4y2Ba 12日,30gydF4y2Ba 20日,15日,11日,30日,5gydF4y2Ba 12日,30日,31日,33岁,14岁gydF4y2Ba 12、19、20、30日,5日,18日,25日,17日,34岁的3,32岁,15岁,24岁gydF4y2Ba 12、19、29、30 8 34岁,33岁,25日,15日,6日,24日,7日,10,20,17所示gydF4y2Ba
精度gydF4y2Ba 93.95%gydF4y2Ba 96.45%gydF4y2Ba 96.58%gydF4y2Ba 96.18%gydF4y2Ba 97.89%gydF4y2Ba

SFS-KNN生和规范化数据特征选择过程。gydF4y2Ba

原始数据gydF4y2Ba

规范化数据gydF4y2Ba

3.1.3。mRMR-KNN结果gydF4y2Ba

图gydF4y2Ba 5gydF4y2Ba显示了两个特征选择过程与不同mRMR标准。表gydF4y2Ba 5gydF4y2Ba和gydF4y2Ba 6gydF4y2Ba揭示mRMR-KNN的分类性能进行筛选和中期)与不同的邻域大小(gydF4y2Ba 27gydF4y2Ba]。我们可以看到的两个表,这两个标准进行筛选和中期获得几乎相同的性能。归一化后,与所有不同的精度gydF4y2Ba KgydF4y2Ba 高度增加,从而演示数据规范化的积极影响。特性集,从表中我们可以得出结论,15 (Iodine-Calcium在动脉相),21 (60 keV静脉阶段),30(静脉有效核电荷的阶段),和3 (60 keV在动脉相)淋巴结转移密切相关,而高度赞同病理学理论和临床经验的医生。与gydF4y2Ba KgydF4y2Ba =gydF4y2Ba 5gydF4y2Ba 之前和之后,分类性能保持稳定正常化,这进一步验证最优gydF4y2Ba KgydF4y2Ba (邻域大小)的价值。gydF4y2Ba

分类性能mRMR-KNN与不同的邻域大小(筛选)。gydF4y2Ba

Neighorhood大小gydF4y2Ba KgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba KgydF4y2Ba =gydF4y2Ba 3gydF4y2Ba KgydF4y2Ba =gydF4y2Ba 5gydF4y2Ba KgydF4y2Ba =gydF4y2Ba 7gydF4y2Ba KgydF4y2Ba =gydF4y2Ba 9gydF4y2Ba
PrenormgydF4y2Ba 序列gydF4y2Ba 14日,19日,5日,17日,23日,12日,3,16日,18日,22日,1,15日,4,2,30日,13日,21日,32岁的10,33岁,11日,34岁,20岁,35岁,31日,25日,9日,29日,24日,8日,7日,26日,36岁,27岁,28岁,6gydF4y2Ba
长度gydF4y2Ba 1gydF4y2Ba 28gydF4y2Ba 28gydF4y2Ba 35gydF4y2Ba 1gydF4y2Ba
精度gydF4y2Ba 87.50%gydF4y2Ba 89.74%gydF4y2Ba 89.08%gydF4y2Ba 87.24%gydF4y2Ba 81.71%gydF4y2Ba
规范gydF4y2Ba 序列gydF4y2Ba 3 15日,21日,30日,17日,24日,12日,14日,23日,5日,16日,22日,18日,27日,20日,4日,33岁,25日,13日,19日,6日,28岁,35岁,26岁,32岁,7日,29日,34岁,8日,31日,9日,11日,10日,36gydF4y2Ba
长度gydF4y2Ba 4gydF4y2Ba 2gydF4y2Ba 2gydF4y2Ba 2gydF4y2Ba 10gydF4y2Ba
精度gydF4y2Ba 90.00%gydF4y2Ba 94.87%gydF4y2Ba 94.87%gydF4y2Ba 94.74%gydF4y2Ba 95.66%gydF4y2Ba

分类性能mRMR-KNN与不同的邻域大小(中期)。gydF4y2Ba

邻域大小gydF4y2Ba KgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba KgydF4y2Ba =gydF4y2Ba 3gydF4y2Ba KgydF4y2Ba =gydF4y2Ba 5gydF4y2Ba KgydF4y2Ba =gydF4y2Ba 7gydF4y2Ba KgydF4y2Ba =gydF4y2Ba 9gydF4y2Ba
PrenormgydF4y2Ba 序列gydF4y2Ba 3 12日,26日,22日,18日,30日,14日,6日,19日,16日,36岁,2,17日,5日,1,24岁,35岁,15日,23日,4日,34岁,13日,29日,21日,7日,31日,11日,32岁,25岁,20日,9日,28日,33岁,8日,27岁gydF4y2Ba
长度gydF4y2Ba 1gydF4y2Ba 26gydF4y2Ba 26gydF4y2Ba 26gydF4y2Ba 20.gydF4y2Ba
精度gydF4y2Ba 87.50%gydF4y2Ba 90.39%gydF4y2Ba 89.34%gydF4y2Ba 87.11%gydF4y2Ba 82.50%gydF4y2Ba
规范gydF4y2Ba 序列gydF4y2Ba 2 15日,21日,30日,24日,17日,5日,14日,23日,12日,18日,22日,27日,4日,16日,33岁,7日,1,20日,25日,13日,3日,29日,19日,6日,35岁,28日,31日,8日,32岁的26日,11日,34岁,36岁,9、10gydF4y2Ba
规范gydF4y2Ba 长度gydF4y2Ba 4gydF4y2Ba 2gydF4y2Ba 2gydF4y2Ba 16gydF4y2Ba
精度gydF4y2Ba 89.74%gydF4y2Ba 94.87%gydF4y2Ba 94.87%gydF4y2Ba 95.66%gydF4y2Ba 95.26%gydF4y2Ba

特征选择过程与不同mRMR标准。gydF4y2Ba

中期gydF4y2Ba

进行筛选gydF4y2Ba

3.1.4。度量学习的结果gydF4y2Ba

图gydF4y2Ba 6gydF4y2Ba显示二维可视化结果6个不同距离度量学习方法的验证。在二维投影空间,类是由LDA转换比其他距离度量。然而,资讯与单一的距离度量的结果不是很满意,这就是为什么我们认为组合。gydF4y2Ba

降维结果不同的度量学习方法的验证。gydF4y2Ba

主成分分析gydF4y2Ba

乔治。gydF4y2Ba

美国广播公司gydF4y2Ba

LFDAgydF4y2Ba

NCAgydF4y2Ba

LMNNgydF4y2Ba

表gydF4y2Ba 7gydF4y2Ba显示资讯算法的分类精度与距离度量学习方法。很明显,这些结果表明,数据标准化有助于很多分类。此外,PCA是一个流行的数据降维算法和运行在一个无人管理的设置不使用的类标签训练数据获得的线性预测。然而,PCA仍然可以有用的属性作为资讯分类的线性预处理。通过结合主成分分析与其他监督距离度量学习方法(例如,LDA, RCA),我们可以得到极大地提高性能。资讯分类的准确性显著依赖于所使用的度量来计算不同样本之间的距离。gydF4y2Ba

然而,算法的分类性能度量学习方法。gydF4y2Ba

数据(特性集的长度)gydF4y2Ba Prenorm (4)gydF4y2Ba 规范01 (5)gydF4y2Ba
然而,gydF4y2Ba 80.79%gydF4y2Ba 83.68%gydF4y2Ba
而主成分分析gydF4y2Ba 80.79%gydF4y2Ba 83.68%gydF4y2Ba
主成分分析gydF4y2Ba 82.11%gydF4y2Ba 81.84%gydF4y2Ba
PCA + LDAgydF4y2Ba 77.89%gydF4y2Ba 96.33%gydF4y2Ba
PCA + RCAgydF4y2Ba 77.63%gydF4y2Ba 96.33%gydF4y2Ba
PCA + LFDAgydF4y2Ba 76.97%gydF4y2Ba 96.33%gydF4y2Ba
PCA + NCAgydF4y2Ba 76.58%gydF4y2Ba 86.32%gydF4y2Ba
PCA + LMNNgydF4y2Ba 76.84%gydF4y2Ba 96.33%gydF4y2Ba
3.2。讨论gydF4y2Ba

基于实验结果,机器学习方法的使用可以改善胃癌临床淋巴结转移的准确性。在我们的研究中,我们主要使用资讯分类的算法,效率高。提高效率和分类精度,我们首先采用几个特征选择算法,如mRMR和SFS方法,既显示精度的增加。我们获得了高度相关淋巴结转移的特点符合临床病理学的验证结果。提高精度的另一种方法是使用距离度量学习从一个给定的输入空间数据的相似/不同的点的集合保存训练数据之间的距离关系,和资讯的应用算法的新数据模式。一些方案用于我们的实验的整体精度达到96.33%。gydF4y2Ba

4所示。结论gydF4y2Ba

我们研究的主要贡献是证明机器学习方法的可行性和有效性的计算机辅助诊断(CAD)在胃癌淋巴结转移使用临床GSI数据。在本文中,我们使用一个简单的和经典的算法称为资讯,结合几个特征选择算法和度量学习方法。实验结果表明,我们的方案优于传统诊断方法(例如,欧盟和多层螺旋ct)。gydF4y2Ba

我们的研究的一个限制是临床病例数量不足。因此,在未来的工作中,我们将进行更多的临床实验数据进一步改善方案的效率和探索更有用和强大的CAD在临床的机器学习方法。gydF4y2Ba

确认gydF4y2Ba

这项工作是由中国国家基础研究计划(973计划,没有。2010年cb732506)和国家自然科学基金委(没有。81272746)。gydF4y2Ba

JemalgydF4y2Ba 一个。gydF4y2Ba 布雷gydF4y2Ba F。gydF4y2Ba 中心gydF4y2Ba M . M。gydF4y2Ba FerlaygydF4y2Ba J。gydF4y2Ba 病房gydF4y2Ba E。gydF4y2Ba 福尔曼gydF4y2Ba D。gydF4y2Ba 全球癌症统计数据gydF4y2Ba CA癌症期刊对临床医师gydF4y2Ba 2011年gydF4y2Ba 61年gydF4y2Ba 2gydF4y2Ba 69年gydF4y2Ba 90年gydF4y2Ba 2 - s2.0 - 79952232216gydF4y2Ba 10.3322 / caac.20107gydF4y2Ba 癌症的事实和数字gydF4y2Ba 美国癌症协会,2012gydF4y2Ba 李gydF4y2Ba m . H。gydF4y2Ba 崔gydF4y2Ba D。gydF4y2Ba 公园gydF4y2Ba m·J。gydF4y2Ba 李gydF4y2Ba m·W。gydF4y2Ba 胃癌:基础上与多层螺旋ct成像和举办第七届与指导方针gydF4y2Ba 腹部成像gydF4y2Ba 2011年gydF4y2Ba 37gydF4y2Ba 4gydF4y2Ba 531年gydF4y2Ba 540年gydF4y2Ba 10.1007 / s00261 - 011 - 9780 - 3gydF4y2Ba OzmengydF4y2Ba M . M。gydF4y2Ba OzmengydF4y2Ba F。gydF4y2Ba ZulfikaroglugydF4y2Ba B。gydF4y2Ba 在胃癌淋巴结gydF4y2Ba 肿瘤外科杂志》gydF4y2Ba 2008年gydF4y2Ba 98年gydF4y2Ba 6gydF4y2Ba 476年gydF4y2Ba 481年gydF4y2Ba 2 - s2.0 - 55749084182gydF4y2Ba 10.1002 / jso.21134gydF4y2Ba AurellogydF4y2Ba P。gydF4y2Ba D天使gydF4y2Ba F。gydF4y2Ba 罗西gydF4y2Ba 年代。gydF4y2Ba BellagambagydF4y2Ba R。gydF4y2Ba CicchinigydF4y2Ba C。gydF4y2Ba NigrigydF4y2Ba G。gydF4y2Ba ErcolanigydF4y2Ba G。gydF4y2Ba De旧金山gydF4y2Ba R。gydF4y2Ba RamacciatogydF4y2Ba G。gydF4y2Ba 从胃癌淋巴结转移:分类对比N-site和时系统。我们的经验和文献之回顾gydF4y2Ba 美国外科医生gydF4y2Ba 2007年gydF4y2Ba 73年gydF4y2Ba 4gydF4y2Ba 359年gydF4y2Ba 366年gydF4y2Ba 2 - s2.0 - 34248579999gydF4y2Ba 船长gydF4y2Ba T。gydF4y2Ba 受伤gydF4y2Ba N。gydF4y2Ba 北野gydF4y2Ba 年代。gydF4y2Ba 胃癌的淋巴结转移gydF4y2Ba 癌症gydF4y2Ba 2011年gydF4y2Ba 3gydF4y2Ba 2gydF4y2Ba 2141年gydF4y2Ba 2159年gydF4y2Ba 2 - s2.0 - 79959728900gydF4y2Ba 10.3390 / cancers3022141gydF4y2Ba 斋藤gydF4y2Ba H。gydF4y2Ba FukumotogydF4y2Ba Y。gydF4y2Ba OsakigydF4y2Ba T。gydF4y2Ba 山田gydF4y2Ba Y。gydF4y2Ba 福田gydF4y2Ba K。gydF4y2Ba TatebegydF4y2Ba 年代。gydF4y2Ba TsujitanigydF4y2Ba 年代。gydF4y2Ba IkeguchigydF4y2Ba M。gydF4y2Ba 预后的意义之间的比例转移性淋巴结和解剖(n比率)在晚期胃癌患者gydF4y2Ba 肿瘤外科杂志》gydF4y2Ba 2008年gydF4y2Ba 97年gydF4y2Ba 2gydF4y2Ba 132年gydF4y2Ba 135年gydF4y2Ba 2 - s2.0 - 38649118508gydF4y2Ba 10.1002 / jso.20929gydF4y2Ba EspingydF4y2Ba F。gydF4y2Ba 比安奇gydF4y2Ba 一个。gydF4y2Ba LlorcagydF4y2Ba 年代。gydF4y2Ba 转移性淋巴结比例和数量的转移性淋巴结胃癌的预后因素gydF4y2Ba 欧洲肿瘤外科杂志》上gydF4y2Ba 2012年gydF4y2Ba 38gydF4y2Ba 497年gydF4y2Ba 502年gydF4y2Ba 10.1016 / j.ejso.2012.01.012gydF4y2Ba KarcaaltincabagydF4y2Ba M。gydF4y2Ba AktasgydF4y2Ba 一个。gydF4y2Ba 经由CT双能CT重新审视:审查原则和临床应用gydF4y2Ba 诊断和介入放射学gydF4y2Ba 2011年gydF4y2Ba 17gydF4y2Ba 181年gydF4y2Ba 194年gydF4y2Ba 杨ydF4y2Ba C。gydF4y2Ba 朱gydF4y2Ba z G。gydF4y2Ba 杨ydF4y2Ba M。gydF4y2Ba 的价值应用计算机断层扫描在胃癌术前T、N分期:大规模的中国研究gydF4y2Ba 肿瘤外科杂志》gydF4y2Ba 2009年gydF4y2Ba One hundred.gydF4y2Ba 3gydF4y2Ba 205年gydF4y2Ba 214年gydF4y2Ba 2 - s2.0 - 70249097373gydF4y2Ba 10.1002 / jso.21316gydF4y2Ba FukuyagydF4y2Ba T。gydF4y2Ba 本田gydF4y2Ba H。gydF4y2Ba 哈亚希gydF4y2Ba T。gydF4y2Ba 金子gydF4y2Ba K。gydF4y2Ba TateshigydF4y2Ba Y。gydF4y2Ba 罗依gydF4y2Ba T。gydF4y2Ba 前原诚司gydF4y2Ba Y。gydF4y2Ba 田中gydF4y2Ba M。gydF4y2Ba TsuneyoshigydF4y2Ba M。gydF4y2Ba 那一定很有意思gydF4y2Ba K。gydF4y2Ba 淋巴结转移:功效的检测与螺旋CT在胃癌患者gydF4y2Ba 放射学gydF4y2Ba 1995年gydF4y2Ba 197年gydF4y2Ba 3gydF4y2Ba 705年gydF4y2Ba 711年gydF4y2Ba 2 - s2.0 - 0028827326gydF4y2Ba 钱德拉gydF4y2Ba N。gydF4y2Ba 兰甘过世gydF4y2Ba d . A。gydF4y2Ba 约翰逊gydF4y2Ba t F。gydF4y2Ba CgydF4y2Ba t F。gydF4y2Ba 勋伯格gydF4y2Ba s . O。gydF4y2Ba 赖泽gydF4y2Ba m F。gydF4y2Ba 宝石检测器:双能量成像通过快速千伏峰值切换gydF4y2Ba 双能量CT在临床实践中gydF4y2Ba 2011年gydF4y2Ba 柏林,德国gydF4y2Ba 施普林格gydF4y2Ba 张gydF4y2Ba D。gydF4y2Ba 李gydF4y2Ba X。gydF4y2Ba 刘gydF4y2Ba B。gydF4y2Ba 通用电气的客观表征发现CT750高清扫描:宝石光谱成像模式gydF4y2Ba 医学物理学gydF4y2Ba 2011年gydF4y2Ba 38gydF4y2Ba 3gydF4y2Ba 1178年gydF4y2Ba 1188年gydF4y2Ba 2 - s2.0 - 79952149962gydF4y2Ba 10.1118/1.3551999gydF4y2Ba 彭gydF4y2Ba H。gydF4y2Ba 长gydF4y2Ba F。gydF4y2Ba 丁gydF4y2Ba C。gydF4y2Ba 基于互信息的特征选择:标准max-dependency, max-relevance, min-redundancygydF4y2Ba IEEE模式分析与机器智能gydF4y2Ba 2005年gydF4y2Ba 27gydF4y2Ba 8gydF4y2Ba 1226年gydF4y2Ba 1238年gydF4y2Ba 2 - s2.0 - 24344458137gydF4y2Ba 10.1109 / TPAMI.2005.159gydF4y2Ba 蔡gydF4y2Ba Y。gydF4y2Ba 黄gydF4y2Ba T。gydF4y2Ba 胡gydF4y2Ba lgydF4y2Ba 史gydF4y2Ba X。gydF4y2Ba 谢gydF4y2Ba lgydF4y2Ba 李gydF4y2Ba Y。gydF4y2Ba 预测与mRMR赖氨酸泛素化的特征选择和分析gydF4y2Ba 氨基酸gydF4y2Ba 2012年gydF4y2Ba 42gydF4y2Ba 1387年gydF4y2Ba 1395年gydF4y2Ba 2 - s2.0 - 78751642007gydF4y2Ba 10.1007 / s00726 - 011 - 0835 - 0gydF4y2Ba 阿米里gydF4y2Ba F。gydF4y2Ba YousefigydF4y2Ba m·R。gydF4y2Ba 卢卡斯gydF4y2Ba C。gydF4y2Ba ShakerygydF4y2Ba 一个。gydF4y2Ba YazdanigydF4y2Ba N。gydF4y2Ba 共同对入侵检测系统的信息化特征选择gydF4y2Ba 网络和计算机应用》杂志上gydF4y2Ba 2011年gydF4y2Ba 34gydF4y2Ba 4gydF4y2Ba 1184年gydF4y2Ba 1199年gydF4y2Ba 2 - s2.0 - 79956097533gydF4y2Ba 10.1016 / j.jnca.2011.01.002gydF4y2Ba VerveridisgydF4y2Ba D。gydF4y2Ba KotropoulosgydF4y2Ba C。gydF4y2Ba 顺序向前特征选择较低的计算成本gydF4y2Ba 学报》第八届欧洲信号处理的会议gydF4y2Ba 2005年gydF4y2Ba 土耳其安塔利亚gydF4y2Ba 王gydF4y2Ba lgydF4y2Ba 在他gydF4y2Ba 一个。gydF4y2Ba 埃达gydF4y2Ba lgydF4y2Ba 顺序向前选择方法非唯一寡核苷酸探针的选择问题gydF4y2Ba 第三IAPR学报》国际会议模式识别在生物信息学gydF4y2Ba 2008年gydF4y2Ba 262年gydF4y2Ba 275年gydF4y2Ba 杨gydF4y2Ba M。gydF4y2Ba 张gydF4y2Ba lgydF4y2Ba 杨gydF4y2Ba J。gydF4y2Ba 张gydF4y2Ba D。gydF4y2Ba 健壮的稀疏编码的人脸识别gydF4y2Ba 《24日IEEE计算机视觉与模式识别会议(CVPR 11)gydF4y2Ba 2011年gydF4y2Ba 625年gydF4y2Ba 632年gydF4y2Ba 黄gydF4y2Ba Z。gydF4y2Ba 沈gydF4y2Ba h·T。gydF4y2Ba 邵gydF4y2Ba J。gydF4y2Ba 鲁格gydF4y2Ba 年代。gydF4y2Ba 周gydF4y2Ba X。gydF4y2Ba 局部性冷凝:一种新的降维方法的图像检索gydF4y2Ba 学报》第16届ACM国际会议多媒体,08年(毫米)gydF4y2Ba 2008年10月gydF4y2Ba 可以gydF4y2Ba 219年gydF4y2Ba 228年gydF4y2Ba 2 - s2.0 - 70350630538gydF4y2Ba 10.1145/1459359.1459389gydF4y2Ba 刘洋gydF4y2Ba 荣金gydF4y2Ba 距离度量学习:一个全面的调查gydF4y2Ba 2006年gydF4y2Ba 计算机科学与工程系,密歇根州立大学gydF4y2Ba Bar-HillelgydF4y2Ba 一个。gydF4y2Ba 赫兹gydF4y2Ba T。gydF4y2Ba ShentalgydF4y2Ba N。gydF4y2Ba WeinshallgydF4y2Ba D。gydF4y2Ba 学习使用等效距离的函数关系gydF4y2Ba 20国际会议的程序机器学习gydF4y2Ba 2003年8月gydF4y2Ba 11gydF4y2Ba 18gydF4y2Ba 2 - s2.0 - 1942517347gydF4y2Ba GoldbergergydF4y2Ba J。gydF4y2Ba RoweisgydF4y2Ba 年代。gydF4y2Ba 辛顿gydF4y2Ba G。gydF4y2Ba SalakhutdinovgydF4y2Ba R。gydF4y2Ba 附近成分分析gydF4y2Ba 会议的程序在神经信息处理系统(捏' 04)gydF4y2Ba 2004年gydF4y2Ba SugiyamagydF4y2Ba M。gydF4y2Ba 降维的多通道带安全标签的数据时由当地fisher判别分析gydF4y2Ba 机器学习研究杂志》上gydF4y2Ba 2007年gydF4y2Ba 8gydF4y2Ba 1027年gydF4y2Ba 1061年gydF4y2Ba 2 - s2.0 - 34249086815gydF4y2Ba 温伯格gydF4y2Ba k问。gydF4y2Ba 扫罗gydF4y2Ba l·K。gydF4y2Ba 距离度量学习大利润最近邻分类gydF4y2Ba 机器学习研究杂志》上gydF4y2Ba 2009年gydF4y2Ba 10gydF4y2Ba 207年gydF4y2Ba 244年gydF4y2Ba 2 - s2.0 - 61749090884gydF4y2Ba 主教gydF4y2Ba c . M。gydF4y2Ba 模式识别和机器学习(信息科学和统计)gydF4y2Ba 2007年gydF4y2Ba 纽约,纽约,美国gydF4y2Ba 施普林格gydF4y2Ba 丁gydF4y2Ba C。gydF4y2Ba 彭gydF4y2Ba H。gydF4y2Ba 从微阵列基因表达数据最小冗余特征选择gydF4y2Ba 生物信息学和计算生物学》杂志上gydF4y2Ba 2005年gydF4y2Ba 3gydF4y2Ba 2gydF4y2Ba 185年gydF4y2Ba 205年gydF4y2Ba 2 - s2.0 - 17644384367gydF4y2Ba 10.1142 / S0219720005001004gydF4y2Ba