准确的肿瘤、节点和转移TNM分期,尤其是N分期胃癌或转移淋巴结的诊断,是一个受欢迎的问题在临床医学图像分析宝石的光谱成像(GSI)可以提供更多的信息给医生比传统计算机断层扫描(CT)。在本文中,我们应用机器学习方法GSI分析胃癌的淋巴结转移。首先,我们使用一些特征选择或度量学习方法来降低数据维数和特征空间。然后我们再使用分类器来区分从nonlymph节点转移淋巴结转移。实验涉及38个淋巴结胃癌样本,显示96.33%的整体精度。与传统的诊断方法相比,如螺旋CT(敏感性75.2%,特异性41.8%),经由电脑断层(82.09%),淋巴结转移的诊断准确性高。GSI-CT可以最优选择患者的术前诊断胃癌的N分期。gydF4y2Ba
根据全球癌症统计2011年,估计有989600新的胃癌病例和738000例死亡发生在2008年,占总病例的8%和总死亡人数的10%。超过70%的新病例和死亡记录在发展中国家(gydF4y2Ba
术前检查、内镜和钡餐检查通常用来评估癌症病变的腹部。腹部超音波,电脑断层扫描(CT)检查,和磁共振成像(MRI)通常用于检查入侵到其他器官的存在和转移病灶。然而,他们的诊断精度是有限的。内镜超声是最可靠的非手术方法评价原发肿瘤的65% - 77% N分期的准确性由于有限的渗透淋巴结的超声远处转移的能力。尽管较高的图像质量和动态对比增强磁共振成像只有一个N分期的准确性65%到70%。多排ct (MDCT) (gydF4y2Ba
在常规CT成像,我们测量x射线的衰减通过一个对象。我们一般定义x射线光束质量的公斤电压峰值(千伏峰值),表示最大的光子能量,随着x射线由x射线光子能量的混合物。助教(gydF4y2Ba
在这篇文章中,我们打算使用机器学习的方法来处理大量信息提供的GSI和提高精度测定胃癌的淋巴结转移。gydF4y2Ba
论文安排如下,部分gydF4y2Ba
图gydF4y2Ba
流程图分类在胃癌的淋巴结转移。gydF4y2Ba
GSI-CT检查患者中使用通用电气执行发现CT750高清(通用电气医疗集团)扫描仪gydF4y2Ba
感兴趣的淋巴结区域(roi)划定由经验丰富的医生。并不是所有的淋巴结可以捕获图像,因为节点的大小或位置。图gydF4y2Ba
胃淋巴结70 keV能量。gydF4y2Ba
动脉相gydF4y2Ba
静脉期gydF4y2Ba
在图像采集过程中,不同注入速度、剂量的造影剂及其体内循环的患者可引起CT数值的差异。消除差异,动脉CT值相同的部分在同时被记录,然后标准化工作是由使用以下公式:gydF4y2Ba
最大相关最小冗余(mRMR)提出的是一个特征选择方案gydF4y2Ba
顺序向前选择(SFS)是一种传统的启发式特征选择算法(gydF4y2Ba
学习良好的距离度量特征空间是至关重要的许多机器学习工作(例如,分类)。很多现有的工作表明,设计恰当的距离度量可以大大提高资讯分类精度比标准的欧氏距离。根据训练样本的可行性,距离度量学习算法可分为两类:监督距离度量距离度量学习和无监督学习。表gydF4y2Ba
距离度量学习方法用于这项工作。gydF4y2Ba
| 无人监督的距离度量学习方法gydF4y2Ba | 主成分分析(PCA) (gydF4y2Ba |
|
|---|---|---|
| 监督距离度量学习方法gydF4y2Ba | 全球gydF4y2Ba | 费舍尔区别的分析(FDA) (gydF4y2Ba |
| 相关成分分析(RCA) (gydF4y2Ba |
||
| 当地的gydF4y2Ba | 社区成分分析(NCA) (gydF4y2Ba |
|
| 当地渔民区别的分析(LFDA) (gydF4y2Ba |
||
| 大边缘最近的邻居(LMNN) [gydF4y2Ba |
再邻居(资讯)gydF4y2Ba
然而,算法首先实现了通过引入一些符号gydF4y2Ba
与之前标记样本训练集gydF4y2Ba
我们工作中使用的图像数据从通用电气医疗集团获得的设备在瑞金医院2010年4月。我们收集了38个胃淋巴结的数据集。数据中有27个淋巴结转移(正面)和11 nonlymph节点转移(负)。所有淋巴结数据后病理结果淋巴结解剖(淋巴切除术)的病人。gydF4y2Ba
在这项研究中,我们通过探索变量进行单变量分析(功能)。我们分析每个特性通过计算其淋巴结转移的相关性。在这里,我们使用下面的测量:gydF4y2Ba
单变量分析的实验结果如表所示gydF4y2Ba
单变量分析动脉期胃癌淋巴结转移的特点。gydF4y2Ba
| 不。gydF4y2Ba | 功能gydF4y2Ba | 的意思是gydF4y2Ba |
|
|
|
AUCgydF4y2Ba | 苏gydF4y2Ba | 搞笑gydF4y2Ba | |
|---|---|---|---|---|---|---|---|---|---|
| 负gydF4y2Ba | 积极的gydF4y2Ba | ||||||||
| 1gydF4y2Ba | 40岁的凯文gydF4y2Ba |
|
|
0.000gydF4y2Ba | 0.000gydF4y2Ba | 0.569gydF4y2Ba | 0.875gydF4y2Ba | 0.174gydF4y2Ba | 0.186gydF4y2Ba |
| 2gydF4y2Ba | 50岁的凯文gydF4y2Ba |
|
|
0.000gydF4y2Ba | 0.000gydF4y2Ba | 0.540gydF4y2Ba | 0.869gydF4y2Ba | 0.174gydF4y2Ba | 0.186gydF4y2Ba |
| 3gydF4y2Ba | 60岁的凯文gydF4y2Ba |
|
|
0.000gydF4y2Ba | 0.002gydF4y2Ba | 0.488gydF4y2Ba | 0.845gydF4y2Ba | 0.186gydF4y2Ba | 0.208gydF4y2Ba |
| 4gydF4y2Ba | 70 keVgydF4y2Ba |
|
|
0.000gydF4y2Ba | 0.025gydF4y2Ba | 0.362gydF4y2Ba | 0.774gydF4y2Ba | 0.106gydF4y2Ba | 0.104gydF4y2Ba |
| 5gydF4y2Ba | 80 keVgydF4y2Ba |
|
|
0.001gydF4y2Ba | 0.302gydF4y2Ba | 0.172gydF4y2Ba | 0.596gydF4y2Ba | 0.070gydF4y2Ba | 0.071gydF4y2Ba |
| 6gydF4y2Ba | 90 keVgydF4y2Ba |
|
|
0.025gydF4y2Ba | 0.994gydF4y2Ba | −0.001gydF4y2Ba | 0.502gydF4y2Ba | 0.001gydF4y2Ba | 0.001gydF4y2Ba |
| 7gydF4y2Ba | 100 keVgydF4y2Ba |
|
|
0.114gydF4y2Ba | 0.537gydF4y2Ba | −0.103gydF4y2Ba | 0.552gydF4y2Ba | 0.013gydF4y2Ba | 0.015gydF4y2Ba |
| 8gydF4y2Ba | 110 keVgydF4y2Ba |
|
|
0.272gydF4y2Ba | 0.295gydF4y2Ba | −0.174gydF4y2Ba | 0.599gydF4y2Ba | 0.014gydF4y2Ba | 0.015gydF4y2Ba |
| 9gydF4y2Ba | 120 keVgydF4y2Ba |
|
|
0.434gydF4y2Ba | 0.182gydF4y2Ba | −0.221gydF4y2Ba | 0.623gydF4y2Ba | 0.025gydF4y2Ba | 0.027gydF4y2Ba |
| 10gydF4y2Ba | 130 keVgydF4y2Ba |
|
|
0.570gydF4y2Ba | 0.127gydF4y2Ba | −0.252gydF4y2Ba | 0.653gydF4y2Ba | 0.079gydF4y2Ba | 0.086gydF4y2Ba |
| 11gydF4y2Ba | 140 keVgydF4y2Ba |
|
|
0.673gydF4y2Ba | 0.092gydF4y2Ba | −0.277gydF4y2Ba | 0.660gydF4y2Ba | 0.079gydF4y2Ba | 0.086gydF4y2Ba |
| 12gydF4y2Ba | 有效核电荷gydF4y2Ba |
|
|
0.000gydF4y2Ba | 0.000gydF4y2Ba | 0.601gydF4y2Ba | 0.896gydF4y2Ba | 0.317gydF4y2Ba | 0.336gydF4y2Ba |
| 13gydF4y2Ba | Calcium-IodinegydF4y2Ba |
|
|
0.284gydF4y2Ba | 0.015gydF4y2Ba | −0.391gydF4y2Ba | 0.754gydF4y2Ba | 0.126gydF4y2Ba | 0.127gydF4y2Ba |
| 14gydF4y2Ba | Calcium-WatergydF4y2Ba |
|
|
0.000gydF4y2Ba | 0.000gydF4y2Ba | 0.594gydF4y2Ba | 0.899gydF4y2Ba | 0.315gydF4y2Ba | 0.343gydF4y2Ba |
| 15gydF4y2Ba | Iodine-CalciumgydF4y2Ba |
|
|
0.000gydF4y2Ba | 0.001gydF4y2Ba | 0.500gydF4y2Ba | 0.822gydF4y2Ba | 0.174gydF4y2Ba | 0.165gydF4y2Ba |
| 16gydF4y2Ba | Iodine-WatergydF4y2Ba |
|
|
0.000gydF4y2Ba | 0.000gydF4y2Ba | 0.596gydF4y2Ba | 0.896gydF4y2Ba | 0.315gydF4y2Ba | 0.343gydF4y2Ba |
| 17gydF4y2Ba | Water-CalciumgydF4y2Ba |
|
|
0.000gydF4y2Ba | 0.002gydF4y2Ba | −0.494gydF4y2Ba | 0.818gydF4y2Ba | 0.174gydF4y2Ba | 0.165gydF4y2Ba |
| 18gydF4y2Ba | Water-IodinegydF4y2Ba |
|
|
0.291gydF4y2Ba | 0.017gydF4y2Ba | −0.386gydF4y2Ba | 0.734gydF4y2Ba | 0.174gydF4y2Ba | 0.165gydF4y2Ba |
单变量分析胃癌淋巴结转移的特点静脉阶段。gydF4y2Ba
| 不。gydF4y2Ba | 功能gydF4y2Ba | 的意思是gydF4y2Ba |
|
|
|
AUCgydF4y2Ba | 苏gydF4y2Ba | 搞笑gydF4y2Ba | |
|---|---|---|---|---|---|---|---|---|---|
| 负gydF4y2Ba | 积极的gydF4y2Ba | ||||||||
| 19gydF4y2Ba | 40岁的凯文gydF4y2Ba |
|
|
0.000gydF4y2Ba | 0.087gydF4y2Ba | 0.282gydF4y2Ba | 0.684gydF4y2Ba | 0.070gydF4y2Ba | 0.072gydF4y2Ba |
| 20.gydF4y2Ba | 50岁的凯文gydF4y2Ba |
|
|
0.000gydF4y2Ba | 0.102gydF4y2Ba | 0.269gydF4y2Ba | 0.673gydF4y2Ba | 0.070gydF4y2Ba | 0.072gydF4y2Ba |
| 21gydF4y2Ba | 60岁的凯文gydF4y2Ba |
|
|
0.000gydF4y2Ba | 0.135gydF4y2Ba | 0.247gydF4y2Ba | 0.653gydF4y2Ba | 0.086gydF4y2Ba | 0.092gydF4y2Ba |
| 22gydF4y2Ba | 70 keVgydF4y2Ba |
|
|
0.000gydF4y2Ba | 0.209gydF4y2Ba | 0.209gydF4y2Ba | 0.620gydF4y2Ba | 0.106gydF4y2Ba | 0.104gydF4y2Ba |
| 23gydF4y2Ba | 80 keVgydF4y2Ba |
|
|
0.000gydF4y2Ba | 0.481gydF4y2Ba | 0.118gydF4y2Ba | 0.559gydF4y2Ba | 0.110gydF4y2Ba | 0.122gydF4y2Ba |
| 24gydF4y2Ba | 90 keVgydF4y2Ba |
|
|
0.000gydF4y2Ba | 0.949gydF4y2Ba | 0.011gydF4y2Ba | 0.535gydF4y2Ba | 0.018gydF4y2Ba | 0.018gydF4y2Ba |
| 25gydF4y2Ba | 100 keVgydF4y2Ba |
|
|
0.000gydF4y2Ba | 0.781gydF4y2Ba | −0.047gydF4y2Ba | 0.562gydF4y2Ba | 0.018gydF4y2Ba | 0.020gydF4y2Ba |
| 26gydF4y2Ba | 110 keVgydF4y2Ba |
|
|
0.003gydF4y2Ba | 0.611gydF4y2Ba | −0.085gydF4y2Ba | 0.599gydF4y2Ba | 0.011gydF4y2Ba | 0.011gydF4y2Ba |
| 27gydF4y2Ba | 120 keVgydF4y2Ba |
|
|
0.012gydF4y2Ba | 0.521gydF4y2Ba | −0.107gydF4y2Ba | 0.613gydF4y2Ba | 0.011gydF4y2Ba | 0.011gydF4y2Ba |
| 28gydF4y2Ba | 130 keVgydF4y2Ba |
|
|
0.028gydF4y2Ba | 0.461gydF4y2Ba | −0.123gydF4y2Ba | 0.613gydF4y2Ba | 0.011gydF4y2Ba | 0.011gydF4y2Ba |
| 29日gydF4y2Ba | 140 keVgydF4y2Ba |
|
|
0.052gydF4y2Ba | 0.423gydF4y2Ba | −0.134gydF4y2Ba | 0.626gydF4y2Ba | 0.018gydF4y2Ba | 0.019gydF4y2Ba |
| 30.gydF4y2Ba | 有效核电荷gydF4y2Ba |
|
|
0.000gydF4y2Ba | 0.081gydF4y2Ba | 0.286gydF4y2Ba | 0.680gydF4y2Ba | 0.087gydF4y2Ba | 0.088gydF4y2Ba |
| 31日gydF4y2Ba | Calcium-IodinegydF4y2Ba |
|
|
0.651gydF4y2Ba | 0.254gydF4y2Ba | −0.190gydF4y2Ba | 0.643gydF4y2Ba | 0.025gydF4y2Ba | 0.026gydF4y2Ba |
| 32gydF4y2Ba | Calcium-WatergydF4y2Ba |
|
|
0.000gydF4y2Ba | 0.093gydF4y2Ba | 0.276gydF4y2Ba | 0.673gydF4y2Ba | 0.086gydF4y2Ba | 0.087gydF4y2Ba |
| 33gydF4y2Ba | Iodine-CalciumgydF4y2Ba |
|
|
0.005gydF4y2Ba | 0.159gydF4y2Ba | 0.233gydF4y2Ba | 0.650gydF4y2Ba | 0.037gydF4y2Ba | 0.042gydF4y2Ba |
| 34gydF4y2Ba | Iodine-WatergydF4y2Ba |
|
|
0.000gydF4y2Ba | 0.084gydF4y2Ba | 0.284gydF4y2Ba | 0.667gydF4y2Ba | 0.074gydF4y2Ba | 0.073gydF4y2Ba |
| 35gydF4y2Ba | Water-CalciumgydF4y2Ba |
|
|
0.011gydF4y2Ba | 0.162gydF4y2Ba | −0.231gydF4y2Ba | 0.657gydF4y2Ba | 0.037gydF4y2Ba | 0.042gydF4y2Ba |
| 36gydF4y2Ba | Water-IodinegydF4y2Ba |
|
|
0.631gydF4y2Ba | 0.270gydF4y2Ba | −0.184gydF4y2Ba | 0.636gydF4y2Ba | 0.011gydF4y2Ba | 0.011gydF4y2Ba |
基于统计的结果gydF4y2Ba
单色能量CT值的动脉和静脉阶段胃淋巴结转移。gydF4y2Ba
原始数据在动脉相gydF4y2Ba
原始数据在静脉相gydF4y2Ba
在动脉相规范化数据gydF4y2Ba
规范化数据在静脉相gydF4y2Ba
图gydF4y2Ba
SFS-KNN算法的分类性能不同的邻域大小。gydF4y2Ba
| 邻域大小gydF4y2Ba |
|
|
|
|
|
|
|---|---|---|---|---|---|---|
| Pre-normgydF4y2Ba | 选择功能gydF4y2Ba | 14、16gydF4y2Ba | 14日,31日,5日,15日,26日,4日,27日,21日,24日,9日,32岁的2,25日8日28日,3日,16岁gydF4y2Ba | 14日,31日,36岁,3,25岁,2gydF4y2Ba | 3 8 12日31日,29日,15日,33岁,1gydF4y2Ba | 3 12日31日,23日,26日,24日,30日,16岁gydF4y2Ba |
| 精度gydF4y2Ba | 88.29%gydF4y2Ba | 93.68%gydF4y2Ba | 93.29%gydF4y2Ba | 91.71%gydF4y2Ba | 92.24%gydF4y2Ba | |
|
|
||||||
| 规范gydF4y2Ba | 选择功能gydF4y2Ba | 12日,30gydF4y2Ba | 20日,15日,11日,30日,5gydF4y2Ba | 12日,30日,31日,33岁,14岁gydF4y2Ba | 12、19、20、30日,5日,18日,25日,17日,34岁的3,32岁,15岁,24岁gydF4y2Ba | 12、19、29、30 8 34岁,33岁,25日,15日,6日,24日,7日,10,20,17所示gydF4y2Ba |
| 精度gydF4y2Ba | 93.95%gydF4y2Ba | 96.45%gydF4y2Ba | 96.58%gydF4y2Ba | 96.18%gydF4y2Ba | 97.89%gydF4y2Ba | |
SFS-KNN生和规范化数据特征选择过程。gydF4y2Ba
原始数据gydF4y2Ba
规范化数据gydF4y2Ba
图gydF4y2Ba
分类性能mRMR-KNN与不同的邻域大小(筛选)。gydF4y2Ba
| Neighorhood大小gydF4y2Ba |
|
|
|
|
|
|
|---|---|---|---|---|---|---|
| PrenormgydF4y2Ba | 序列gydF4y2Ba | 14日,19日,5日,17日,23日,12日,3,16日,18日,22日,1,15日,4,2,30日,13日,21日,32岁的10,33岁,11日,34岁,20岁,35岁,31日,25日,9日,29日,24日,8日,7日,26日,36岁,27岁,28岁,6gydF4y2Ba | ||||
| 长度gydF4y2Ba | 1gydF4y2Ba | 28gydF4y2Ba | 28gydF4y2Ba | 35gydF4y2Ba | 1gydF4y2Ba | |
| 精度gydF4y2Ba | 87.50%gydF4y2Ba | 89.74%gydF4y2Ba | 89.08%gydF4y2Ba | 87.24%gydF4y2Ba | 81.71%gydF4y2Ba | |
| 规范gydF4y2Ba | 序列gydF4y2Ba | 3 15日,21日,30日,17日,24日,12日,14日,23日,5日,16日,22日,18日,27日,20日,4日,33岁,25日,13日,19日,6日,28岁,35岁,26岁,32岁,7日,29日,34岁,8日,31日,9日,11日,10日,36gydF4y2Ba | ||||
| 长度gydF4y2Ba | 4gydF4y2Ba | 2gydF4y2Ba | 2gydF4y2Ba | 2gydF4y2Ba | 10gydF4y2Ba | |
| 精度gydF4y2Ba | 90.00%gydF4y2Ba | 94.87%gydF4y2Ba | 94.87%gydF4y2Ba | 94.74%gydF4y2Ba | 95.66%gydF4y2Ba | |
分类性能mRMR-KNN与不同的邻域大小(中期)。gydF4y2Ba
| 邻域大小gydF4y2Ba |
|
|
|
|
|
|
|---|---|---|---|---|---|---|
| PrenormgydF4y2Ba | 序列gydF4y2Ba | 3 12日,26日,22日,18日,30日,14日,6日,19日,16日,36岁,2,17日,5日,1,24岁,35岁,15日,23日,4日,34岁,13日,29日,21日,7日,31日,11日,32岁,25岁,20日,9日,28日,33岁,8日,27岁gydF4y2Ba | ||||
| 长度gydF4y2Ba | 1gydF4y2Ba | 26gydF4y2Ba | 26gydF4y2Ba | 26gydF4y2Ba | 20.gydF4y2Ba | |
| 精度gydF4y2Ba | 87.50%gydF4y2Ba | 90.39%gydF4y2Ba | 89.34%gydF4y2Ba | 87.11%gydF4y2Ba | 82.50%gydF4y2Ba | |
| 规范gydF4y2Ba | 序列gydF4y2Ba | 2 15日,21日,30日,24日,17日,5日,14日,23日,12日,18日,22日,27日,4日,16日,33岁,7日,1,20日,25日,13日,3日,29日,19日,6日,35岁,28日,31日,8日,32岁的26日,11日,34岁,36岁,9、10gydF4y2Ba | ||||
| 规范gydF4y2Ba | 长度gydF4y2Ba | 4gydF4y2Ba | 2gydF4y2Ba | 2gydF4y2Ba | 16gydF4y2Ba | |
| 精度gydF4y2Ba | 89.74%gydF4y2Ba | 94.87%gydF4y2Ba | 94.87%gydF4y2Ba | 95.66%gydF4y2Ba | 95.26%gydF4y2Ba | |
特征选择过程与不同mRMR标准。gydF4y2Ba
中期gydF4y2Ba
进行筛选gydF4y2Ba
图gydF4y2Ba
降维结果不同的度量学习方法的验证。gydF4y2Ba
主成分分析gydF4y2Ba
乔治。gydF4y2Ba
美国广播公司gydF4y2Ba
LFDAgydF4y2Ba
NCAgydF4y2Ba
LMNNgydF4y2Ba
表gydF4y2Ba
然而,算法的分类性能度量学习方法。gydF4y2Ba
| 数据(特性集的长度)gydF4y2Ba | Prenorm (4)gydF4y2Ba | 规范01 (5)gydF4y2Ba |
|---|---|---|
| 然而,gydF4y2Ba | 80.79%gydF4y2Ba | 83.68%gydF4y2Ba |
| 而主成分分析gydF4y2Ba | 80.79%gydF4y2Ba | 83.68%gydF4y2Ba |
| 主成分分析gydF4y2Ba | 82.11%gydF4y2Ba | 81.84%gydF4y2Ba |
| PCA + LDAgydF4y2Ba | 77.89%gydF4y2Ba | 96.33%gydF4y2Ba |
| PCA + RCAgydF4y2Ba | 77.63%gydF4y2Ba | 96.33%gydF4y2Ba |
| PCA + LFDAgydF4y2Ba | 76.97%gydF4y2Ba | 96.33%gydF4y2Ba |
| PCA + NCAgydF4y2Ba | 76.58%gydF4y2Ba | 86.32%gydF4y2Ba |
| PCA + LMNNgydF4y2Ba | 76.84%gydF4y2Ba | 96.33%gydF4y2Ba |
基于实验结果,机器学习方法的使用可以改善胃癌临床淋巴结转移的准确性。在我们的研究中,我们主要使用资讯分类的算法,效率高。提高效率和分类精度,我们首先采用几个特征选择算法,如mRMR和SFS方法,既显示精度的增加。我们获得了高度相关淋巴结转移的特点符合临床病理学的验证结果。提高精度的另一种方法是使用距离度量学习从一个给定的输入空间数据的相似/不同的点的集合保存训练数据之间的距离关系,和资讯的应用算法的新数据模式。一些方案用于我们的实验的整体精度达到96.33%。gydF4y2Ba
我们研究的主要贡献是证明机器学习方法的可行性和有效性的计算机辅助诊断(CAD)在胃癌淋巴结转移使用临床GSI数据。在本文中,我们使用一个简单的和经典的算法称为资讯,结合几个特征选择算法和度量学习方法。实验结果表明,我们的方案优于传统诊断方法(例如,欧盟和多层螺旋ct)。gydF4y2Ba
我们的研究的一个限制是临床病例数量不足。因此,在未来的工作中,我们将进行更多的临床实验数据进一步改善方案的效率和探索更有用和强大的CAD在临床的机器学习方法。gydF4y2Ba
这项工作是由中国国家基础研究计划(973计划,没有。2010年cb732506)和国家自然科学基金委(没有。81272746)。gydF4y2Ba