肺结节的分类与深卷积神经网络在计算机断层扫描图像

文摘

计算机辅助诊断(CAD)系统可以帮助放射科医生提供的第二个意见早期诊断肺癌。分类和特征表现在减少假阳性扮演关键角色(玻璃钢)在肺结节计算机辅助设计。我们设计深结节卷积神经网络方法分类、autolearning表示的一个优势和较强的泛化能力。指定网络结构对于结节的图像提出了解决识别结节的三种类型,即固体、半固体,磨砂玻璃不透明(GGO)。62492年深卷积神经网络训练感兴趣的(roi)样本包括40772和21720 nonnodules肺结节图像数据库联盟(LIDC)数据库。实验结果证明了该方法的有效性方面的敏感性和整体精度和它始终优于竞争方法。

1。介绍

肺癌已经成为目前的一个主要威胁人类健康。由于肺癌引起的死亡人数比前列腺癌、结肠癌和乳腺癌[1]。早期发现孤独的肺结节(spn)是一个重要的临床表现早期肺癌诊断因为成为恶性结节(spn有很高的概率2,3]。spn指肺组织异常与圆的不透明度约球,直径30毫米。

因此一项重要任务开发计算机辅助诊断(CAD)系统可以帮助/提高放射科医师工作流和可能减少假阴性结果。CAD是一个方案,自动检测可疑病变(即。,nodule, polyps, and masses) in medical images of certain body parts and provides their locations to radiologists [4- - - - - -6]。CAD已成为主要的研究主题在医学成像和诊断放射学和医学成像技术包括用于各种计算机断层扫描(CT) (7),磁共振成像(MRI) (8),和超声波成像(9]。一般来说,典型的癌症检测和诊断(即CAD系统。、乳腺癌、肺癌和息肉)四个阶段如图1(一)的利益,包括候选人结节ROI(地区)检测、特征提取和结节的分类。特征提取阶段,结节分类属于减少假阳性的一步。当前CAD方案结节特征取得了高灵敏度水平,能够提高放射科医生的性能在薄片结节CT的特征,而目前的方案似乎结节检测报告许多假阳性。这是因为检测算法有很高的灵敏度,一些nonnodule结构(如血管)贴上结节不可避免地在最初的结节识别的步骤。放射科医生必须检查每个识别对象以来,强烈希望消除这些假阳性(FPs)尽可能同时保留真正的阳性(TPs)。因此,需要大量的工作来改善当前的性能水平CAD在薄片CT结节检测方案。

(一)

(b)

减少假阳性的目的是去除这些假阳性(FPs)尽可能同时保留相对灵敏度高(10,11]。结节之间的二元分类和nonnodule,旨在发展新的方法,以准确区分可疑区域,从而显著减少FPs与机器学习技术。减少假阳性的步骤,或分类步骤,它的目的是学习一个系统能够预测未知的输出类的前所未有的可疑结节具有良好的泛化能力,是肺结节检测系统的关键部分。分类中扮演一个重要的角色在减少假阳性肺癌计算机辅助检测和诊断方法。深度学习可用于分类和功能学习计算机视觉和语音等各领域。在我们的工作,一个深卷积神经网络提出了肺结节LIDC分类使用数据库。CAD系统中使用的方法取代了特征提取和分类两个组件。深卷积神经网络的输入在这个工作是直接ROI像素数据没有特征提取和选择。与传统方法相比,该方法在我们的工作有四个优点如下。(我)结节ROI是至关重要的表现真结节和假结节之间的歧视。然而,很难获得良好的特性,人为的努力表示。我们的方法可以学习一个好的特征表示的ROI特征提取和选择。(2)我们的方法利用了ROI的内部区域和外部区域之间的关系,以便了解更多歧视知识减少假阳性。(3)我们的方法可以执行基于ROI的中心而不是整个ROI区域。因此,没有必要获得的精确边缘结节检测CAD系统的第一步。(iv)大规模的roi的神经网络训练数据与结节和nonnodules超过6万最大的我们的知识。神经网络是能够识别多种表征的结节。

剩下的纸是组织如下。部分2分析了相关的工作。方法识别结节中描述部分3。实验结果讨论了部分4。我们在部分总结本文5。

目前,很多作品已经完成在肺结节识别研究。肺结节检测识别包括结节候选人(12)和减少假阳性(13]。减少假阳性的传统方法已经连续步骤:特征提取(14,15和分类器模型建设10,16]。最有效的特征,可用于肺CT图像分类,例如,形状、强度、纹理、几何、梯度和小波。纹理特征作为Haralick、伽柏和局部二进制模式是用于分析肺结节(17]。MR8,枸杞多糖(局部二进制模式),筛选描述符,MHOG (Multiorientation面向梯度直方图)用于特征提取过程中(18],冲浪(加速健壮的特性)和枸杞多糖描述符是用于生成特征描述常见的肺结节的纹理(19]。穆罕默德应用一种改进的肺结节检测枸杞多糖特性为噪声(健壮20.]。隋等人使用循环的二维特性,伸长,密实度,时刻,和3 d功能表面积、体积,球形,centroid-offset肺结节识别(21]。虽然功能和综合设计,第三步的分类器CAD系统仍显示他们的缺陷分类结节精确图像。一般来说,分类器是监督学习方法在机器学习领域,如支持向量机,最近的邻居(神经网络)、人工神经网络(ann)和决策树用于肺结节的分类(22]。此外,张等人设计了一个分类器semisupervised方式探索从标记图像的信息23]。为了提高整体分类的优势在肺结节识别任务中,随机森林算法对混合结构描述的随机森林聚类的帮助下(24]。之间的不平衡分布的结节和nonnodule候选人出来主要是数据集。隋等人提出一个新颖的SVM分类器结合随机采样击打肺结节识别(21]。曹等人的随机子空间方法扩展到小说的成本敏感的自适应随机子空间(csar)合奏克服不平衡数据分类10]。

近年来,人工神经网络赢得了很多比赛在模式识别和机器学习。卷积神经网络(cnn)构成一个这样的类模型(30.]。在2012年,一个cnn的方法达到最好的结果在ImageNet分类基准,这是受欢迎的在计算机视觉界(31日]。也受欢迎的最新研究领域的医学成像用深度学习不错的效果。Suk等人提出一个新颖的神经影像数据的潜在的和共享的特性表示大脑使用深玻耳兹曼机(DBM)广告/ MDC诊断[32]。吴等人使用特性为变形注册学习大脑深处,提高图像配准图像通过使用深特性(33]。许等人现在使用深层神经网络的有效性(款)特征提取作为监督方法在医学图像分析(34]。Kumar等人提出一个CAD系统。该系统利用深特点提取autoencoder分类肺结节是恶性或良性LIDC数据库,这是类似于我们的工作35]。卷积神经网络表现比DBNs本身在当前文学计算机视觉在基准数据集。cnn吸引了相当大的兴趣在机器学习,因为他们有很强的表现能力在学习有用的特性从近年来输入数据36]。此外,我们所知还没有工作,使用深卷积神经网络对肺结节的分类。因此,我们在肺结节计算机辅助评估CNN。

3所示。该方法

3.1。数据

这项工作中所使用的数据集是LIDC-IDRI数据集37),包括1010年的胸CT扫描与结节大小报告和诊断报告,作为医学影像研究资源。使用两个盲阶段四个放射科医生检查每个扫描。每个放射科医师的选取评审的结果编制形成了最后的选取审查。LIDC放射科医生的注释包括徒手画的轮廓的结节≥3毫米直径在每个结节的CT片,随着主观评级规模5到6点下面的病理特点:钙化,内部结构,微妙,分成小裂片,利润率,球形,恶性肿瘤,质地,和spiculation。注释还包括单个结节的马克(一种近似质心)≤3毫米直径以及nonnodules≥3毫米。

我们从结节与注释包括结节中心报告。的平均宽度和高度结节14像素,图像和中值是12像素。结节的大小小于占总体的95.33%数据和比例不到99.991%结节的大小。

在第一步的ROI提取、计算几何中心的数据库中该地区优势明显。然后区域大小决定它是否大于。的相同的矩形区域分割的几何区域如果规模小于。否则,一个更大的规模作为候选人获得ROI然后downsampled最终尺寸。有nonnodule注释区域提取通过同样的方式形成负样本训练和测试过程中。为了评估神经网络的有效性对于不同的图像大小,数据集也用大小使用相同的程序。结果,共有62492个ROI图像补丁从1013 LIDC肺图像中提取包含40772结节和21720 nonnodules病例。

3.2。卷积神经网络建设

在计算机视觉中,介绍了深卷积神经网络(cnn),因为他们可以模拟人类视觉系统的行为和学习层次特性,允许对象局部不变性和健壮性翻译和畸变模型中(36]。cnn是另一种类型的神经网络模型,可用于空间和时间相关,同时减少平移方差信号。深卷积神经网络是建立基于输入图像的大小。网络的结构根据不同的图像大小是不同的。深CNN提出了构造ROI图像数据作为例子呈现在图2。

卷积神经网络有两个卷积层和有一个downsampling层在回旋的层。完全连接层附加到最后downsampling层。第一个卷积层包含8个特征图,第二有16个。内核大小是在所有卷积层和内核的步骤是1。内核大小是为将采样的所有层和步骤2。第一个完全连接层包含150个节点和100个节点在第二个完全连接层。有50个节点在第三完全连接层和最后一层只有两个节点的输出概率的结节和nonnodule。ROI区域可以被视为结节或nonnodule输出概率。以同样的方式,可以构造卷积神经网络大小只输入图像和卷积核大小、卷积核移动一步,调整特性图,节点的数量,这里不讨论。

3.3。神经网络训练

上面描述的深cnn LIDC部分训练的ROI图像中提取部分3.1。首先,网络的随机初始化权重,然后进行ROI图像规范化作为神经网络的输入。在训练阶段,标签的图像输入到网络;也就是说,每个ROI区域被称为肺结节。每一层的网络输入和输出、当前层为卷积计算或完全连接层,在那里是每个节点和当前层权重对应是偏差参数。配方是将采样的层。输出层是softmax层预测结节类的概率。两个概率得到计算后的输出层操作如上描述从输入图像数据。新的权重值可以通过反向传播算法使用更新的两个概率和标签数据0或1 (16]。培训过程终止时,精度达到预定的值或收敛条件。最后,评价是进行测试数据与训练模型。

4所示。实验

LIDC数据库上进行实验评估。测试方案设计为两种不同的策略。一个是10倍交叉验证(CF-test),另一个是数据集分为训练数据(85.7%)和测试数据(DD-test)。因为所有以前的作品是基于手工设计的特性,而本文提出的方法是基于特征学习和结节识别用很深的卷积神经网络,是不可能直接比较我们的方法LIDC在相同的数据集。所有的实验都在台式电脑上2.80 GHz的英特尔酷睿2处理器,8 GB的内存,和Windows 7。该算法由c++实现在微软Visual Studio 2010。性能如表所示1CF-test和DD-test。测试T1、T2和T3 CF-test战略和卷积的参数映射大小和动量的重量更新设置为6和0.9。0.0005学习利率在T1和T2, T3是0.001。图像大小在T2和T3和其他的。T4和T5测试使用的策略DD-test动量和学习速率设置为0.95和0.0005,分别。然而,卷积地图大小设置为T4和T5测试8 6。CF-test学习速率保持不变,整个培训过程。然而,T4和T5学习率测试减少了5/6的最后一次迭代一次精确到0.85的价值。图3(一个)表明,精度和误差的性能趋势CF-test和相同的评估结果呈现在图3 (b)最大迭代到50。


TID	精度	灵敏度	FP /考试	测量	时间(年代)

T1	0.855	0.855	4.276	0.870	5236年
T2	0.849	0.866	3.957	0.858	28761年
T3	0.857	0.871	4.459	0.864	19302年
T4	0.864	0.890	5.546	0.877	19993年
T5	0.843	0.871	5.540	0.857	21920年

(一)

(b)

学习速率变化DD-test基准图所示4。DD-test评估、培训过程进行的训练数据集将打乱训练在每个迭代的开始,然后是模型应用于测试数据集没有改变在整个测试时间。因此,在每个迭代中获得新的评估结果。从表1,深卷积神经网络获得承诺表现肺结节CT图像上识别。最好的精度是0.864和灵敏度是0.890。的结果还表明,更大的价值动力和学习速率可以达到快速收敛性能。

结果如图3和4证明学习收敛速度相比CF-test更为顺利。虽然精度的变化是巨大的顶部CF-test迭代,逐渐增加训练误差和整个网络是稳定的。然而,性能对误差和精度若干次迭代后变得更加稳定。这种行为与学习速率的变化,因为当网络获得一个最佳点然后训练过程得到稳定。总的来说,深卷积神经网络训练过程中显示了它的稳定性和鲁棒性。此外,CNN是有效和高效的分类框架。

为了显示的性能基于深度学习的方法,我们用最先进的方法相比为肺结节检测而设计的。结果如表所示2。严格来说,很难与其他报道作品在肺结节检测问题。这是因为大多数工作不雇用LIDC整个数据集。从结果表2,我们的实证结果非常令人鼓舞,演示了该方法的承诺在肺结节检测灵敏度和FP /考试。


工作	数据库	情况下	灵敏度(%)	FP /考试

该方法	LIDC	1010年	87.1	4.622
清爽的et al。25]	LIDC	29日	85.9	0.138
裴et al。26]	LIDC	30.	One hundred.	8.4
聚氨酯等。27]	LIDC	52	81.5	6.5
Namin et al。28]	LIDC	63年	88.0	10.3
Messay et al。29日]	LIDC	84年	82.66	3

5。结论

摘要肺结节的方法使用深提出了卷积神经网络识别。深卷积神经网络可以利用训练数据集,使该算法自动选择最佳的代表作为图像的特征表示。通过训练的训练数据集,这种方法获得更多的一般特征的肺结节和更高的精度,同时保留相对更好的鲁棒性。我们计划将该方法扩展到能够在未来良性和恶性分类。该算法将由GPU加速计算卷积操作。

相互竞争的利益

作者宣称没有利益冲突。

确认

这项研究得到了国家关键技术研究与发展计划下的中国科技部授予2014 bai17b01,中国国家自然科学基金(61502091),为中央大学基础研究基金批准号。N140403004, N150408001, N140407001、中国博士后科学基金会(2015 m570254)。

引用

p·b·巴赫,j . n .墨金·t·k·奥利弗et al .,“CT筛查肺癌的好处和坏处:系统回顾,“《美国医学会杂志》,卷307,不。22日,第2429 - 2418页,2012年。视图:出版商的网站|谷歌学术搜索
h·t·Winer-Muram“孤立肺结节,”放射学,卷239,不。1,34-49,2006页。视图:出版商的网站|谷歌学术搜索
铃木k . f . Li s宋,k . Doi“计算机辅助诊断方案区分良性和恶性结节在胸低剂量CT利用大规模训练人工神经网络,”IEEE医学成像,24卷,不。9日,第1150 - 1138页,2005年。视图:出版商的网站|谷歌学术搜索
k .铃木“回顾计算机辅助诊断胸和结肠成像,”定量成像在医学和外科手术,2卷,第176 - 163页,2012年。视图:谷歌学术搜索
m . Tan r . Deklerck b·詹森m .深褐色和j . Cornelis”小说肺结节计算机辅助检测系统的CT图像,”医学物理学,38卷,不。10日,5630 - 5645年,2011页。视图:出版商的网站|谷歌学术搜索
m . n . Gurcan b领域:Petrick et al .,“胸肺结节检测计算机断层扫描图片:初步评价的计算机辅助诊断系统,”医学物理学卷,29号11日,第2558 - 2552页,2002年。视图:出版商的网站|谷歌学术搜索
工程学系。彭,D.-H。金,S.-L。李,M.-K。Lim,纹理特征提取基于一致性估计方法在胸部CT图像局部亮度和结构”计算机在生物学和医学,40卷,不。11 - 12,931 - 942年,2010页。视图:出版商的网站|谷歌学术搜索
y, s, p .菲利普斯,z, g .霁和j·杨,”阿尔茨海默病和轻度认知障碍检测基于结构体积图像使用3 d-dwt先生和WTA-KSVM PSOTVAC训练,”生物医学信号处理和控制卷。21日,58 - 73、2015页。视图:出版商的网站|谷歌学术搜索
彭译葶。Chang S.-J。陈,M.-F。蔡”,应用support-vector-machine-based特征选择和分类方法甲状腺结节的超声图像,”模式识别,43卷,不。10日,3494 - 3506年,2010页。视图:出版商的网站|谷歌学术搜索
p .曹、d .赵和o . Zaiane”成本敏感的自适应随机子空间整体计算机辅助结节检测,”计算机学报》第26届IEEE国际研讨会医疗系统(cbm 13)葡萄牙波尔图,页173 - 178,,2013年6月。视图:出版商的网站|谷歌学术搜索
铃木k . j . Shiraishi h·安倍h . mcmahon和k . Doi“计算机辅助诊断方案减少假阳性检测结节在胸片通过大规模训练人工神经网络,”放射学学术,12卷,不。2、191 - 201年,2005页。视图:出版商的网站|谷歌学术搜索
k .铃木“监督lesion-enhancement的过滤器的使用massive-training人工神经网络(MTANN)计算机辅助诊断(CAD),“物理学在医学和生物学,54卷,不。18日,S31-S45, 2009页。视图:出版商的网站|谷歌学术搜索
铃木k . s . g . Armato三世,f·李,s .宋和k . Doi”大规模训练人工神经网络(MTANN)减少假阳性的计算机检测低剂量ct肺结节的”医学物理学,30卷,不。7,1602 - 1617年,2003页。视图:出版商的网站|谷歌学术搜索
林x, x, j . Dehmeshki g . Slabaugh travis Beddoe g .,“Shape-based计算机辅助检测胸肺结节的CT图像,”IEEE生物医学工程卷,56号7,1810 - 1820年,2009页。视图:出版商的网站|谷歌学术搜索
d . s .沉重的一击,c·f·比尤利·g·d·鲁宾et al .,“表面正常的重叠:计算机辅助检测算法与应用程序在螺旋CT结肠息肉和肺结节,”IEEE医学成像,23卷,不。6,661 - 675年,2004页。视图:出版商的网站|谷歌学术搜索
李x t .太阳,j . Wang et al .,“比较支持向量机评价计算机辅助诊断肺癌的CT基于多维数据集,“计算机在生物医学方法和项目,卷111,不。2、519 - 524年,2013页。视图:出版商的网站|谷歌学术搜索
g·f·汉,h . Wang Zhang et al .,“纹理特征分析对肺结节计算机辅助诊断,”数码影像杂志,28卷,不。1,第115 - 99页,2014。视图:出版商的网站|谷歌学术搜索
f·张,y的歌,w . Cai et al .,“肺结节的分类与多级patch-based上下文分析,“IEEE生物医学工程,卷61,不。4、1155 - 1166年,2014页。视图:出版商的网站|谷歌学术搜索
f·阿玛尔,亚欧会议,g . James et al .,“基于功能的肺结节的分类,”视觉计算的进步:第六届国际研讨会,ISVC 2010年,拉斯维加斯,NV,美国11月29日- 12月1日,2010年,诉讼,第三部分卷,6455年,页79 - 88,施普林格,柏林,德国,2010年。视图:出版商的网站|谷歌学术搜索
h·s·穆罕默德,“肺结节检测基于噪声健壮的局部二进制模式,”国际科学和工程研究杂志》上5卷,第362 - 356页,2014年。视图:谷歌学术搜索
y隋、y . Wei和d .赵“肺结节计算机辅助识别的SVM分类器基于随机采样和击杀,”计算和数学方法在医学文章ID 368674卷,2015年,13页,2015。视图:出版商的网站|谷歌学术搜索|MathSciNet
y的歌,w . Cai、y周和d·d·冯“肺组织分类、基于图像块近似”IEEE医学成像,32卷,不。4、797 - 808年,2013页。视图:出版商的网站|谷歌学术搜索
f·张,y的歌,w . Cai et al .,“排名肺结节图像分类方法中使用标记图像的知识,”IEEE学报》11日生物医学成像国际研讨会(位ISBI 14),第1359 - 1356页,北京,中国,2014年5月。视图:谷歌学术搜索
美国洛杉矶李,a z Kouzani, e . j .,“基于随机森林的肺结节的分类聚类的帮助下,“计算机医学影像和图形,34卷,不。7,535 - 542年,2010页。视图:出版商的网站|谷歌学术搜索
s . m . b .清爽的a·c·席尔瓦·r·a . Nunes和m . Gattass“肺结节的自动分割越来越神经气体和支持向量机,”计算机在生物学和医学,42卷,不。11日,第1121 - 1110页,2012年。视图:出版商的网站|谷歌学术搜索
x裴、h·郭和j .戴“电脑检测肺结节的CT图像中利用多尺度过滤器和几何约束区域增长,”诉讼的第四届国际会议上生物信息学和生物医学工程(iCBBE 10),页1 - 4,成都,中国,2010年6月。视图:出版商的网站|谷歌学术搜索
j . Pu、郑,j·k·领袖X.-H。王,d .电流的“自动基于CT肺结节检测方案使用了距离场的几何分析,“医学物理学,35卷,不。8,3453 - 3461年,2008页。视图:出版商的网站|谷歌学术搜索
s . t . Namin h·a·穆贾达姆r·贾法里·m·Esmaeil-Zadeh和m . Gity”自动检测和分类3 d胸肺结节的CT图像,”《IEEE国际会议系统,人与控制论(SMC的10),页3774 - 3779,伊斯坦布尔,土耳其,2010年10月。视图:出版商的网站|谷歌学术搜索
t . Messay r·c·哈迪和k·罗杰斯,“一个新的计算高效的CAD系统对肺结节检测CT图像,”医学图像分析,14卷,不。3、390 - 406年,2010页。视图:出版商的网站|谷歌学术搜索
埃尔弗尔a和j . p . n . Fotheringham-Smy“卷积网络和应用远景,”《IEEE国际研讨会在ISCAS’10)电路与系统(,页253 - 256年,巴黎,法国,2010年。视图:谷歌学术搜索
a . Krizhevsky i Sutskever, g·e·辛顿“Imagenet分类与深卷积神经网络,”诉讼进展的神经信息处理系统(捏12)太浩湖,页1 - 4,内华达州,美国,2012年。视图:谷歌学术搜索
我的。Suk, S.-W。李,d .沈”层次特征表示和多通道融合与深度学习广告/ MCI诊断,”科学杂志卷,101年,第582 - 569页,2014年。视图:出版商的网站|谷歌学术搜索
m·g . Wu金王,y高,廖,d .沈,“无人监督的深度特性为变形先生的大脑图像注册学习,”医学影像计算和计算机辅助干预》16卷,第2部分,649 - 656年,2013页。视图:谷歌学术搜索
y, t·莫问:冯,p .钟,m .赖和大肠I.-C。常,“深度学习的特征表示与多个实例学习医学图像分析,”IEEE国际会议上声学学报》,演讲,和信号处理(ICASSP 14),第1630 - 1626页,上海,中国,2014年5月。视图:出版商的网站|谷歌学术搜索
d·库马尔a . Wong和d . a . Clausi“肺结节的分类使用深特性在CT图像,”学报》第十二次会议上电脑和机器人视觉(CRV 15)IEEE,页133 - 138年,2015年6月加拿大哈利法克斯。视图:出版商的网站|谷歌学术搜索
l . Yann和b . Yoshua卷积网络图片,语音,和时间系列”大脑理论和神经网络的手册,卷3361,不。10日,1995年。视图:谷歌学术搜索
s . g . Armato三世,g . McLennan l . Bidaut et al .,“肺图像数据库财团(LIDC)和图像数据库资源计划(IDRI):一个完整的参考数据库肺结节的CT扫描,”医学物理学,38卷,不。2、915 - 931年,2011页。视图:出版商的网站|谷歌学术搜索

计算和数学方法在医学