使用深度学习分类的肺结节计算机断层扫描图像

文摘

肺癌是最常见的癌症,不容忽视,导致死亡和卫生保健。目前,CT可以用于帮助医生检测肺癌在早期阶段。在许多情况下,识别肺癌的诊断取决于医生的经验,这可能会忽略一些病人,导致一些问题。深度学习被证明是广受欢迎和手握强权的方法在许多医学影像诊断领域。在这篇文章中,三种类型的深层神经网络(例如,CNN,款和SAE)用于肺癌钙化。这些网络应用于CT图像分类任务的一些修改肺结节的良恶性。这些网络LIDC-IDRI数据库进行评估。实验结果表明,CNN网络存档最佳性能的准确性为84.15%,敏感性为83.96%,特异性为84.32%,有最好的结果在三个网络。

1。介绍

肺癌是最常见的癌症男性和女性是世界范围的一个主要疾病负担(1]。报告估计,一些肺癌新发病例的数量大约是221200,占大约13%的癌症诊断于2015年。肺癌的死亡率占所有癌症死亡的27% (2]。由于这些理由,肺结节时需要检查和密切关注可能是处于初期阶段。早期发现,肺癌患者的5年生存率可以提高约50%。

计算机断层扫描(CT)是最有效的方法,肺结节检测的能力形成的三维(3 d)图象的胸部,导致更大的结节和肿瘤病理的分辨率。CT图像由计算机处理,协助肺结节诊断方法已广泛应用于临床。计算机辅助诊断(CAD)的过程中肺癌可分为检测系统(通常缩写为凯德)和诊断系统(通常缩写为CADx)。凯德系统前面步骤中确定的候选人结节分为结节或nonnodules(即。正常解剖结构)。CADx系统的目的是进行分类检测结节良性和恶性结节(3]。由于恶性肿瘤的概率是密切相关的几何尺寸,形状,和外观,CADx可以区分良性和恶性肺结节的有效特征,如纹理、形状和增长率。因此,一个特定的成功CADx诊断系统可以测量的精度,速度,和自动化水平4]。

近年来,神经网络,改名为“深度学习”,开始殴打传统人工智能在每个关键任务:语音辨识;描述图像;并生成自然、易读的句子。深度学习不仅加快了关键的任务,而且提高了计算机的精度和CT图像检测和分类的性能。

本文分类问题的良性和恶性。分别提出了采用卷积神经网络(CNN),深层神经网络(款),和堆叠autoencoder (SAE)。工作可以直接作为输入,减少复杂的重建数据的特征提取和分类的过程。

剩下的纸是组织如下。部分2分析了相关的工作。部分3提出了提出了肺结节的分类方法。实验结果讨论了部分4。本文的结论部分5。

各种措施经常开发旨在提高肺癌诊断的准确性使用神经网络。陈等人。5)提出了一个方法,使用神经网络集成的计划(向)可能区分良性和不确定,可能恶性肺结节。实验结果说明,该计划分类精度(78.7%)优于单个分类器(LVQNN: 68.1%)。

在[6),Kuruvilla Gunavathi提出了一种基于纹理特征的方法使用人工神经网络(ANN)与93.30%的准确率。使用纹理和形状特征的组合进行检测和分类可能导致改善分类精度(7]。Kumar等人提出了一个方法使用堆叠autoencoder (SAE),深入学习技术,准确率75.01% (8]。

深度学习使用“深”是基于神经网络由大量的隐藏层。深度信念网(DBN)无向其最高两层之间的连接和downward-directed所有较低的层之间的连接(9)已经测试了恶性肿瘤的分类没有计算肺结节的形态和结构特征(10]。它达到了敏感性73.40%,特异性82.20%的速度使用深层信念网络。

一些研究论文深cnn申请检测或医学图像的分类。2015年,沈et al。11)诊断肺癌LIDC的数据库上使用多尺度两层CNN和报告的准确性为86.84%。在[12),胫骨等人利用和广泛评估三个重要,以前替代因素对CNN架构,数据集特征、学习和转移。

3所示。材料和方法

在本节中,该方法在LIDC-IDRI [13]数据集从肺图像数据库评估财团。复杂的传统医学图像特征提取的步骤可以减少直接输入原始图像。

3.1。卷积神经网络(cnn)

卷积神经网络(CNN)是一种多层神经网络,它由一个或多个卷积层,然后后面跟着一个或多个完全连接层和一个标准的多层神经网络。CNN在1960年代提出,与当地的思想像知觉,分享的重量,在空间或时间采样。本地感知可以找到一些地方特色的数据基本特征的视觉动物,如一个角度和弧形的图片(14]。是一种高效的识别方法,最近吸引了广泛关注。cnn的好处是,他们更容易训练和有许多参数少于完全连接网络与相同数量的隐藏的单位。

卷积神经网络体系结构通常是用于与卷积层和池层(合作15]。池层是迷惑的感情特征的具体位置。因为有些位置特性并不重要,它只是需要其他功能和相对位置。池层操作由马克斯池,池。意味着池计算平均社区内的特征点,和最大池计算特征点的社区内最大。特征提取的误差主要来自两个方面:社区大小限制造成的估计方差和卷积层参数估计误差平均偏差造成的。意思是池可以减少第一个错误,保留更多的图像背景信息。马克斯池可以减少第二个错误,留住更多的纹理信息。

摘要CNN的体系结构显示在图1。它是由多个地图在每一层;每个地图由多个神经单元,所有神经单位相同的内核(即地图共享一个卷积。、重量),每个卷积核代表一个功能,如获取图像的边缘特征。CNN是显示在表的细节1。输入数据(图像数据)有很强的鲁棒性失真。多尺度卷积图像特征生成的卷积核的大小和参数设置;不同角度的信息生成的特征空间。


层	类型	输入	内核	输出

1	卷积	28××28日1	5×5	24×24×32
2	马克斯池	24×24×32	2×2	12×12×64
3	卷积	12×12×64	5×5	8×8×64
4	马克斯池	8×8×64	2×2	4×4×64
5	完全连接	4×4×64	4×4	512×1
6	完全连接	512×1	1×1	2×1
7	Softmax	2×1	N /一个	结果

3.2。深层神经网络(款)

一款隐藏节点的数量的增加一个简单的神经网络。可以使用神经网络进行更复杂的输入计算,因为每个隐层输出的非线性转换层和深层神经网络比“浅”网络。非线性应该对每个隐层使用,因为如果激活函数是线性的,而单隐层神经网络,网络的隐层的深度不提高表达能力。处理部分肺结节是分解到款,所以不同的网络层可以用来获得不同大小的肺结节的特征。也有局部极值问题在款和梯度扩散问题。

在培训过程中,使用原始图像作为输入层参数,以便保留大量图片的详细信息。输入层、隐藏层和输出层的架构都是款连接层,和款不包含一个卷积层。培训款图片和标签输入款架构;每一层的重量在第一个培训是由高斯分布随机生成的,设置偏差为0。然后,输出值计算是向前传播和更新参数是反向传播。神经网络结构的深度图2并进一步详细的表2。因为款太容易过度拟合的参数(16],微调[17),增加数据量,和正规化18)需要解决它。


层	类型	输入	输出

1	输入	28××28日1	784×1
2	完全连接	784×1	512×1
3	完全连接	512×1	256×1
4	完全连接	256×1	64×1
5	完全连接	64×1	2×1
6	Softmax	2×1	结果

3.3。堆叠Autoencoder (SAE)

堆叠autoencoder (SAE)神经网络是神经网络的多层稀疏autoencoder。稀疏autoencoder是一种无监督学习算法(19]。稀疏autoencoder分为三层,即输入层、隐层和输出层。输入和输出层神经元的数量是相同的,和隐藏的神经元的数量小于输入层。图3是稀疏autoencoder的结构。此外,稀疏autoencoder分为编码阶段和解码阶段;编码阶段是输入层到隐层的映射。解码阶段隐层到输出层的映射。摘要多个autoencoders和softmax分类器相结合构建一个SAE网络与多个隐藏层和最后softmax分类器(20.]。

图4堆叠autoencoder神经网络的结构。隐藏层的隐层是一个稀疏autoencoder。肺结节的诊断属于图像分类的问题;每一个稀疏autoencoder删除“解码”层培训完成后,直接使用的编码过程的下一个稀疏autoencoder训练输出。

3.4。损失函数的神经网络

损失函数如下: 在哪里C是成本函数,w的重量,b是偏见,n训练数据集实例的数量,x图像像素值作为输入参数,然后呢一个是输出值。款用于背传播操作修改重量w和偏执b,所以预测值和真实值之间的差异变得越来越小,因此,提高准确性。最后一项的损失函数是防止过度拟合训练过程,和权重的总和除以2n。另一种方法来防止过度拟合是辍学,随机盾牌有些神经元在反向传播之前,和蒙面神经元不更新参数。款后需要大量的数据,但是如果大量的数据输入到神经网络,它需要大量的内存。因此,为了更快速地修改参数,每次min_batch反向传播。

激活函数的神经网络是漏水的ReLU,可增强非线性建模的能力。ReLU激活函数公式如下: 在哪里x是加权的结果优先级乘法和偏执加法和y是激活的输出函数。可以看出,如果ReLU的导数是0x< 0,其他1。所以ReLU消除了乙状结肠激活函数的梯度的问题。然而,随着不断更新的培训,重量不能继续被更新,被称为“神经元死亡的现象。“另一方面,ReLU大于0的输出,即神经网络的输出偏移量。使用漏ReLU可以解决上述问题。破ReLU激活函数公式如下: 在哪里一个设置为0.1;一个在漏水的ReLU是固定和ReLU不是固定的。

3.5。LIDI-IDRI

LIDC-IDRI本文中使用的数据库,其中包含244527张图片的1010例病例。每个主题包括临床胸CT扫描的图片和一个相关的XML文件,记录一个两阶段的结果图像注释过程由四个胸有经验的放射科医生(13]。厚度的分布在肺结节的CT图像是广泛的。他们中的大多数都集中在1毫米,1.25毫米和2.5毫米。病人的肺结节的大小从3毫米到30毫米。良性结节的数量与小直径较大,和恶性结节的数量更大直径更小。但这是不确定的多数良性和恶性结节集中在5 - 10毫米的范围内。

在这篇文章中,位置信息和程度的恶性肿瘤病人的肺结节的XML注释文件都可以获得。在XML文件中,四个放射科医生将分析肺结节的细节。放射科医生将肺结节的恶性程度分为五类:(1)极不可能的癌症(2)适度可能为癌症(3)不确定的可能性(4)适度可疑为癌症(5)高度怀疑为癌症。

前两类是确定为良性的。后两类被确定为恶性。总共9106结节性图像。

3.6。数据增加

众所周知,肺结节的大小是不同的。为了获得的结构和大小特征肺结节,肺结节的大小设置为28×28均匀。首先,肺结节的形象是通过二进制处理,可获得近似肺结节的轮廓。然后,肺结节的价值进行恢复的图像像素的肺结节。最后,可以消除噪声干扰周围肺结节。原始图像和二进制图像对比图5。

(一)

(b)

大量的正样本和负样本需要满足神经网络训练。摘要翻译的图像处理操作,旋转,翻转是获得图像被输入到神经网络之前,这增加了样本数据的输入图像。大量的样本数据可以有效地提高神经网络的训练和测试精度,减少损失函数,并最终提高神经网络的鲁棒性。

4所示。实验和结果

4.1。实验设置

咖啡是一种深度学习框架由表达式,速度,和模块化是用于这项研究。共有4581张图片的肺结节被用于训练。其中,2265例良性肺结节,另一个是与2311年恶性肺结节图像。10%的训练数据集用于交叉验证,大约448的照片。相同的数据集应用于三种不同的网络架构。

以下4.4.1。美国有线电视新闻网的建设

使用网络在训练阶段,CNN学习速率设置为0.01和batch_size 32,得到最好的结果。在网络中,卷积操作和下采样操作两次进行。两个卷积层由32个过滤器,和内核大小是5。池层内核大小为2。使用一层辍学的原因是防止过度拟合。两个完全连接层至少和一个softmax函数。

4.1.2。建设款

款由一个完全连接层。输入图像是一个二维数据输入28×28神经网络映射到784×1。第二层是一个完全连接层512×1。第三层是一个完全连接的256×1层。第三层后,会有一层辍学,一个参数为0.6,单位将隐藏在40%。第四层是一层完全连接的64×1的激活函数将ReLU。

4.1.3。SAE的建设

SAE也是由一个完全连接层。autoencoder神经元的输入和输出是相同的;autoencoder相当于以下功能: 在哪里w和b分别是重量和偏执,在神经网络操作和吗x是输入参数。神经网络等价于编码的输入图像。由于图像分类的问题,产生的隐层self-encoder直接用于分类,从而取消解码self-encoder的一部分。

在培训期间,encoder-generated堆栈使用编码首先,然后叠加编码的编码部分网络用于应用神经网络初始化一定数量的训练后的分类。在图6,形象之间的对比autoencoder产生的肺结节图像和原始图像。发现后的图像编码器使图像的边缘和工件的特征并不明显。分类精度会造成一些损失。SAE的细节表3。


层	类型	输入	输出

1	输入	28××28日1	784×1
2	完全连接	784×1	256×1
3	完全连接	256×1	64×1
4	完全连接	64×1	2×1
5	Softmax	2×1	结果

4.2。结果和分析

所表4CNN架构有最好的精度,精度为84.15%,敏感性为83.96%,特异性为84.32%。款的准确性为82.37%,敏感性为80.66%,特异性为83.9%。卷积神经网络获得好成绩主要是因为卷积层操作可能获得形状和纹理特征的两个不同的维度。卷积在不同的内核根据不同的权重不同的图像特征,卷积内核共享参数在整个生产过程中卷积,所以卷积操作相比完全连接操作更少的参数。与SAE相比,款在精度和灵敏度不是很好,但它有一个更好的特异性为83.9%。好的特异性意味着更多的恶性结节可以发现在相同的数据集,这可能是一个更大的帮助早期诊断肺结节。但在某种程度上,款增加假阳性肺结节的数量。SAE和款组成的完全连接网络,但是有不同的发电方式。SAE以来通过稀疏编码器生成培训;款是直接通过完全连接层生成的自培训。


模型	精度	灵敏度	特异性

美国有线电视新闻网	84.15%	83.96%	84.32%
款	82.37%	80.66%	83.9%
SAE	82.59%	83.96%	81.35%

为了比较神经网络的性能,使用ROC曲线。图7是中华民国曲线的比较三种不同的神经网络结构,从中我们可以看到,美国有线电视新闻网的性能优于SAE。CNN AUC是0.916,SAE是0.884,和0.877款。

表5显示了一些相关的工作和结果比较。为了增加可比性,本文的实验是在相同的数据集,以及比较相同的参数。相比之下,实验数据和结果的CNN架构已经取得了一些进展。


工作	数据库(样本)	精度(%)	灵敏度(%)	特异性(%)

Nascimento et al。21]	LIDC (73)	92.78	85.64	97.89
奥罗斯科和Villegas22]	NBIA-ELCAP (113)	N /一个	96.15	52.17
克鲁et al。7]	LIDC-IDRI (33)	90.91	85.71	94.74
Dandil et al。23]	私人(128)	90.63	92.30	89.47
Parveen和Kavitha24]	私人(3278)	N /一个	91.38	89.56
Kuruvilla Gunavathi, 20146]	LIDC (110)	93.30	91.40	One hundred.
古普塔和女子25]	私人(120)	90年	86.66	93.33
华et al。10]	LIDC (2545)	N /一个	73.30	78.70
Kumar et al。8]	LIDC (4323)	75.01	83.35	N /一个
da Silva (26]	LIDC-IDRI (8296)	82.3	79.4	83.8
美国有线电视新闻网(摘要)	LIDC-IDRI (5024)	84.15%	83.96%	84.32%
款(摘要)	LIDC-IDRI (5024)	82.37%	80.66%	83.9%
SAE(摘要)	LIDC-IDRI (5024)	82.59%	83.96%	81.35%

5。结论

在这篇文章中,三个重要的深层神经网络被利用和广泛评估。预测在良性和恶性肺结节的分类在LIDC-IDRI相比。实验结果表明,CNN存档最佳的性能比和SAE款。摘要神经网络层的相对较小,由于数据的局限性。该方法可以提高其他数据库的准确性。该方法可以推广到其他医学成像任务设计高性能的CAD系统。

的利益冲突

作者宣称没有利益冲突。

确认

本研究工作部分由天津高等学校科技发展基金(20130806)和中国国家自然科学基金青年科学基金项目(61403276)。

引用

肺癌的关键统计数据,https://www.cancer.org/cancer/non-small-cell-lung-cancer/about/key-statistics.html。
交流的社会,癌症的事实和数字,2015,http://www.cancer.org/acs/groups/content/@editorial /文件/文档/ acspc - 044552. - pdf。
i r·瓦伦特p·c·科尔特斯e·c·否决权j·m·苏亚雷斯诉h·德·阿尔布开克,和j·m·塔瓦雷斯”在CT图像自动3 d肺结节检测:一项调查,“计算机在生物医学方法和项目,卷124,不。1,第107 - 91页,2016。视图:谷歌学术搜索
a . el - baz g . m . Beache g . Gimel 'farb et al .,“肺癌计算机辅助诊断系统:挑战和方法评论文章,“国际生物医学成像杂志》上942353卷,2013篇文章ID, 46页,2013。视图:谷歌学术搜索
h·陈和w·吴。夏,j·杜·m·杨,b .妈,“肺结节使用神经网络集成的分类”,神经网络的进步施普林格,桂林,中国,2011。视图:出版商的网站|谷歌学术搜索
j . Kuruvilla和k . Gunavathi肺癌CT图像,使用神经网络分类”计算机在生物医学方法和项目,卷113,不。1,第209 - 202页,2014。视图:出版商的网站|谷歌学术搜索
h·克鲁,盖革,l·o·霍尔et al .,“纹理特性的影响在低剂量ct肺结节计算机辅助诊断,”《IEEE国际会议系统,人,和控制论(SMC), 2013IEEE,页3887 - 3891年,曼彻斯特,英国,2013年。视图:谷歌学术搜索
d·库马尔a . Wong和d . a . Clausi“肺结节的分类使用深特性在CT图像,”12日会议上电脑和机器人视觉(CRV)IEEE,页133 - 138年,2015年。视图:出版商的网站|谷歌学术搜索
g·e·辛顿、美国Osindero和y w·格兰”快速学习算法深度信念网”,神经计算,18卷,不。7,1527 - 1554年,2006页。视图:出版商的网站|谷歌学术搜索
k·l·华c·h·许s . c . Hidayati w·h·陈,陈和y . j .,“肺结节计算机辅助分类通过深度学习技术在计算机断层扫描图像,”OncoTargets和治疗,8卷,第2022 - 2015页,2014年。视图:谷歌学术搜索
w·沈m .周f·杨,c·杨和j .田”为肺结节的分类、多尺度卷积神经网络”24日学报》国际会议在医学影像信息处理,第599 - 588页,2015年。视图:谷歌学术搜索
h·r·h·c·Shin罗斯,m高et al .,“深卷积神经网络计算机辅助检测:CNN架构,数据集特征和转移学习,”IEEE医学成像,35卷,不。5,1285 - 1298年,2016页。视图:出版商的网站|谷歌学术搜索
LIDC-IDRI,https://wiki.cancerimagingarchive.net/display/Public/LIDC-IDRI。
m·布朗和s . s . Ghidary“卷积神经网络图像处理:应用在机器人视觉”2003年人工智能:先进的人工智能,第652 - 641页,2003年。视图:谷歌学术搜索
y LeCun (k . Kavukcuoglu, c . Farabet“卷积网络和应用远景,”学报2010年IEEE国际研讨会上电路与系统(ISCAS)IEEE,页253 - 256年,2010年。视图:谷歌学术搜索
a . Krizhevsky i Sutskever, g·e·辛顿“Imagenet分类与深卷积神经网络,”先进的神经信息处理系统,第1105 - 1097页,2012年。视图:谷歌学术搜索
r . Girshick j·多纳休、t·达雷尔和j·马利克,“丰富的特性准确的对象层次结构检测和语义分割”《IEEE计算机视觉与模式识别会议,第587 - 580页,2014年。视图:出版商的网站|谷歌学术搜索
n .斯利瓦斯塔瓦辛顿,a . Krizhevsky Sutskever,和r . Salakhutdinov”辍学:一个简单的方法来防止神经网络拟合,“机器学习研究杂志》上,15卷,不。1,第1958 - 1929页,2014。视图:谷歌学术搜索
·文森特·h·Larochelle Lajoie, y Bengio,和p . a . Manzagol“堆叠去噪autoencoders:学习有用的表征在深层网络进行局部去噪标准,“机器学习研究杂志》上11卷,第3408 - 3371页,2010年。视图:谷歌学术搜索
y, e . Shelhamer j·多纳休et al .,“咖啡:快速卷积架构功能嵌入”22日ACM国际会议多媒体学报》上,ACM, 2014。视图:出版商的网站|谷歌学术搜索
a·c·l·b·Nascimento de Paiva, a·c·席尔瓦“肺结节CT图像的分类利用香农和辛普森多样性指数和支持向量机,”机器学习在模式识别和数据挖掘,第466 - 454页,2012年。视图:出版商的网站|谷歌学术搜索
h·m·奥罗斯科和o . o . v . Villegas”,肺结节在胸腔CT图像,采用支持向量机分类”12日墨西哥人工智能国际会议IEEE,页277 - 283年,2013年。视图:谷歌学术搜索
e . Dandıl m . Cakiroğlu z Ekşi, m . Ozkan O。k·库尔特,亚美尼亚,“人工神经网络分类系统对肺结节计算机断层扫描,”第六届国际会议的软计算和模式识别(soCPar)IEEE,页382 - 386年,2014年。视图:谷歌学术搜索
Parveen和c . Kavitha”肺癌结节使用SVM分类内核。”国际期刊的计算机应用程序,卷95,p . 2014。视图:谷歌学术搜索
b·古普塔和美国女子肺癌检测利用曲波变换和神经网络,”国际期刊的计算机应用程序,卷86,p . 2014。视图:谷歌学术搜索
g·l·f·达席尔瓦a·c·席尔瓦a . c . de Paiva和m . Gattass恶性肿瘤肺结节的CT图像分类使用卷积神经网络。视图:出版商的网站

医疗保健工程