文摘

本文提出了一种新颖的肺结节为低剂量CT图像分类方法。该方法包括两个阶段。首先,当地不同模式(LDP)是代表提出了编码特性,即通过比较提取强度差异在圆形区域集中在肺结节。然后,单中心训练分类器是基于自民党。由于分布不同的类的多样性特征,训练图像进一步聚集成多核和多中心构造分类器。这两个分类器相结合做出最后的决定。在公共数据集实验结果显示自民党和组合分类器的性能优越。

1。介绍

肺癌是世界范围内最常见的疾病之一,是造成156万人死亡的2012年(1]。总的来说,16.8%的美国人被诊断为肺癌诊断后存活5年,而发展中国家平均的结果更糟糕(2]。显示,使用低剂量计算机断层扫描(CT)的早期检测可以显著降低肺癌的死亡率3]。因此,因此,迫切渴望有肺结节CT图像分析在一个高效和方便的方式。

通常,肺结节的特征是它的明亮的外观与周边地区相比。通常,肺结节可以分为四种不同类型根据它们的相对位置与邻居肺结构(4]。这里(A)、(B) (C)和(D)是用来表示肺结节的四种类型:(一)真皮及结节:没有任何连接到其他肺结构(B)Juxtavascular结节:不确定连接周围的血管(C)Pleural-tail结节:薄结节和胸膜之间的联系(D)Juxtapleural结节:一个大比例的结节和胸膜之间的联系

示威活动的四种类型的肺结节图像数据所示1(一)- - - - - -1 (d),分别。根瘤形态的分析是一个关键步骤的评估结节恶性肿瘤(5]。传统上,这项工作是由专家手工完成的。强烈影响到他的能力和状态,效率是不可避免地削弱了其耗时。因此,使用计算机视觉技术自动肺结节类型分类是必要的,为医生提供补充医疗。这项工作的目的是自动分类肺结节CT图像补丁与高性能四种类型。

一般来说,医学图像分类包含两个主要步骤: 特征提取和表示 分类器结构。在第一阶段,医学图像表达与高维特征向量,表示纹理、颜色、方向,等等。在第二阶段,监管或基于无监督学习方法用于构造分类器标记的训练数据集。作为一个热点研究领域,已经有很多研究肺节点上图像分类。Ciompi等人专注于设计一个样品强度的概要文件描述符以及循环模式(5),然后由傅里叶变换频谱计算。频谱是集群形成的库,和袋频率用于构造特征向量。歌等人使用提出能量方法标签的背景和前景6]。肺结节的位置获得的其他结构,这信息是用于构造特征向量。法拉克等人第一次筛选描述符,应用主成分分析和LDA用于降维。然后,一个采用Daugman虹膜识别算法实现复杂伽柏获得响应(7]。张等人第一次使用传统的监督学习方法构建一个两偶图(8]。测试图像和训练图像之间的关系是用来构造分数排名分数和贡献,并得到最终的分类结果。雅各布斯等人提出一个segmented-based方法(9]。它描述了结节为固体,part-solid和非纯,然后一个监督学习方法实现。另一种方法、形状特征,如平滑和不规则的结节是用于构造特征表示10]。Samala等人nine-feature描述符用于肺结节表示由放射科医生经常使用(11]。劳使用筛选表示结节的特征特性,然后LDA用于构造分类器(12]。Maldonado等人提出了一个方法,结节补丁集群构造特征字典,然后测试小结体素标记(13]。歌等人第一次集中图像稀疏表示基于光谱分析,形成和测试图像稀疏表示。最后,构造分类器融合的方法(14]。张等人使用监督学习方法找到四个概率值,属于每种类型(15]。然后,一个重达集团渗流方法实现发现肺结节的重叠,属于不同的类型。

有许多关于肺结节图像分类方法。然而,医学图像的复杂结构导致分类高组内方差和高阶级之间的相似性。因此,医学图像自动分类仍然是一个具有挑战性的问题。大部分的现有方法采用通用特性表示这是常用的在计算机视觉领域。这些方法缺乏专业分析的纹理和形状肺结节。另一方面,使用一个分类器方案,基于监督或无监督是否可能没有很好地与肺结节的分类。面对上述问题,本文提出了一种新颖的肺结节表示和图像分类方法。如图2训练阶段学习分类模型,该模型用于图像分类的测试阶段。在特征提取步骤中,当地的小说特征差异模式(简称自民党)设计基于灰度的肺结节和邻国之间的区别。自民党表示更加专业和全面。分类器的步骤施工、单中心使用监督学习分类器首先构造和自民党特性表示。在下一步中,标记图像聚集成多个中心使用非监督学习方法。然后构建了基于多分类器的基础测试图像之间的相似性和多个中心。这两个分类器相结合构建最终的分类器。在测试阶段,图像表示为相同的方案在训练阶段,分类结果可以得到最终的分类器。论文的主要贡献如下:(我)首先,根据肺结节的特点的分析和相应的组织的分布,一种新颖的功能表示,自民党提议。新功能适合反映不同类型的肺结节的特色。(2)第二,生成模型和歧视模型用于构造单中心和多中心的分类器。这两个分类器相辅相成,使分类更健壮。

本文的结构组织如下。当地部分中给出了不同模式2。分类器构造节中给出3。实验结果部分所示4。部分5本文总结道。

2。当地的不同模式

如图1不同类型的肺结节可以表现为各种特性,而结节本身的大小和灰度变化有一定距离。因此,本文提取的特征反映了灰度差异结节和邻近地区。

本文提出了当地不同模式(LDP)来描述肺结节图像的局部特征。如数据所示3(一个)- - - - - -3 (d)提供四种类型的肺结节图像,每个有三个同心圆的结节中心圆。自民党根据同心圆圈区域提取。图3 (e)给出了用于特征提取的次区域分区的详细信息。中心圆来标示C和出层根据四象限分为四个部分。 相应区域的平均灰度,上标在哪里j意味着圆的数量和下标 意味着象限的数量。

此外,最重要的一个目标是当地的旋转不变的特性。在自民党提取之前,应该做一些调整原始图像补丁。借助于设计模式从其他地方特性,也就是说,筛选,冲浪等等16),肺结节图像计算的主要方向,然后自民党可以在旋转的图像中提取的主要方向,如图4。肺结节图像收集相同的分辨率,所以功能的规模不能被认为是在这里。

根据上面的描述,自民党定义如下:

所示(1), 意味着肺结节图像的特征向量 ,这是由多维数据。 表示灰度差异中心和离群值。 表示灰度区别在不同的象限1日和2日圈。 邻居象限表示灰度区别一个同心圆圈内逆时针方向。完全,29-dimensional特征向量用于表示自民党。

3所示。分类器构造

在本节中,单中心分类器和多中心构造分类器,分别,一个结合是进一步建立。插图给出详细如下。

3.1。单中心分类器

鉴于标记图像数据集,自民党特性是首先为每个训练肺结节图像提取,然后直接使用监督学习方法。这里,采用线性SVM构造分类器模型,它被称为单中心分类器 。分类器 输出一个图像的可能性属于每种类型的肺结节。

3.2。多分类器

肺结节图像是不容易分类存在大型组合方差和高阶级之间的相似性。由于多个分布多样性的自然形象,一个监督分类器可能是不足以吸引一个类的不同表示的数据。因此,本文应用一个步骤的算法。通过与64维的特征向量实现集群每个训练图像的浏览,图片相同的类标签进一步聚集形成一些中心,它可以表示如下: 在哪里上标 意味着类标和下标 在一个类表示multiclusters。 表示中心的数量。给定一个图像进行测试,其概率属于四种类型的肺结节可以计算如下:

所示(3), 在课堂上表示训练图像的数量 这属于 中心。 在课堂上表示训练图像的数量 表示频率的中心 在课堂上 。给定一个测试图像X,让 中心的四个肺结节类型;然后,(4)和(5)可用于构建多中心的分类器 ,这使概率的值 属于四种类型,分别为:

所示(6),单中心分类器和多分类器组合得到最终的分类器 ,在那里 是加权参数。

4所示。实验评价

4.1。数据集和程序实现

在本节中,可用的公共数据集用于实验评价(17]。数据集包含379个肺结节图像中心位置的结节注释,这是由50个不同的肺CT扫描。肺结节分为四种类型根据指令由一个专家。

肺结节图像从原始CT图像裁剪根据结节中心的位置。最初的CT图像的分辨率为512像素 512像素,补丁太小裁剪的图像实现计算机视觉算法。因此,裁剪图像进一步插入160像素 160像素的双三次的方法。所有的程序都使用2012 Matlab编程语言实现和测试2.4奔腾双核CPU, 2 G内存的电脑。

4.2。参数设置

, , 表示三个同心圆的大小,以及分类器的重量 并在每个类multiclusters的数量 与全面的测试评估。如表所示1的选择范围 20-45像素,步骤5像素,可以选择的范围 是70 - 95像素,步骤5像素,可以选择的范围 是100 - 125像素,步骤5像素,可以选择的范围 0.3 - -0.8,0.1的步骤,和选择范围的 3 - 7,步骤1。所以有6480 ( )的组合参数设置。完成测试后, , , 三个同心圆的半径,与35像素90像素,分别为105像素。组合分类器的重量 被指派为0.6。multiclusters在每个类的数量 是设置为5。这组参数给出了分类率最高。

4.3。训练数据集的比例和分类速度

训练数据集的比例可能影响分类的算法。在本节内,训练数据集随机选择的比例从10%提高到90%,5%的一步,其余用于测试。执行测试很多次,平均分类率计算。

5给出了演示的比例的训练数据集和分类速度。从图可以看出,提出的分类率作为训练数据集的比例增加。这意味着更多的训练数据可以包含更多的信息,和多样性可以获得更好的数据表示,因此性能增强。与此同时,当比例超过某个值的分类率趋于稳定。

4.4。平均分类率

为了评价不同方法之间的分类率比较,5算法用于测试,是由各种特征表示和分类器。分类率的平均值不同训练数据集。图6给出了比较结果。结果显示,自民党+ SVM性能高于筛选+资讯和筛选+支持向量机,这意味着自民党设计本文包含更多的有用的信息代表当地的特色。在所有五个算法,该方法展示了最好的性能。

4.5。中华民国测试

ROC曲线是常规工具说明分类器系统的性能,以及曲线可以通过策划真阳性率对假阳性(TPR)率(玻璃钢)不同阈值设置的歧视。最近的一些算法选择与我们提出的一个(8,9),结果在图7。它可以清楚的看到从证明该方法具有优越的ROC曲线特征。

5。结论

本文提出了肺结节图像分类的方法。首先,小说当地特性表示,当地不同模式,设计,可以捕捉更多的信息从肺结节和邻近地区。和一个单中心根据自民党和SVM分类器构造。然后,多分类器设计的集群肺结节图像的浏览功能和计算测试图像之间的相似性和多个中心。最后,这两个分类器相结合来实现分类。该方法旨在提取更多的有用的功能和降低高组内方差和高相似性阶级之间的差距。在公共数据集评估显示,我们的方法优于其他肺结节图像分类的方法。我们未来的工作将集中在设计更准确的特性为肺结节图像表示方法,如autoencoder和卷积神经网络。

相互竞争的利益

作者宣称没有利益冲突有关的出版。