文摘

我们应用和优化稀疏表示(SR)方法在计算机辅助诊断(CAD)对正常组织进行分类和五种弥漫性肺部疾病(DLD)模式:整合、毛玻璃样阴影,形成蜂窝状,肺气肿,结节。通过使用K-SVD基于奇异值分解(计算)和正交匹配追踪(OMP),可以达到满意的识别率,但是太多的时间都花在了实验。减少运行时的方法,k - means算法代替K-SVD, OMP是简化搜索所需的原子(OMP1)。我们提出了三种基于SR方法评估:SR1 (K-SVD + OMP) SR2 (k - means +经济),SR3 (k - means +经济新闻1)。1161卷的利益(看到)被用来优化参数和训练每个方法,和1049看到了评价方法的性能。基于SR方法是强大的识别DLD的模式(SR2 SR1: 96.1%: 95.6%, SR3: 96.4%)和显著优于基准方法。此外,当k - means和OMP1基于SR方法的应用,运行时可以降低98.2%和55.2%,分别。因此,我们认为该方法使用k - means和OMP1(SR3)是高效的CAD dld。

1。介绍

弥漫性肺部疾病(dld)是指一系列的异常,分散在大面积肺1]。随着医学成像技术的发展,目前高分辨率计算机断层扫描(HRCT)被认为是最好的工具来诊断dld,因为肺HRCT图像上可以准确地分析模式(2- - - - - -4]。然而,DLD的解释模式主要取决于放射科医生的个人经验。据报道,放射科医生之间的协议的第一选择只有温和的(5]。所以,放射科医生的主观差异可能导致误诊。此外,HRCT在每个扫描,产生大量的轴向片放射科医生,是一个很大的负担。考虑上述原因,计算机辅助诊断(CAD)方法是需要提供“第二意见”的放射科医生的诊断dld (6- - - - - -8]。

在过去的十年里,研究人员提出了几种CAD系统分类DLD的模式,也是最传统的方法旨在开发的区别的特征分类。例如,公园等人采用了统计直方图和灰度行程长度矩阵的时刻(GLRLM)代表了肺的结构信息模式(9]。王等人认为GLRLM可以划分为四个区域有明确的物理意义,可用于测量肺纹理(10]。虽然基于结构信息的特征有性能优良的分类DLD的模式,这些特性仍难以认识到肺与非均匀纹理模式。因此,研究人员结合了texture-based措施设计特征的几何信息与更高的辨别力。在这项研究中(11),肺的模式是由六种物理特征,三个基于CT值(平均值和标准偏差的CT值,空气密度组件)和三个基于几何信息(结节性组件,组件,和多腔的组件)。Uppaluri等人采用了纹理特性和几何分形维数(GFD)对肺的模式进行分类,GFD被用来测量粗糙度的纹理(12]。在工作(13),这些措施基于直方图,梯度,灰度同现矩阵应用灰度共生矩阵建立(),和GLRLM被用于纹理分析,措施基于低衰减的上流社会的转型和集群地区被用来分析的形状信息。此外,局部二值模式(LBP)是用来定量测量正常组织和肺气肿的两个亚型14]。

本文介绍了稀疏表示方法识别DLD的模式。稀疏表示的主要思想是近似的例子少数关键特性的加权线性组合(原子),这是选择从一个overcomplete字典。人们认为图像的稀疏表示可以提高性能的分类(15- - - - - -17]。首先,图像可以被视为一个分布的一组代表性的特性,因此,稀疏表示可以编码图像的语义信息。其次,字典的原子数量大于输入的维数的例子,这意味着近似的并不是唯一的例子。所以,能找到一个相对更好的近似原子的各种组合中。第三,显示了稀疏表示是强劲的噪音。由于这些优势,稀疏表示方法最近已被应用于CAD。例如,刘等人开发了一种基于稀疏表示的方法来检测结肠息肉和肺结节(18]。签证官和Sowmya训练有识别力的字典分类四种肺模式(19]。在工作(20.texton],字典是学习和用于识别正常组织和三个亚型的肺气肿。

在这项工作中,采用两个最受欢迎的算法,基于奇异值分解(圣)K-SVD算法(21)和正交匹配追踪(OMP),我们提出了一种基于稀疏表示的分类方法正常组织(也)和五种DLD的模式,包括整合”(体质)、“毛玻璃样阴影(GGO)蜂窝(HCM)肺气肿(EMP),结节(点头)。图1给出了六种肺的图像模式。据我们所知,没有工作,旨在应用稀疏表示方法分析这六种肺模式。该方法使用K-SVD和OMP实现了分类精度高(大于95%)在实验中,它被认为是放射科医生的巨大潜力。然而,该方法的运行时相对较长。因此,我们也试图减少运行时基于稀疏表示的方法。考虑到K-SVD的操作和OMP花了最多的时间在训练和测试,分别时,我们采用k - means取代K-SVD和使用一个简单的版本的OMP指定OMP1在报纸上。实验结果表明,该更换K-SVD和OMP k - means和OMP1可以减少运行时方法的同时保持分类精度。

有两个主要的差异对这项工作的初步版本(23]。首先,我们不仅采用了稀疏表示方法的分类也优化字典学习和稀疏编码工作。其次,我们改变了实验数据进行训练和测试样本的数量大约相等。本文组织如下。节2,我们将描述该方法。给出了实验结果和讨论部分3。最后,我们总结论文部分4

2。提出的方法

在这个研究中,我们采用了和优化的稀疏表示的分类方法正常组织和五种DLD的模式在HRCT图像。图2给了我们方法的框架。在训练阶段,首先大量的局部特性提取感兴趣的训练卷(看到)和用于火车overcomplete字典。其次,地方特色的稀疏表示计算根据给定的字典,和培训的VOI-level描述符看到生成的程序命名空间池。最后,描述符被用来训练支持向量机(SVM)分类器。提取后的测试阶段,测试VOI的地方特色,采用学习字典的稀疏表示计算局部特性,然后VOI-level描述符生成。最后,描述符被送入分类器训练结果。为了容易理解,我们引入稀疏表示及其优化,然后我们描述我们的方法的其他部分。

2.1。稀疏表示

例子和规范化overcomplete字典 , , , 分别的稀疏表示 例子 可以制定 在哪里 意味着 规范表示的稀疏向量(非零向量中的条目的数量),和 稀疏的门槛。它可以发现 可以认为原子的系数。有两个主要组件的操作:(1)训练一个overcomplete字典 (字典学习);(2)计算输入的稀疏表示的例子 根据一个给定的字典(稀疏编码)。

采用K-SVD和OMP字典学习和稀疏编码,分别时,我们提出了一个方法,被称为SR1。K-SVD训练字典,或者更新系数固定字典(稀疏编码阶段),然后更新字典的固定系数(字典更新阶段),直到停止条件被满足。(1)在稀疏编码阶段,推荐使用OMP,贪婪的技术(21]。一开始,支持的解决方案是空的,一个初始残余向量由输入评估的例子。在每个迭代中,最大的原子与残余向量内积是添加到支持。的稀疏近似计算的例子是根据支持,和残余被更新。这些过程是重复直到原子的数量大于阈值稀疏的支持。(2)在字典里更新阶段,列的D(字典)的原子更新的顺序。当 th原子被更新,重建矩阵除了当前原子被选择的例子限制重建通过使用当前原子,然后分解的圣言。采用第一个左奇异向量更新原子。训练后的字典K-SVD, SR1也用OMP计算局部特征的稀疏表示,一样的K-SVD稀疏编码阶段。稀疏表示有两个参数,原子的数目和稀疏近似。我们调整原子的数量从500年到3000年的500年间隔和稀疏从2到14的间隔2的实验。我们提出的优化参数部分3.2

2.2。优化的稀疏表示

运行时的CAD方法在临床实践中也是一个重要的标准。使用K-SVD SR1和OMP(见部分2.1)可以达到较高的分类精度,但运行时的SR1相对较长(见部分3.3)。考虑到学习和稀疏编码字典花了最多的时间在训练和测试,分别,我们研究的另一个目的是优化这两个步骤。

虽然在临床工作流可能是无用的,我们认为字典学习的优化开发人员可以方便地更新现有的方法。据报道,k - means算法可以实现竞争表现自然图像分类与K-SVD当使用相同数量的原子(24]。此外,k - means可以被视为一个简单版本的K-SVD。在字典更新阶段,平均操作和计算采用原子更新的k - means K-SVD,分别。在稀疏编码阶段,k - means将最接近原子的系数设置为1(其他系数的值0),而复杂的K-SVD OMP算法被采用。它可以推断,k - means需要较短的运行时比K-SVD训练字典。此外,可以有效地实现通过使用k - means 维树( - d树)技术。由于上述原因,我们试图采用的k - means替代K-SVD训练字典。

SR1, OMP采用的求解稀疏编码、稀疏逼近的迭代计算的例子,和只有一个原子被添加到支持在每个迭代。它可以推断方法的运行时可能会减少通过选择足够的原子。所以,这种方法被命名为OMP1在报纸上。之后安排的内部产品在降序排列原子和例子,第一个足够数量的原子被视为解决方案支持,然后用于计算的稀疏表示的例子。算法1给出了OMP1。尽管OMP残留误差的1将大于OMP,这种方法的性能可以保证在一定的稀疏约束(25]。

输入例子: 和规范化的字典 ,
输出:这个例子向量的稀疏表示
初始化:
最初的解决方案支持 和稀疏约束
计算:
(1)选择 原子内部产品最大的例子
(2)选择原子添加到解决方案的支持
(3)计算输入的稀疏表示的例子

为了检查稀疏表示方法的性能,我们构造另一个两个基于稀疏表示的方法:SR2 (k - means + OMP)和SR3 (k - means +经济新闻1在这项工作。更换K-SVD的k - means是评估通过对比SR1和SR2(这两种方法都采用了OMP稀疏编码),和OMP OMP的替换1评估通过比较SR2和SR3(这两种方法都采用了k - means字典学习)。表1总结了三种基于稀疏表示的方法和稀疏表示的实验评价方法。

2.3。计算的地方特色

人们认为DLD的模式可以通过CT值和特色措施基于几何信息。在这项工作中,我们使用当地的特性提出了工作(26),采用海赛矩阵的特征值来测量几何信息。地方特性计算每个采样点在VOI下列程序。首先,cubic-shape补丁是由抽样VOI的中心是位于取样点,和四种统计时刻计算在这个补丁:意思是,标准差,偏态和峰态。然后海赛矩阵的特征值计算为每个块内的体素。让特征值 , , , 。我们安排的特征值的顺序位置。所以,三个新补丁的组件构成 , , 分别计算同一时刻基于这三个特征值的补丁。最后,时刻计算所有四个补丁集中到一个16-dimensional向量作为特征向量。在实验中,采样点设置的步骤 。和补丁的大小是一个参数,这是调整 。一节中描述的调优参数的方法3.2

2.4。空间池

空间的程序池被用来总结本地特征的稀疏表示的区域变成一个为每个VOI VOI-level描述符。这些描述符作为分类器的输入向量。我们采用了最受欢迎的选择,平均分担工作,这可能被视为平均向量的操作。让 VOI-level描述符,让 稀疏表示向量,并让 th元素的向量。的平均分担 向量是由

2.5。分类

在这项研究中,我们采用了支持向量机(SVM)分类器识别的描述符生成空间池。我们使用一个叫LIBSVM的版本(27]。据报道,基于稀疏表示的分类与线性内核可以实现竞争比非线性内核(性能和较小的计算成本16]。所以,我们采用LIBSVM的线性内核。内核是由 在哪里 都是描述符。因为SVM最初设计为二进制(两级)分类器,采用LIBSVM one-against-one技术扩展二进制的多类SVM分类器的任务。有一个分类器参数:soft-margin点球 。调整参数的方法中描述的部分3.2

3所示。实验和结果

3.1。数据

我们获得117扫描从117名受试者在日本德岛大学医院。HRCT扫描都被东芝收购Aquilion 16-row多层螺旋CT edge-enhanced过滤时不应用。管电压120千伏峰值电流250马斯。扫描的分辨率 ,平面分辨率约0.6毫米。切片厚度1毫米。

看到了根据以下程序。(1)所有由放射科医生,综述了扫描和最多选择三个轴向片上面,中间,和底部的部分肺,分别在每个扫描。只有一种肺模式主要存在于每个所选片,和放射科医生应该显示什么是占主导地位的结构和它存在的地方。(2)两个放射科医生检查的结果,第一个放射科医师。只有片由放射科医生都认为是正确的选择。(3)肺的区域模式对所选片的所有三个放射科医生,分别和共同的区域选择的放射科医生得救了。(4)网格的大小 覆盖在片,方形补丁了,地区的放射科医生应该超过70%区域的补丁。(6)看到的大小 被建造。这些补丁被视为看到的中轴切片。

3.2。实验设置

在实验中,我们将看到分成两个独立集。采用一组(1161看到)作为训练集优化参数的方法,然后训练方法和最优参数。另一组(1049看到)是用作测试评价方法的性能。没有两个集合之间的交叉学科。看到的数量的每种类型的模式训练和测试总结表2。手术方法与2.8 GHz Intel Core i7服务器CPU和24 GB RAM。

有四种参数提出了方法:cube-shape补丁的大小,数量的原子,稀疏表示的稀疏,相关参数分类器。我们调的块大小的值 的步骤 ,原子的数量从500年到3000年500年的间隔,和稀疏从2到14的间隔2。支持向量机分类器的参数设置 。这些参数同时进行优化训练集上的20倍交叉验证测试。参数的组合,达到最好的整体精度交叉验证测试被选为最优参数。在交叉验证提出方法的结果在图3。图3(一个)显示,当块大小近一步的采样点( ),总体精度接近最大值。图3 (b)说明了原子的数量的提高可以提高性能的方法。图3 (c)表明,随着稀疏的的整体精度SR1和SR2仍然存在,但SR3被降低了。

3.3。三种基本方法

我们提出的方法相比发表的三种最先进的技术,也被称为自卫队(11],CSE [28),和弓29日),分别。基线的参数优化方法相同的方式提出了方法。(1)在工作(11),肺的模式是由六种特殊设计的特性。所以,这种方法被称为自卫队。这六个特征是CT值的平均值和标准偏差,空气密度组件,结节性组件,组件,和多腔的组件。三层人工神经网络(ANN)的反向传播算法采用分类器。在工作(11安),隐藏单位的数量是根据经验设置为10。我们调整隐藏单位的数量从5到30的间隔5的实验。因为2 d感兴趣的区域(roi)所需的自卫队,我们使用中央片的轴向方向看到的roi实验。(2)在工作(28),VOI的签名是用于分类。签名被定义为集群的质心和权重(集群)的体素,和k - means算法用来计算集群的重心。为了降低计算成本,规范为每个类生成签名相结合和重新集群训练数据的签名。挖土机的距离(EMD)方法被采用来测量两者之间的相似之处签名,和最近邻(NN)作为分类器。分类,看到被公认的比较规范的看到签名的签名。因为规范的签名和挖土机的距离(EMD)使用,这种方法被称为CSE。我国只有一个参数:集群的数量。考虑到较大的值被认为是避免,我们调整集群的数量从5到60的步骤5。(3)工作(29日)采用了一个名叫“bag-of-words”的模型(也叫bag-of-features)生成VOI-level描述符,所以这种方法被称为弓。bag-of-words的主要思想是火车电码本(字典),然后使用单词的直方图(原子)电码本代表图像。这些柱状图可以作为分类器的输入向量。在实验中,采用k - means算法集群当地特色,和集群的中心保存为电码本的言语。从50到400的字数调整间隔的50。(工作中采用的地方特色29日]提出的设计方法是一样的,所以我们调整补丁大小的值 的步骤 一样的提议的方法。采用支持向量机作为分类器。考虑到 内核实现最好的结果的工作(29日),采用LIBSVM的 内核。方程( )给出了 内核, 内核和参数吗 都是直方图与 垃圾箱: soft-margin处罚的可能值 被设置为 ,分别。

3.4。实验结果

3给出了每种方法的总体精度最优参数对测试集。基于稀疏表示的方法取得更好的结果比基线方法(SR2 SR1: 96.1%: 95.6%, SR3: 96.4%自卫队:75.8%,CSE: 65.1%,弓:85.5%)。图4表明,该方法的敏感性和特异性为每个肺模式都超过90%,比基线的方法。此外,表4表明, 值的统计差异(McNemar检验法计算的测试),该方法相对于基线的方法都小于0.0001,这意味着方法之间有显著差异。

另一方面,表5拟议的方法比较了运行时的最优参数。k - means K-SVD取代时,运行时的字典学习可以减少了98.2% (SR1: 13520年代和SR2: 241年代)。当经济新闻1代替OMP,认识一个VOI的平均运行时可以减少了55.2% (SR2: 0.29年代与SR3: 0.13 s)。

3.5。讨论

实验结果表明,基于稀疏表示的分类方法有很好的性能肺的六种模式,这被认为是放射科医生的临床应用潜力巨大。此外,K-SVD的替代和OMP k - means和OMP1可以节省运行时方法的同时保持分类精度。因此,我们认为SR3采用k - means和OMP1在dld的CAD有效。

人们认为图像可以被视为一个分布的一组代表功能,所以稀疏表示可以提取重要的信息的例子,同时删除无关紧要的细节,这便于分类。虽然DLD的模式的纹理HRCT图像复杂,稀疏表示方法能够产生足够的辨别能力的描述符。因此,该方法在实验中取得了良好的结果。

然而,基于稀疏表示的方法的性能的分类GGO相对差,不住的点头。的外观GGO在HRCT图像模糊增加肺衰减(比正常肺实质的“白”,但“黑”等软组织血管)。所以,GGO会影响识别的程度。数据5(一个)5 (b)给两个例子的GGO是不是点头EMP,分别。与周围正常组织相比,看到异常程度相对较低。点头,认可的数量会受到结节状的透明。图5 (c)显示了一个示例的点头是分类错误也没有。原因可能是一些VOI结节状的透明。

CAD系统,同样重要的是,减少运行时的方法在保持分类精度。考虑到学习和稀疏编码字典花了最多的时间在训练和测试,分别,我们试图优化这两个阶段。为了减少运行时的字典学习,我们使用了k - means训练字典,这可能被视为一个简单版本的K-SVD。图6比较了SR1(使用K-SVD)和SR2(使用k - means)。它可以发现,这两种方法有类似的分类精度。此外,运行时的字典学习K-SVD近50倍只要k - means当使用相同数量的原子。这是证明了替代K-SVD的k - means可以大大减少运行时和不影响分类精度。

优化的稀疏编码,虽然认识到一个VOI的运行时在我们的实验中似乎不是很长,CAD系统将用于分析整个肺的病人在临床实践中,可以分为成千上万的看到。一小减少运行时在实验(分类个人看到)是有意义的,可以导致显著减少实践(识别整个肺的病人)。为了减少运行时的稀疏编码,我们应用一个简单版本的OMP,选择所需的数量的原子一次而不是(OMP迭代计算1)。图7比较了SR2(使用OMP)和OMP SR3(使用1当使用相同的参数。SR3的识别率是类似于SR2稀疏时小(2和4),比SR2 SR3花较短的运行时。这是证明经济的应用1高稀疏可以取得一个好的结果,减少运行时的方法。

我们提出的方法相比自卫队由于两个原因。第一个是,自卫队已经成功地应用于大多数类型的肺模式进行分类,包括正常组织和六种DLD的模式。第二个是直接从图像中提取特征作为分类器的输入向量没有“稀疏编码”的一步。不幸的是,自卫队不满意的性能实验。我们认为分类可能会影响到检测geometrical-based组件(结节性、线性和多腔的组件),仍然是一个困难的问题在CAD、尤其是严重dld的画面。

的CSE SR2和SR3略相似。首先,采用k - means算法在所有三个方法。其次,看到的签名,作为分类器的输入向量,根据当地生成功能。似乎可以作为“编码”一步,但不是稀疏编码。因此,CSE与拟议的方法用来比较。最坏的结果在实验中产生的CSE。表现不好的原因可能是天真的神经网分类器比较SVM。

bag-of-words是一个流行的图像分类的模型,和基于bag-of-words方法取得了良好的效果在前面的作品。bag-of-words模型可以被视为一个特殊版本的稀疏表示,这是用一个非常严格的约束实现稀疏。在bag-of-words,只有一个原子被用来近似这个例子中,选中的原子系数是固定在1。工作(16)认为这个约束是限制太多,所以它会产生一个巨大的重建误差。稀疏编码策略,稀疏约束放松,允许少量的原子来描述的示例。尽管更多的时间成本,稀疏编码方法可以实现良好的重建。因此,它可以保留更多的重要信息的例子,便于分类。另一方面,我们的实验中采用的实验数据是不同于以前的工作29日]。它还会影响弓的分类。表6比较的整体精度和运行时SR3和弓。船头上少花时间字典学习和认识。然而,SR3取得了更好的整体精度。图8显示了两个例子的图片也没有被正确分类的SR3但错误地认为是点头的弓。错误分类的原因可能是因为这两个看到的外观类似于点头。有许多结构与高CT值(“白”比正常肺实质)如看到船只。

4所示。结论

在本研究中,应用稀疏表示方法和优化分类的正常组织和五种DLD的模式。通过使用K-SVD和OMP,取得了满意的识别率,但花了太多时间在实验中。所以,我们试图取代K-SVD k - means和替代一个简单版本的OMP OMP,选择一个足够数量的原子(OMP1)。实验结果表明,基于稀疏表示的方法的性能明显优于基准方法(SR2 SR1: 96.1%: 95.6%, SR3: 96.4%自卫队:75.8%,CSE: 65.1%,和弓:85.5%)。此外,由k - means K-SVD取代时,字典学习的运行时降低了98.2% (SR1: 13520年代和SR2: 241年代)。当经济新闻1代替OMP,识别一个VOI的平均运行时下降了55.2% (SR2: 0.29年代与SR3: 0.13 s)。因此,我们得出结论,该方法使用k - means和OMP1(SR3)是高效的CAD dld。我们将应用SR3的临床实践在未来的研究。

利益冲突

作者宣称没有利益冲突有关的出版。

承认

这项工作是支持的下边了KAKENHI批准号。21103008和21103008。