文摘
准确的病理诊断大脑图像对病人护理很重要,尤其是在疾病的早期阶段。尽管大量研究机器学习技术用于病理大脑的计算机辅助诊断(CAD),以前的方法遇到了挑战的诊断效率由于不足的选择适当的过滤技术,神经影像生物标记,和有限的学习模型。磁共振成像(MRI)能够提供增强的信息对于软组织,因此,图像是包含在建议的方法。在这项研究中,我们提出一个新的模型,包括维纳滤波降噪、二维离散小波变换特征提取(2 d-dwt),概率主成分分析(车牌提取降维,和一个随机子空间合奏(交易所)分类器以及最近的邻居(资讯)算法作为基分类器分类病理或正常的大脑图像。拟议的方法提供一个显著改善分类结果与其他研究相比。基于 交叉验证(CV),该方法优于21最先进的算法的分类精度,灵敏度和特异性所有四个数据集用于这项研究。
1。介绍
大脑的磁共振成像(MRI)诊断提供全面的诊断信息(1]。和安全是至关重要的,因为它是容易办到,收益率更高的分辨率,不能通过其他技术。MRI诊断主要是利用不同类型的疾病,如中风,肿瘤,出血、损伤、血管疾病或感染,多发性硬化症(MS)。病态的大脑疾病的早期诊断及其前驱期是至关重要的,可以减少或阻止疾病的进展2]。因此,正常的分类/大脑病理状态从临床医学核磁共振成像是至关重要的,因为它侧重于软组织解剖和生成一个大的和详细的数据集对主题的大脑。然而,大型数据库的使用使手册解释大脑的图像乏味,耗时和昂贵的。手动方法的主要缺点是它的不可约性。因此,需要自动图像分析工具如计算机辅助诊断(CAD)系统(3]。
相当大的研究进行了开发自动化工具的分类,区分正常和病理的大脑图像。El-Dahshan et al。4)利用三级离散小波变换,在主成分分析(PCA)的陪同下,减少功能。良好的成功率得到利用前馈反向传播神经网络(摘要)和最近的邻居(资讯)。张、吴(5)推荐的应用内核支持向量机(KSVM)和提出了三个新的内核:齐次多项式,非齐次多项式,高斯径向基区分正常和异常图像。Patnaik et al。6)采用DWT获取近似系数。之后,利用支持向量机(SVM)进行分类。Zhang et al。7)推荐训练前馈神经网络(FNN)与一个独特的比例共轭梯度(SCG)技术。茶室et al。8]提出了结合小涟漪变换特征提取(RT), PCA降维,和最小二乘支持向量机(二)分类,和5×5分层交叉验证(SCV)提供了较高的分类精度。El-Dahshan et al。9)利用反馈脉冲耦合神经网络的预处理,图像,特征提取的DWT, PCA减少特性和FBPNN病理分类和正常的大脑。Damodharan和Raghavan10使用小波熵作为特征空间,然后使用传统的摘要对分类器的分类方法。王等人。11)利用平稳小波变换(SWT) DWT的替代品。同样,他们提出了一个杂交的粒子群优化(PSO)和人工蜂群(HPA)方法来获得最优模糊神经网络的权重和偏见。纳齐尔et al。12开始时应用去噪,他们实现了91.8%的总体分类精度。Harikumar和Vinoth库马尔13)使用wavelet-energy和支持向量机。莲花和Sukanesh14)使用联合小波统计特性分割和分类阿尔茨海默病(AD)以及良性和恶性肿瘤切片。Zhang et al。15]利用胡锦涛矩不变量(HMI)和广义特征值检测的近端SVM (GEPSVM)病态的大脑核磁共振扫描,获得98.89%的精度,灵敏度为99.29%,特异性为92.00%。后来,Zhang et al。16多层感知器(MLP)用于分类,两个动态修剪修剪技术(DP)和贝叶斯检测边界(BDB被用来找到最优隐藏神经元和一种自适应实数编码偏硼酸钡(ARCBBO)方法确定最优权重和实施获得98.12%和98.24%的准确性,分别。Nayak et al。17]使用2 d-dwt、PCA和学习演算法和随机森林作为基分类器,获得98.44%的准确性为大脑病理分类,图像数据集- 255。后来,Nayak et al。18]利用二维平稳小波变换(SWT),对称的不确定性排名(SUR)过滤器,和演算法与支持向量机分类器的检测大脑病理图像和先生获得了98.43%的准确性和数据集- 255。王等人。19)采用伪泽尼克时刻和线性回归分类器分类阿尔茨海默病和取得了97.51%的精度,灵敏度为96.71%,特异性为97.73%。阿拉姆et al。20.)利用dual-tree复小波变换(DTCWT),主成分分析(PCA)和双子支持向量机(TSVM)阿尔茨海默病的检测分类和获得的准确性 。
学者们提出了不同的方法来提取特征的病理大脑疾病(21]。上面的方法进行分析后,我们发现所有的方法实现了有前景的结果也表明,2 d-dwt在特征提取大脑病理检测是有效的。然而,有两个问题。(1)大多数人利用传统PCA特征提取为大型数据集computational-intensive更高的维度。(2)分类性能可以进一步改善,因为特征向量包含过多的功能,这需要更多的内存和计算复杂度的提高。此外,它需要太多的时间来训练分类器。
为了解决上述问题,我们提出了一种新的病理检测系统基于大脑图像先生已在其他潜在的改进方案。维纳滤波器用于图像的预处理。该方法使用2 d DWT的提取特征,因为它可以分析图像在不同尺度。车牌提取的PCA用于减少的特性计算的优势有效降维的潜变量的分布,最大似然估计,概率模型,处理缺失数据,结合多个PCA概率混合物。一个相对较新的分类器被称为随机子空间合奏(交易所)分类器是采用低的优势在传统分类器的计算负担。因此,该方法的新颖性在于车牌提取特性和交易所分类器的应用。
本文的组织结构如下:部分2提出了关于材料和方法的细节。部分3描述实验结果、评价步骤和讨论。最后,部分4给出了结论和未来的研究。
2。材料和方法
2.1。材料
目前,有四个基准数据集(DS) DS - 66, DS - 90, DS - 160和DS - 255,不同大小的66年,90年,160年和255年的图像,分别。所有的数据集(DS)包含轴向,先生256×256像素,t2加权图像从哈佛大学医学院下载(美国波士顿)(网址:http://www.med.harvard.edu/aablib/home.html)的网站。选为t2加权图像输入图像因为t2加权(自旋自旋)放松给更好的图像对比,有助于显示不同的解剖结构清晰。同时,他们在检测病变比T1加权图像。
我们选择5片从每个主题。健康受试者的选择标准是,,,这些片是随机选择的。病理学科的部分应该包含的病变确认这些放射科医生十年的经验。患病的切片样品图所示2。在这个调查中,所有疾病被视为病态,和我们的任务是一个二元分类问题,即区分病理大脑健康的大脑。在这里,整个大脑被认为是输入图像。我们没有选择地方特色点和边缘,我们提取全局图像特征,进一步学习新的级联模型。让我们记住,我们的程序不同于神经放射做的方式。他们通常把地方特色和比较与标准模板检查集中是否存在,如收缩、扩张、出血,和炎症。虽然我们的技术就像AlphaGO,计算机研究员给机器足够数据,然后机器就可以学习如何让自然分类。包括病人的信息(年龄、性别、构型、记忆测试、教育,等等)可以添加额外的信息,从而可以帮助我们提高分类的性能。然而,这个新模型提出了我们的研究只是依赖于成像数据。此外,图像数据从网站不包含受试者的信息。
的成本预测病理正常类型很严重,因为研究对象可能被告知她/他是正常的,因此避免了轻微的症状。治疗的患者可能会被推迟。然而,健康病理类型的错误分类的成本很低,因为正确的治疗可以由其他诊断手段。成本敏感性(CS)问题是解决初通过改变类分布状态,因为原始数据访问。这意味着我们故意拿起病态的大脑比健康的数据集,使分类器的目标有偏见的病态的大脑,解决软件问题。过度拟合的问题被交叉验证技术监督。
在我们的实验中,ds - 66和ds - 160是大脑广泛用于图像分类,包括正常的大脑图像以及异常的大脑图像从七个类型的疾病,也就是说,神经胶质瘤、脑膜瘤、阿尔茨海默氏症、阿兹海默氏症+视觉失认症病,肉瘤和亨廷顿氏舞蹈症。ds - 90包含大脑健康的形象,艾滋病痴呆、阿尔茨海默氏症+视觉失认症、阿兹海默氏症,大脑钙质沉着,脑弓形体病,克雅二氏症,神经胶质瘤,疱疹脑炎、亨廷顿氏舞蹈症,莱姆脑病,脑膜瘤、转移性癌、转移性支气管癌,运动神经元疾病,女士,选择病,肉瘤。
第三集,ds - 255,包括图像的四个新类型的嵌入与上述七种疾病病变的图像和正常的大脑图像。四个额外的疾病是慢性硬脑膜下血肿,脑弓形体病、疱疹脑炎,女士。
2.2。提出的方法
该方法包括四个重要的阶段,即图像预处理,特征提取使用2 d-dwt特性减少利用车牌提取,使用交易所分类器分类。先生为了提高质量的图像,采用维纳滤波器,紧随其后的是近似系数的提取图像利用先生2 d-dwt三级分解。然后,我们保存这些获得的特性作为我们的主要特性。之后,我们采用车牌提取获取不相关的判别的功能。最后,我们机密资讯的功能使用的比例减少分类器作为基分类器。提出了系统的完整的框图如图1。对所有这些简要描述四个阶段如下所示。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(我)
(j)
(k)
(左)
(m)
(n)
(o)
(p)
(问)
(右)
2.2.1。预处理用维纳滤波器
gif图像是单独下载来自哈佛医学院的网站。然后,每个的gif图像转换成手动JPG格式。RGB格式的图像,然后转换成灰度强度图像。接下来,强度图像转换为双精度。获得大脑图像需要进行预处理,以便提高产品质量,使我们能够获得更好的特性。在我们的研究中,我们使用了流行的维纳滤波方法。
维纳滤波器是用来取代有限脉冲响应(杉木)滤波器为了降低噪声信号(22]。当一个图像模糊,一个熟悉的低通滤波器(LPF),我们可以通过反滤波恢复图像。然而,反滤波对加性噪声非常敏感。维纳滤波实现最优之间的权衡反滤波和噪声平滑,它消除了添加剂同时噪音和反转模糊。此外,它降低了总体均方误差反滤波过程中加上噪声平滑。维纳滤波方法生成一个线性近似的原始图像和基于随机框架。正交性原理表明,维纳滤波器在傅里叶域中可以表达如下:
在这里, 是原始图像的功率谱, 自适应噪声, 是模糊滤波器。
2.3。2 d-dwt
2.3.1。利用小波变换
英国《金融时报》是最常用的信号分析工具,它将时域信号分解成组成各种频率的正弦信号,从而改变信号从时域到频域。然而,英国《金融时报》有一个严重的缺点,因为它消除了信号的时间信息。例如,一名调查员无法确定发生特定事件时基于傅里叶谱。因此,分类精度降低随着时间的信息就会丢失。
伽柏修改英国《金融时报》检查只有一小部分的信号。这种方法被称为窗口或短时英尺(STFT) [23]。它积累一个窗口适当形状的信号。STFT可以看作一种妥协之间的时间和频率信息。然而,信息的精度由窗口大小是有限的。
小波变换(WT)构成了下一个合乎逻辑的步骤。它使用一个窗口方法与变量大小和信号分析的进度图所示3。WT的另一个好处是它选择一个“规模”代替传统的“频率”;也就是说,它不产生一个特定信号的时频视图但时序表视图。时间尺度的观点是另一种可视化数据和更常用的和有效的。
2.3.2。DWT
这是WT的有效实施,它利用二元尺度和位置24]。DWT的基本面如下。让是一个平方积分函数。连续WT的信号相对于一个实值小波被定义为 在哪里 WT,表示函数在 ,和变量是扩张的因素(包括真实的和积极的数字)。在这里,星号()表示复共轭。
方程(1)可以通过抑制离散和一个离散晶格( 和 )提供DWT,给出如下:
在这里,和参考系数的近似分量和详细的组件,分别。和代表通滤波器和高通滤波器(高通滤波器),分别。和分别代表小波尺度和翻译的因素。DS运营商代表将采样。图像的近似分量有低频分量,而详细的组件包含高频组件。图4显示了一个三级分解树。
2.3.3。2 d-dwt
在一个案件涉及2 d图像,采用DWT分别在每一个维度。样本的大脑病理图像先生三级小波分解如图5。因此,有四个部分波段图像(噢,LH、HH和HL)在每个规模。其他的部分波段会利用2 d-dwt,可以视为图像的近似分量,而韩,霍奇金淋巴瘤,HH子可以被视为图像的详细的组件。分解的水平提高,更紧凑,但粗近似访问组件。因此,小波给一个简单的层次阐明图像信息的基础。
例如,有各种类型的小波Daubechies, symlets 1, coiflets 1,双正交的小波和反向双正交的1.1。我们测试结果与小波家族的每种类型如表所示2。在我们的研究中,三级小波分解的近似系数以及Haar小波收益率有前景的结果相比,小波家族中的其他人。因此,Haar小波是在实验中选择。这也是最简单和最重要的小波的小波家族。此外,它非常快,可用于从图像中提取基本结构信息。存在的所有特性的图像,并生成一个特征矩阵。
2.4。概率主成分分析
倾斜的车牌提取算法等。36- - - - - -38)是基于轴当任何输入向量的估计有一个或多个缺失值。的车牌提取减少了一个相关的高维数据的低维表示维观测向量到一个k维潜在(或未被注意的)变量这被认为是正常零均值和协方差。此外,车牌提取取决于一个各向同性的误差模型。可以建立的关系 在哪里表示观测变量的行向量,表示各向同性误差项潜变量的行向量。误差项, ,是零均值和协方差的高斯 ,在哪里是剩余方差。剩余方差大于0,的价值应该小于排名。一个标准的主成分= 0是车牌提取的限制条件。观察到的变量,y给定的值,是条件独立的潜变量 。因此,观测变量之间的关系是由潜在的变量来解释,证明特有的可变性和错误 。矩阵的维数是 ,这与潜在和观测变量。向量允许模型获得一个非零的意思。车牌提取认为失踪,任意的值在数据集。从这个模型中,
给出的解决方案和不能确定的分析中,我们使用的采用(EM)算法进行迭代相应的对数似函数的最大化。EM算法认为缺失的值作为额外的潜在变量。收敛的列张成的子空间的解决方案。车牌提取然后收益率标准正交系数。
关于我们的研究,图像的大小是256×256。三级分解后,向量特征成为32×32 = 1024。在这里,所有的功能不相关的分类。因为我们计算成本高,利用车牌提取降维。车牌提取了PCA的优点是它的计算效率。
2.5。交易所分类器
系综分类包括组合多个分类器获得比使用单个模型获得更准确的预测。此外,集成学习技术对于提高预测精度被认为非常有用。然而,基分类器必须尽可能精确的和多样化的增加一个整体模型的泛化能力。
正常和病理分类的脑核磁共振图像,我们使用一个随机子空间分类器使用资讯为基础的分类器。系综分类的成功背后的主要思想是分类的多样化,使得整体分类器。通过系综分类方法,对不同的即时每个分类器提供了一个不同的错误。因此,我们可以开发一个强分类器,可以减少错误。随机子空间分类器是一种机器学习分类器,将整个特征空间划分为子空间。每个子空间随机选择从原始特征空间的特性。它必须保证特定的基分类器的边界是明显不同的。意识到这一点,一个不稳定的或弱分类器是利用作为基分类器,因为他们创造足够多样的决策边界,即使对训练数据的小扰动参数。
我们使用了多数表决方法获得最后的决定类的成员。在该算法中,我们使用资讯作为基分类器由于其简单性。在选择一个随机子空间,估计一套新的资讯。绝大多数投票方法利用结合每个基分类器的输出决定准备测试类。
2.6。提出了系统的伪代码
提出我们的系统可以在四个主要阶段。伪代码描述的步骤1。
|
||||||||||||||||||||||||||||||||||||||||||||||||
2.7。性能的措施
各种技术被用来评估分类器的效率。性能是决定基于最终的混淆矩阵。混淆矩阵持有正确的和不正确的分类结果。表1说明了一个二进制分类混淆矩阵,TP、TN、FP,和FN描绘真阳性,真正的负面,假阳性和假阴性。
这里,病态的大脑认为持有价值“真的”,和正常的控制(NC)的假定持有价值“false”后正常的惯例。现在,我们建议的方法的性能计算的基础上敏感性,特异性,准确度和精确度如下。
(我)敏感性(真阳性):这个趋势或能力来确定诊断测试是积极的,当人有疾病:
(2)特异性(真阴性率):这个趋势或能力来确定诊断测试时消极的人没有疾病:
(3)准确性:这是一个衡量有多少诊断测试的正确执行:
(iv)的精度和召回的配方
2.8。交叉验证
交叉验证(CV)是一个用来评估模型评估方法机器学习算法的性能预测新的DS它没有训练。它有助于解决过度拟合问题。每轮交叉验证涉及到原始DS随机分配到一个训练集和验证集的例子倍的简历如图6。使用训练集训练监督学习算法,而测试集是用来评价其性能。
使分类器更可靠和推广独立数据集,一个5×3年来分层交叉验证(SCV)和5×5倍SCV受聘。5×3年来SCV用于ds - 66和5×5倍SCV用于ds - 90, ds - 160和ds - 255。ds - 66、55图像用于训练而先生75年,128年和204年用于ds - 90图像,分别ds - 160和ds - 255。ds - 66验证图片,ds - 90, ds - 160和ds - 255是11日,15日,32岁的分别和51。
3所示。结果与讨论
在这项研究中,我们实现了一个新的机器学习框架使用MATLAB 2016英特尔电脑core i5处理器和16 GB的RAM的Windows 7操作系统下运行。这个程序可以测试或在任何计算机上运行平台,MATLAB是可用的。
3.1。特征提取和优化小波
在拟议的系统中,三级2 d-dwt Haar小波分解的图像输入十次能带,如图5。左上角的小波系数图像(图5)代表的近似系数的三级分解图像,其大小只有32×32 = 1024。这些特性获得最初的特性。这些特性的大小仍大,矩阵的大小需要降低。现在,这些减少的特性被发送作为输入车牌提取。
3.2。功能降低
车牌提取作为一种降维工具的使用降低了其所需的特征尺寸大小。在这里,我们可以把功能。最好是所需的功能至少应该保持超过90%的方差。然而,在这项研究中,我们并没有把95%的方差,因为它可能会导致更高的计算成本。研究人员认为不同数量的特性。在我们的例子中,我们首先使用少量的特性,但精度较差。不管怎样,这个结果与13个主要组件是优秀的。因此,该方法使用13个主成分来获得更高的分类精度。
3.3。分类结果
减少的特性被送到分类器,获得的结果与不同的分类器是有前途的。从实验,发现该方法适用于所有四个DSs使用13个主要组件。逻辑回归的表演获得二次判别分析,然而,交易所与资讯为基础分类器分类器如表所示3。从表中,我们可以看到,该方法优于其他方法。我们利用ds - 90的5倍的简历,ds - 160和ds - 255,而我们利用ds - 66倍的简历。交易所获得的分类器精度的100.00%,100.00%,100.00%,和99.20%,ds - 66, ds - 90, ds - 160,分别和ds - 255。立方SVM的结果是一样的ds - 66旁边的交易所数据集的分类器,它只能达到98.50%。
3.4。与现有方案相比
为了进一步证明该方法的有效性,我们21相比现有的算法。算法和相应的结果列在表中4和5。表4显示比较结果与ds - 90。很明显从表4,我们提出的方法正确匹配的所有情况下灵敏度为100%,特异性100%,精度100%,100%的准确率。比较结果表明,我们的算法优于他人。这表明预处理技术结合特征提取的有效性通过WT、车牌提取。表45显示了结果提出系统的运行。表5展示了比较结果的3 DSs的数字特征,印数,平均精度。在这里,最近的一些方案运行10次,而其他运行5次。从表4和5,我们看到大多数技术取得了良好的分类时受到ds - 66,因为它是小的。然而,没有一个算法实现了100.00%的ds - 90和ds - 160因为ds - 255更大的规模和包括更多类型的患病的大脑;因此,没有当前CAD系统可以获得一个完美的分类。
最后,这个提议“DWT +车牌提取+证交所”实现了ds - 66的准确性为100%,ds - 90和ds - 160和ds - 255的准确性为99.20%,相比较,与其他最近的研究和大于整个算法提出了表5。改进实现了推荐的方案似乎是边际与其他方案相比,但我们取得这个结果基于仔细统计分析(5个重复倍的简历)。因此,这种改进是可靠和健壮的。
4所示。结论
本文提出了一种新的级联模型,“2 d-dwt +车牌提取+交易所”的病理检测大脑。实验验证了其有效性,因为它实现了99.20%的准确性。我们的贡献在于三分。首先,我们介绍了维纳滤波器和显示其有效性。除了我们介绍了车牌提取和证交所分类器和证明它给更好的性能相比与其他先进的算法。在这项工作中,我们改变了PBD问题二进制分类任务。我们提出了一种新颖的方法,取代了PCA和交易所介绍分类器。实验表明我们的方法对现有方法的优越性。
该算法也可以用于其他领域,例如,面部识别,乳腺癌检测和故障检测。此外,这种方法一直在验证可用的公开数据集的大小是有限的。在选定的数据集,末期间收集的图像和中产阶段的疾病;然而,图像在疾病早期阶段需要考虑。
在未来的研究中,我们可以考虑从其他形式如MRSI的图像,宠物,我们计划和CT提高鲁棒性。该方法可以在一个更大的临床验证数据集现代像深度学习机器学习技术,利用极端的学习,等等,在收集足够的大脑图像从医疗机构。物联网可以嵌入这pbd是另一个有前景的研究领域。
命名法
| (我)先生: | 磁共振(成像) |
| DWT: | 离散小波变换 |
| 车牌提取: | 概率主成分分析 |
| 资讯: | 最近的邻居 |
| 简历: | 交叉验证 |
| 摘要: | 反向传播神经网络 |
| KSVM: | 内核支持向量机 |
| SCG: | 尺度共轭梯度 |
| 二: | 最小二乘支持向量机 |
| FBPNN: | 前馈反向传播神经网络 |
| SWT: | 平稳小波变换 |
| 算法: | 粒子群优化 |
| 计算机辅助设计: | 计算机辅助诊断 |
| STFT: | 短时傅里叶变换 |
| QDA: | 二次判别分析 |
| 关于: | 对称的不确定性排名 |
| PZM: | 伪泽尼克时刻 |
| SWT: | 平稳小波变换 |
| DTCWT: | Dual-tree复小波变换 |
| 时滞:大小 | 径向基函数神经网络 |
| CT: | 计算机断层扫描 |
| TSVM: | 双子支持向量机 |
| 人机界面: | 胡矩不变量 |
| 简要: | 多层感知器 |
| ARCBBO: | 自适应实数编码biogeography-based优化 |
| DP: | 动态的修剪。 |
的利益冲突
作者宣称没有利益冲突。
确认
这项研究受到了大脑研究项目通过韩国国家研究基金会资助的科学,ICT和未来规划(nrf - 2014 m3c7a1046050)。这个工作是由韩国国家研究基金会资助由韩国政府(nrf - 2017 r1a2b4006533)。