文摘
脑部肿瘤是最常见的和侵略性的疾病,在相对较短的预期寿命在他们最严重的形式。因此,治疗计划是重要的一步在改善病人的生活质量。一般来说,图像的方法如计算机断层扫描(CT)、磁共振成像(MRI)和超声图像用于评估肿瘤在大脑中,肺癌、肝癌、乳腺癌、前列腺癌、等等。利用x射线图像,特别是,在这项研究中诊断脑肿瘤。介绍了卷积神经网络(CNN)的调查来确定脑部肿瘤的x射线图像。它加速,增加治疗的可靠性。因为已经有大量的研究在这一领域,提出了模型着重于提高精度在使用学习策略转移。Python和谷歌Colab用来执行该调查。深特征提取的帮助下完成pretrained深CNN模型,VGG19 InceptionV3, MobileNetV2。分类精度是用来评估的性能。 MobileNetV2 had the accuracy of 92%, InceptionV3 had the accuracy of 91%, and VGG19 had the accuracy of 88%. MobileNetV2 has offered the highest level of accuracy among these networks. These precisions aid in the early identification of tumors before they produce physical adverse effects such as paralysis and other impairments.
1。介绍
脑肿瘤是一个不受监管的,大脑细胞的异常生长。因为人类的头骨是刚性和限制容积的身体,任何意想不到的发展可能会损害人类功能取决于所涉及的大脑区域;此外,它可能蔓延到其他身体器官,损害人类功能(1]。脑癌占不到2%的癌症在人类中,根据世界卫生组织(世卫组织)年度报告癌症,但它会导致大规模的发病率和影响(2]。根据英国癌症研究中心(3),大脑,其他中枢神经系统(CNS)和颅内肿瘤杀死每年大约有5250人在英国。为此,本文的主要动机是开发深度上优于健壮的系统,可以在短时间内大脑肿瘤进行分类。脑部肿瘤检测在生物医学领域的应用是至关重要的。最近,脑瘤的临界性质检测了。大脑肿瘤分类系统是协助医务人员诊断疾病。需要几种方法在分类过程中,如预处理、特征提取和分类。预处理是图像处理的步骤发生之前做特征提取识别一个区域或项目的位置。提取步骤之前,这个过程包括过滤、标准化,并认识到项目。特征提取就是从图像中提取基本数值的过程来区分他们(4]。
没有电脑的帮助,是不可能健康从业者来解析这些庞大的数据集,当进行大量的数据分析得多。此外,严重的肿瘤的精确分类可能会阻止人们接受必要的治疗。几个世纪以来,学习方法被广泛用于检测脑瘤和从数据推断出其他概念模式。深度学习的使用脑部肿瘤的分类和建模是众所周知的。这是一个方法,发现未知的规律和模式在一个广泛的数据集。它包括一个广泛的各种各样的技术公开规则,范式,在数据分组和关系,以及对发展中这些联系的假设可能用来解释新隐藏的数据。图1说明了深度学习在医学行业的主要应用。
人工智能(AI)工具的使用在临床研究正在迅速扩大的结果预测和分类的成就,特别是临床分析描述脑部肿瘤,现在广泛应用于生物医学探索和构建健壮的各种疾病诊断系统(5- - - - - -7]。深度学习是机器学习的一个子集(DL)通常是涉及数据表示和分层特性。对于描述符提取,DL算法使用许多层的非线性处理技术的一种安排。每一层的输出成为后续的输入层,艾滋病在数据抽象为我们深入了解网络8]。卷积神经网络(cnn)是一种深度学习,通常采用视觉图像分析,目的是需要准备的9]。它是基于人类的大脑的生物功能10),是用来组织数据的数组(11]。在二十世纪后期,勒存等人建立了一个深层神经网络被称为“LeNet”用于文档识别应用程序(12),这是第一个使用深CNN的形式接近目前的形式。后收到了很多兴趣深CNN被用来分类的图像(ImageNet lsvrc - 2010)使用一种称为“AlexNet”的模型13]。AlexNet优于其他常用的网络拓扑在这个时期。后,它的成功引发了一连串的进一步深度学习领域的胜利对美国有线电视新闻网。cnn的主要好处在传统机器学习和香草神经网络特征学习和无限的准确性,可以通过增加训练样本,导致一个更精确的和健壮的模型(14]。卷积过滤器作为特征提取器在CNN的架构中,我们更深,我们提取更复杂的功能(空间和结构信息)。微小的卷积过滤器与输入模式收益率最差异化特性,随后被用来训练分类网络(11]。
多年来,脑肿瘤分类已经完成利用各种各样的机器学习方法。在[15),作者提出了一个方法,结合支持向量机和神经胶质瘤KNNfor分类。multiclassification的精度达到85%,而对于二元分类,获得88%的准确性。在[16],另一种方法是提出了脑部肿瘤检测使用小波变换(DWT), PCA, ANN-KNN图像分类。结果在97%和98%之间。程等。17)提出了一个技术改善脑部肿瘤的分类性能通过图像膨胀扩大肿瘤区域,然后将它划分为亚区。他们用三种方式获取特点:强度直方图,GLCM,鞠躬,然后结合环形式分割和肿瘤区域增加达到最大精度为91.28%。Ertosun和鲁宾18)提出利用CNN区分高低年级神经胶质瘤和他们的成绩。分别获得71%和96%的准确率。保罗et al。19)培训和发展两种不同的分类方法使用轴向脑部肿瘤图像(一个完全连接CNN)。CNN的准确性架构,两个卷积层后跟两个完全连接层,是91.43%。Afshar et al。20.)设计了一个胶囊网络(CapsNet)分类脑癌,认为MRI脑图和粗肿瘤边界。这项研究有一个90.89%的准确性。利用CNN和遗传算法,Kabir Anaraki et al。21]建议两个耦合的监管模式分类脑肿瘤图像(GA-CNN)。在第一项研究中,三个等级的神经胶质瘤分类的准确性为90.9%,而神经胶质瘤诊断的准确性,脑膜瘤,垂体肿瘤为94.2%在第二个场景中。
研究人员称大约90%精度在大多数利用核磁共振脑成像的研究。然而,这项研究的主要目的是利用某些pretrained模型转移学习使用大脑的x光片。同时,这项研究是我们修改的新奇MobileNetV2,达到92%的精度最高,VGG19达到88%的准确性,InceptionV3实现91%的准确性。在这工作,研制了一种新颖的方法来检测脑瘤使用深度学习。CNN时维护方便处理当前的问题由于其快速、精确的检测肿瘤的CT扫描。
正如前面提到的,本研究的主要贡献是,三个不同的转换学习方法上实现一个公开的数据集。所有的实现结果部分结果和分析讨论。本研究的其余部分的结构如下。部分2讨论了方法和材料;部分3讨论结果和分析;和部分4讨论了结论。
2。方法和材料
数据从免费获得Kaggle数据库。数据集包括健康和脑瘤患者的x射线图像。对于特征提取,CNN是就业。在模型中,有四个Conv2D层,三个Maxpooling2D水平,一个平层,两层致密,ReLu激活函数。过去的致密层,将SoftMax利用作为一个激活函数。转移学习目的主要是调查这里比较模型准确性pretrained。MobileNetV2、VGG19 InceptionV3用于pretrained模型,在最后一层细微的修改,和一头模型创建的基本模型。平均池、压平、密度和辍学是可定制的最后一层。CNN模型用于提取视觉特征。模型提取的特征所提供的图片和学会区分图像基于这些属性。
2.1。数据集
本研究利用一个公开访问脑瘤数据集(22]。这个集合包含x射线从个体大脑肿瘤的照片。有2513个脑瘤图片和2087名健康图片在这个集合。图2显示了脑部肿瘤样品的x射线图像和健康的人。
2.2。工具
Python是一种适当的数据处理工具,尤其是在处理深度学习算法。在这项研究中,调查了几种基于python包来实现我们的算法。
2.3。系统的框图
图3显示了一个框图,输入x射线图像的数据集划分为两个部分:脑瘤患者和健康人。
训练模型之前,我们开始通过一些涉及收集图像预处理步骤,分区数据集,并调查增强方法。模型安装和调整,结果改善。路线展示损失和准确性随时代已被证明通过绘制混淆矩阵,损失模型,模型精度。最后,如果一个用户提供一个图片作为模型的输入,输出部分可能决定是否图像描绘了一个患者脑部肿瘤。完整的系统的框图描述最简单可行的方式。决策是该系统的重要组成部分,在研究中起着重要作用。
2.4。预处理
数据训练和评估前,有一个预处理阶段。图像缩放和转化为向量。然后,他们扩展适用于培训过程。它运行更好与更小的形象。256×256像素大小的图像在这个研究。下一步是处理所有的图像集合到一个数组中。图像被转换为一个数组用于循环功能。MobileNetV2使用图像作为预处理输入。最后一步是编写代码。标记的数据转换为一个数字标签可以解释和分析。 After that, the dataset is splitted into three parts: 70% for training, 20% of validation purpose, and the rest for testing.
2.5。拟议的架构的背景
cnn介绍隐藏层的想法通过使用神经网络。当一个向量输入图片,神经网络的隐藏层执行一系列神经转换。每个隐层有大量的神经元,和上一层的每个神经元与后续层的神经元。然而,神经元在同一层连接。每个神经元都有一个不同的加权函数和一个输入组件。应用函数和权重之后,每个神经元的输出是倾向于正面或负面的价值。这种方法遍历许多隐藏层,以得出一个结论。最后一层是一个完全连接层,混合所有的隐藏层生成最终结果。扩展是一个重大的缺点在一个典型的神经网络。图4显示了建议的体系结构。
深转化学习的基地层是卷积层。这个小组负责决定设计特点。原始图像是由这一层过滤。卷积过程增加的体重范围的输入。一个过滤器是由一组输入数据乘以一个2 d的权重集合。点产品能产生一个值,当应用于filter-sized面积源和过滤器。这个组件之间充当缓冲输入filter-sized补丁和过滤器。这里低于源和应用将几个输入使用相同的过滤器。因为它覆盖整个框架系统,过滤器设计作为一个独一无二的技术检测某些类型的特性。
池层是用来总结特点允许了抽样。平均池和最大池两种广泛利用池的方法描述的平均生存函数及其最大活性的存在,分别为(23]。事实上,池层消除多余的特点从图片和渲染他们可读。层平均价值的当前视图每次利用平均池。当使用max池,从当前视图层选择最大价值的过滤器。马克斯池方法只选择最高的值使用矩阵大小设置每个特性映射,从而减少输出神经元。因此,图片变得非常小但情况保持不变。
平层将数据矩阵转换为一维数组可用于全部层有关。向量可能被夷为平地。在最后一步中,分类器(24]。当考虑CNN,最后两个阶段是压扁和完全连接层。转化为一个一维数组,准备下一个完全连接层的图像分类。完全连接层被证明特别有用的计算机视觉应用程序和主要用于有线电视新闻网。CNN卷积和池技术的第一个阶段,把图像分解成它的组成特性和分别分析(25]。每个输入与一个完全连接的所有神经元层。在这项研究中,SoftMax和ReLu激活函数应用于预测预测输出。总结了CNN的最后几层和最关键层。
2.6。将学习与MobileNetV2
大数据分析和分类是昂贵和耗时的过程。为了解决这个问题,可以调查知名转移学习方法不需要大量数据集应用。计算变得容易,成本也更低。转移学习技术,包括使用一个模型,该模型已在一个庞大的数据集上训练其知识转移到一个新的模型,需要训练有素的比要求更少的数据。
这种技术适用于CNN在小数据26]。这个研究包括三个CNN-based pretrained模型分类大脑MobileNetV2 x射线图像,VGG19, InceptionV3。此外,传递学习法,通过ImageNet调查处理小数据。转移的研究架构学习是描绘在图5。
主要有三个不同的部分在图4。第一部分包含了大脑的x光片。第二部分涉及pretrained的加载模型。三个pretrained模型加载在第二部分。第三部分修改加载pretrained模型如图4。
2.6.1。MobileNetV2
MobileNetV2为移动设备优化完全卷积架构(27]。它是基于一个倒置的残余建筑,与瓶颈水平联系在一起的残余连接。中间扩展层过滤功能和轻量级的深度方面运算作为非线性的来源。第一次完全卷积与32层过滤器用于MobileNetV2设计,这是紧随其后的是19层残余瓶颈。图6显示MobileNetV2的框图。
六个步骤遵循的发展模式,创造了放大图像发生器,使用MobileNetV2基本模型,增加了模型参数,建立模型,列车模型和存储模型对未来的预测过程。损失0.25保证随机培训期间消除25%的权重。这种技术显著降低过度拟合。这种方法的主要目的是为了防止模型利用太多的重量和获得广博的知识的输入。对于这个数据集,一批32是利用图像的大小。因此,32图像学在一个循环。一般来说,该模型将增长更大的随着批量大小的增加。然而,这减少了模型的能力对某些不寻常的类型进行分类。因此,之间有一个权衡共性和特异性在计算这个数字。在一个广泛的模型尺寸,MobileNetV2提高性能。 Every line of MobileNetV2 is made up ofn倍重复层(28]。MobileNet,深度方面可分用于因式分解规律的状态进入深度方面卷积。这需要11深度,俗称逐点卷积(29日]。
2.7。图像分类的性能指标
在这项研究中,几个矩阵被用来评估精度等性能,精度,还记得,F1-score, AUC。这些措施是基于以下指标:真阳性(TP)决定了脑部肿瘤图像的数量确定为肿瘤图像;真正的底片(TN)是用来评估的数量正常情况下识别也正常;假阳性(FP)显示正常的图片数量不正确标识为肿瘤图像;和假阴性(FN)显示正常的肿瘤图像的数量。图7显示了混合矩阵的框图。
从混淆矩阵的值,下面的方程可以推导出:
3所示。结果和分析
我们有许多模型和方法的效用和有效性评估分类健康和大脑肿瘤的照片。三个CNN模型是研究大脑x射线图像分类为正常和异常MobileNetV2, VGG19,《盗梦空间》V3。几种不同的网络设计是测试在整个选拔过程,包括VGG19 InceptionV3, MobileNetV2。MobileNetV2优于所有其他网络。表1总结了结果的准确性和损失指标不同的模型。
3.1。模型的准确性
图8显示了分类MobileNetV2报告。的F1-score健康和大脑肿瘤的分类是93%和91%,分别。
每个人都可以看到的情节训练精度历史准确性大幅上升后每个时代。第一时期的75%,但提高准确率与每个随后的时代。相比之下,模型的验证准确性为84%和增长,直到最后一个时代。模型精度的情节,可以看出越来越线已经形成了训练精度,而一行已经产生了测试精度始终在90%和96%之间准确的整个时期。
数据9- - - - - -11显示结果的图形化表示。在图9,这表明训练精度大于验证精度。同样,图10显示验证损失大于培训损失,这表明这个模型没有过度拟合问题。
图11说明曲线下的训练精度、AUC,几乎是99%,而对于验证,这几乎是98%。系统的混淆矩阵,在行和预测值与实际值的列。混淆矩阵总结分类模型的预测结果。混淆矩阵的正确和错误的预测进行了总结和分类。图12描绘了混淆矩阵。
从图11,表明此模型预测426年图片正确,但它也预测36张照片不正确。
定性(分类)项目,科恩Kappa系数(k)是一个统计,两分的以及intrarater可靠性措施。简单%协议计算时可能更可靠,这种方法的潜力占协议产生的巧合。使用这个模型,科恩Kappa系数是0.84。
3.2。模型试验
这项研究也涉及现实的评估,美联储的模型数据的x射线扫描大脑的形式。实时预测中描述数据13和14。
图13描述了脑瘤的输出。该模型准确预测脑瘤的输入图像。另一方面,数字14显示了一个健康的大脑。
3.3。比较的结果
在表2,我们比较分类结果与前面提到的参考论文。除了VGG19,所有的模型在表2表现良好。与先前的研究相比,本研究显示每个时代InceptionV3和MobileNetV2光滑的准确性。
4所示。结论
贫穷的国家卫生保健系统、深入学习分析框架可以成为一个有用的替代工具。深度学习医学框架应用程序显示优秀的结果尤其在早期预防性治疗(28,30.- - - - - -32]。鉴于放射科医生短缺在资源受限的地方,检测肿瘤在大脑图像通过先进的深度学习工具可以帮助减少努力,加快检测过程。在这项工作中,我们提出了探讨几种先进的深度学习方法,结合一种新的方式来增加脑瘤的预期性能检测。事实上,我们利用深度学习从开始到结束确定脑部肿瘤。我们利用转移学习训练与权重pretrained深CNN ImageNet使用加权损失函数。通过定量结果显示了这种方法的有效性对大脑肿瘤数据集,实现F1-score 92%和92%测试集的分类精度。在未来,工作将在一个更大的数据集和更多pretrained模型。在我们的数据集,这些模型表现良好。这个数据集,MobileNetV2运作得很好。模型验证确认,分类和特征提取后的结果准确。使用一个简单的大脑x射线图像,这些模型可以检测脑瘤在最短的时间内。 X-ray technology is now widely available and reasonably priced. As a consequence, it has the potential to be a highly successful technique for brain tumor detection.
数据可用性
数据用来支持这些研究成果可在网上https://www.kaggle.com/preetviradiya/brian-tumor-dataset。
的利益冲突
作者宣称他们没有利益冲突的报告对于本研究。
确认
作者扩展他们的感谢院长以来哈立德国王大学的科学研究支持这项工作通过一个研究小组项目在批准以序列。2/53/42。他们也欣赏塔伊夫大学的研究人员支持项目的支持格兰特TURSP-2020/26,塔伊夫大学,塔伊夫,沙特阿拉伯。