文摘

新COVID-19迅速蔓延,已经夺去了无数人的生命。病毒是高度破坏性的人类肺,和早期发现是至关重要的。因此,本文提出了一种基于混合方法深卷积神经网络对图像分类是非常有效的工具。特征向量提取使用深卷积神经网络,从图像和二进制微分metaheuristic算法用于选择最有价值的功能。支持向量机分类器就考虑到这些特性进行了优化。在这项研究中,一个数据库,其中包含图像从三个类别,包括COVID-19、肺炎、和健康的范畴,包括1092 x射线样本,使用。该方法实现了99.43%的准确率,敏感性99.16%,特异性99.57%。我们的研究结果表明,该方法优于最近研究COVID-19检测使用x射线图像。

1。介绍

COVID-19的快速传播导致了全球无数人的死亡。肌肉酸痛、咳嗽、发烧都是病毒的症状,可通过临床试验发现和影像学成像。疾病诊断、医学成像是至关重要的和疾病的x射线和计算机断层扫描(CT)扫描可用于深度网络辅助疾病的诊断。

分类和诊断疾病的过程中从一个图像使用神经网络分为四个步骤:特征提取、最优特征选择,网络训练和模型性能测试。的特征提取步骤分为两种类型。在第一种,图像处理技术,提取算法,以及过滤器特性。从图像中提取特征,使用组织的形状和纹理分类的病人。第二种类型的原始图像和实际输出类被送入卷积网络作为输入数据,并自动提取的特征在最后的平层后,网络训练过程和体重调整。

从深层网络中提取某些特征可能有不利影响分类精度(1]。因此,有效的特征选择方法是至关重要的。有三个不同类型的特征选择方法。过滤方法使用特性的内在属性和统计指标如费舍尔得分,信息增益,卡方,和相关系数。包装方法采用学习算法,搜索功能的一个子集的特征空间优化分类精度。为此,包装方法采用metaheuristic选择特征子集和执行交叉验证的方法。最后,混合方法同时使用过滤器和包装器方法(2]。Metaheuristic方法优于其他特征选择方法应用许多功能是必需的。

通过分析从图像中提取特征分类性能得到了改进和选择最优特征(3]。众多特征选择(FS)研究已发表在医学成像领域,包括Robustness-Driven FS (RDFS)肺部CT图像(4FS), Shearlet变换从脑核磁共振图像5),主成分分析肺部x光图像(6)、遗传算法(GA)对肺结节(7),蝙蝠(BA)和粒子群优化算法(PSO)在肺部x光图像,和花授粉算法(FPA)从肺图像8]。

上述研究提出,机器视觉结合metaheuristic算法可以使用肺图像分类的病人。另一方面,现有的诊断方法COVID-19病毒使用x射线图像需要大量的内存,充足的时间,大量的功能。结果,一个智能系统出现必要协助医生和治疗人员准确、快速分类COVID-19病人在减少疾病死亡率。本研究旨在开发一个高效的过程利用人工智能方法在准确预测COVID-19帮助医生和病人。研究是小说,它采用二进制微分进化算法来设计基于特征选择的深度学习结构COVID-19诊断。研究的贡献包括以下:(1)使用深没有pretrained卷积神经网络网络设计一个智能系统根据肺部x光图像和提取特征用最少的内存需要创建和训练网络(2)选择最优的特征微分metaheuristic方法提高性能指标(3)增加对多类分类精度问题,包括患者COVID-19,肺炎,健康组

研究结构如下。部分2评审相关工作。部分3介绍了提出的方法和模型COVID-19检测使用深卷积和二进制微分算法。部分4包含实验结果,部分5讨论了方法和比较这与以前的作品。最后,研究的结论。

是欣但等人利用深度学习模型来推断COVID-19的积极或消极的地位和报道,VGG19模型表现更好的准确性达90% COVID-19感染25日和25 non-COVID-19图像(9]。Toğacar等人将295年COVID-19图片,98肺炎影像和65正常图像MobileNet和SqueezeNet10]。他们从训练网络模型提取特征,然后使用SMO算法选择功能,总体精度99.27%报道SVM分类器。张等人研究了一个18-layer ResNet 100 COVID-19和1431肺炎模型图像和报告的准确性(95.18%11]。Apostolopoulos和Mpesiana pretrained VGG19于700年224 COVID-19,肺炎,和504个常规的图像,结果显示98.75%的准确性(12]。的作者(13)评估127 COVID-19 DarkNet 17卷积层使用,肺炎,500和500正常的图片和报道98.08%的准确性。在[14),CNN的性能提高通过图像预处理算法,导致模型的准确率达到了94.5%。

的作者(1)开发了一种COVID-19分类方法基于两个数据集,一个名为《盗梦空间》的CNN,一个pretrained Imagenet特征提取器,海洋食肉动物算法作为一种功能选择器,然而作为分类器。

第一个数据集包含200积极COVID-19图像和1675负面形象,而第二个数据集包含219积极COVID-19图像和1341负面形象。据报道98.7%精度数据集,数据集1为99.6%,2。通过结合VGG19 Canayaz验证COVID-19诊断模型,ResNet AlexNet, GoogLeNet两metaheuristic算法题为“二进制粒子群优化”和“二进制灰狼优化。“总体分类精度最高的99.38%用于选择二进制灰狼优化后功能从1092年从COVID-19 x射线图像,肺炎,和健康分类记录(15]。

以前作品的一个限制是他们依赖pretrained深网络,需要大量的记忆。此外,许多输入特性加上长时间的检测时间进一步这些方法的缺点。在这项研究中,深入学习方法提出了基于特征选择通过二进制微分进化算法来克服这些限制和改善COVID-19检测。

3所示。方法和模型

1描述了该模型。最初,美联储卷积神经网络与肺图像。训练后的网络,从理想图像提取的特征。然后使用启发式方法来提取最优特性。因此,COVID-19的三个类,肺炎,和健康的更高的分类精度。

3.1。深的卷积

卷积神经网络用于机器学习作为一个特征提取器和分类方法。卷积网络的输入是原始数据,如图像。网络使用卷积函数自动提取功能。在学习,而不是手动提取功能,矩阵作为过滤器,主要输入图像幻灯片,并通过方程(卷积操作进行1)。最后,经过培训和映射输入图像输出标签,几个卷积层提取特征(16]。 IMG表示输入图像与身高=H宽度=W维度,tc的图像通道的数量,C是过滤矩阵 维度,bs偏差值为每个过滤器C,

卷积后,多余的值使用ReLU层,然后输入是减少使用池层。有效的输入向量然后传递到完全连接层,功能类似于中长期规划。在深褶积层的最后一节,Softmax [17)、分类层执行分类使用亚当(自适应时刻优化器)18];失去了方程函数如下所示: 在哪里表示样本大小, 表示实际的类th样本, 表示的预测输出类th输入数据 表示正则化系数。

亚当是基于一个梯度优化算法,它使用的指数移动平均梯度和梯度的更新和解决神经网络的权值,有效深层网络问题。深层神经网络由许多层,每个都有自己的一套学习参数,即重量和偏见。最优特征选择算法应用到亚当优化器增加了优化的速度和准确性。

3.2。二进制微分进化

差分进化(DE) (19)是一种启发式演化方法最小化连续问题。二进制微分进化的概念(12)20.特征选择的扩展来解决问题。它由三个不同的建筑,包括变异、交叉和选择。最初,维D用于生成初始种群,在哪里D是优化特征的数量。变异操作,三个随机向量 , , 选择的向量 这样 ,在哪里k是一个人口向量安排。

如果dth向量的维度 是相等的,dth的特征向量的区别(方程(3)是零;否则,它具有相同的值作为向量 :

执行之后,变异和交叉操作,见以下方程: 在哪里W代表了向量, 代表交叉多, 代表一个随机数。在选择过程中,如果的健身价值向量 大于当前的向量 ,它将被取代。否则,当前的向量 存储为下一代。

4所示。实验结果

4.1。描述的数据

Canayaz发达COVID-19 x射线数据集,包括三个子组的病人,包括那些与COVID-19患有肺炎,那些是健康的(15]。通过结合数据从这个数据库中,共有364张图片为每个三类得到的平衡数据集(21- - - - - -23]。图像的总数等于类的数量乘以类实例的数量= ,以224×224维度。相同的数据被用于这项研究使用卷积神经网络预测COVID-19疾病和选择最优特性使用二进制微分metaheuristic算法。图2演示了一个代表性样本的三个输出分类:COVID-19,肺炎,和健康。

4.2。绩效评估

该模型在MATLAB运行版本9.1.0.441655 (R2018b)笔记本电脑配备了1.8 GHz处理器和4 gb的RAM。训练后在应用阶段,该方法把每个病人平均29秒,这可以减少通过改进硬件技术。COVID-19预测模型评估使用的准确性,敏感性,特异性,几何平均数,曲线下的面积(AUC-ROC) [24,25)性能指标(方程(6)- (9)),精度是指分类的正确性。的比例正确区分消极的情况下被称为“特异性”,而正确区分阳性病例的比例被称为“敏感性。“几何平均数的第二根敏感性和特异性的产品。更高的值曲线下的面积(AUC)在接受者操作特征表明改进的分类性能。 在哪里TP意味着真正的阳性样本的数量正确标记为正FP是假阳性的数量样品,误认为是积极的TN意味着真正的底片是样品的数量是正确地贴上消极FN意味着假阴性的样本数量是误认为是负的

4.3。模型参数

3说明了深卷积神经网络的网络结构。首先,图像输入层维度 ,和卷积算子使用八3 x3的过滤器。处理后第一个块的网络层,即。,image input, convolution, Batch Normalize, ReLU, max-pooling layers, fully connected layer 400, ReLU, and Drop out, the local features were automatically extracted. Finally, the second network block categorized the input images into three output classes by utilizing three fully connected layers, softmax, and classification. After 200 epochs, the validation accuracy was 97.25% when using the ADAM optimizer, and the minibatch size was 64 (Figure4)。由于神经网络的正规化和街垒过度拟合,批量标准化和辍学。

卷积网络是用于将数据转换成特征向量。考虑到一些网络特性可能会降低模型的性能(1),400年提取特征后完全连接在第一层,二进制微分metaheuristic算法用于选择最优特征子集和消除不必要的功能。二进制微分算法的参数数量= 20,迭代= 100(图5),交叉率1。数量(1 -(几何平均数))的支持向量机分类器26)被认为是人们的健身价值(图5)。二进制微分算法的执行后,340年最佳特征选择。

4.4。性能比较

传统的验证(CV)方法,该方法采用随机抽样,是训练和测试协议用于确定模型的准确性和评估结果进行验证。根据简历的方法,70%的数据被用于培训,15%进行验证,15%用于测试(27,28]。该方法应用于数据,和100年运行进行,防止过度拟合(29日]。所选择的最优特性的微分算法和最初的提取特性从深卷积神经网络输入到支持向量机分类器。

支持向量机分类器的原始的混淆矩阵和优化功能是显示在表1使用培训、测试、验证和数据。

1描绘了混淆矩阵使用培训、测试、验证和数据总量的SVM分类器的原始特性和优化功能。TP、TN FP、FN、准确性、敏感性,特异性,几何平均数,和AUC指标的三个输出类加上每种类型的测试、培训、验证和数据计算(表2)。

5。讨论

预测疾病可以通过将图像与深神经网络相结合,在深层神经网络可以用来作为特征提取器。图像的大尺寸和体积应用于深层神经网络导致众多特性形成,增加培训和决策时间的预测模型。

该模型所面临的几个设计挑战,包括收集和改善肺图像和网络体系结构,在结构方面,数字,和类型的层,加上metaheuristic算法,初始种群,metaheuristic算法的目标函数类型。的存在效率低下的特点从深海中提取网络可以减少预测模型的精度和效率;因此,使用metaheuristic方法选择最优特性改进模型的记忆,时间,和准确性。

根据表3,该模型实现了精度为99.43%,敏感性为99.16%,特异性为99.57%,99.37%的几何平均数,AUC的0.99和0.1133的均方根误差(RMSE)通过CNN使用x射线图像的特征提取和特征优化使用二进制微分metaheuristic算法。COVID-19分类的准确性问题是计算在这项研究中,99.43%和相关特性的数量是304(表4),然而,在一项研究[15),这些数据被报道为99.38%和448年的特性,分别基于相同的数据。

迁移学习模型训练分类图像和1000个不同类型的对象必须重新训练分类COVID-19检测等具体问题。虽然学习过程等模型提示ResNet SqueezeNet,它们需要预处理输入图像,大小的数据集,并设置多个参数。上层提取颜色和边缘特征,而深层提取复杂特性。过程时间随着层数的增加转移增加学习模型。培训转移学习模式的特征映射和活化层必须定制特定COVID-19问题,这需要大量的记忆。微调pretrained后模型的主成分分析(PCA),可以使用启发式方法选择最优特性,自动编码器或variance-based选择器。最后,整体方法,如支持向量机的组合或其他分类器,可以用来预测COVID-19疾病诊断的准确性。使用semisupervised自学方法可能导致可接受的精度和降低标签的时间。

在未来的工作中,不同的特征选择算法和应用更多的学习者可能会产生改善的结果。随着图像,来自临床试验的参数可以创建一个新的模型与小说相结合的特性诊断疾病,并可能因此预测死亡率。

6。结论

COVID-19感染的人数也在急剧增加。机器视觉技术和人工智能技术在诊断和治疗疾病至关重要。本文的目的是提出一个方法的“COVID-19”问题通过一组肺图像,包括三个类别的肺炎,COVID-19和健康。

深卷积神经网络组成的11层应用于提取特征。二进制微分metaheuristic方法用于选择相关特性和消除不相关的功能。肺部x光图像分类使用支持向量机分类器基于这些最优特性。这项研究表明,相关提取的精度指标和功能比以前的方法使用相同的数据。基于神经网络和metaheuristic特征选择算法,该模型可用于其他各种医学应用。

数据可用性

使用的数据集和分析在当前研究可从相应的作者以合理的要求。

伦理批准

本文不包含任何数据或其他信息来源于研究或实验涉及人类或动物主题。

不适用。

的利益冲突

作者宣称没有利益冲突。

作者的贡献

Iraji Feizi-Derakhshi提出了图像分析算法;Iraji实现算法并分析了实验结果;Tanha提供临床指导;和Iraji Feizi-Derakhshi, Tanha结果进行验证。最后的手稿是阅读和批准所有作者。

确认

作者希望表达他们的感谢所有参与者。