复杂性

在这一页上

文摘介绍相关的工作模型实验结果讨论结论数据可用性伦理批准同意的利益冲突作者的贡献确认引用版权相关文章

特殊的问题

对传统和深模型复杂度和鲁棒性取舍

把这个特殊的问题

研究文章|开放获取

体积2021年| 文章的ID9973277| https://doi.org/10.1155/2021/9973277

COVID-19检测使用深卷积神经网络和二进制微分算法特征选择从x射线图像

穆罕默德军刀Iraji ,^1、2 穆罕默德•礼萨•Feizi-Derakhshi ,³ 和魔法师Tanha ²

学术编辑器: 阿迪尔Mehmood Khan

收到了 2021年04月04

修改后的 2021年5月11日

接受 2021年9月22日

发表 2021年10月05

文摘

新COVID-19迅速蔓延,已经夺去了无数人的生命。病毒是高度破坏性的人类肺,和早期发现是至关重要的。因此,本文提出了一种基于混合方法深卷积神经网络对图像分类是非常有效的工具。特征向量提取使用深卷积神经网络,从图像和二进制微分metaheuristic算法用于选择最有价值的功能。支持向量机分类器就考虑到这些特性进行了优化。在这项研究中,一个数据库,其中包含图像从三个类别,包括COVID-19、肺炎、和健康的范畴,包括1092 x射线样本,使用。该方法实现了99.43%的准确率,敏感性99.16%,特异性99.57%。我们的研究结果表明,该方法优于最近研究COVID-19检测使用x射线图像。

1。介绍

COVID-19的快速传播导致了全球无数人的死亡。肌肉酸痛、咳嗽、发烧都是病毒的症状,可通过临床试验发现和影像学成像。疾病诊断、医学成像是至关重要的和疾病的x射线和计算机断层扫描(CT)扫描可用于深度网络辅助疾病的诊断。

分类和诊断疾病的过程中从一个图像使用神经网络分为四个步骤:特征提取、最优特征选择,网络训练和模型性能测试。的特征提取步骤分为两种类型。在第一种,图像处理技术,提取算法,以及过滤器特性。从图像中提取特征,使用组织的形状和纹理分类的病人。第二种类型的原始图像和实际输出类被送入卷积网络作为输入数据,并自动提取的特征在最后的平层后,网络训练过程和体重调整。

从深层网络中提取某些特征可能有不利影响分类精度(1]。因此,有效的特征选择方法是至关重要的。有三个不同类型的特征选择方法。过滤方法使用特性的内在属性和统计指标如费舍尔得分,信息增益,卡方,和相关系数。包装方法采用学习算法,搜索功能的一个子集的特征空间优化分类精度。为此,包装方法采用metaheuristic选择特征子集和执行交叉验证的方法。最后,混合方法同时使用过滤器和包装器方法(2]。Metaheuristic方法优于其他特征选择方法应用许多功能是必需的。

通过分析从图像中提取特征分类性能得到了改进和选择最优特征(3]。众多特征选择(FS)研究已发表在医学成像领域,包括Robustness-Driven FS (RDFS)肺部CT图像(4FS), Shearlet变换从脑核磁共振图像5),主成分分析肺部x光图像(6)、遗传算法(GA)对肺结节(7),蝙蝠(BA)和粒子群优化算法(PSO)在肺部x光图像,和花授粉算法(FPA)从肺图像8]。

上述研究提出,机器视觉结合metaheuristic算法可以使用肺图像分类的病人。另一方面,现有的诊断方法COVID-19病毒使用x射线图像需要大量的内存,充足的时间,大量的功能。结果,一个智能系统出现必要协助医生和治疗人员准确、快速分类COVID-19病人在减少疾病死亡率。本研究旨在开发一个高效的过程利用人工智能方法在准确预测COVID-19帮助医生和病人。研究是小说,它采用二进制微分进化算法来设计基于特征选择的深度学习结构COVID-19诊断。研究的贡献包括以下:(1)使用深没有pretrained卷积神经网络网络设计一个智能系统根据肺部x光图像和提取特征用最少的内存需要创建和训练网络(2)选择最优的特征微分metaheuristic方法提高性能指标(3)增加对多类分类精度问题,包括患者COVID-19,肺炎,健康组

研究结构如下。部分2评审相关工作。部分3介绍了提出的方法和模型COVID-19检测使用深卷积和二进制微分算法。部分4包含实验结果,部分5讨论了方法和比较这与以前的作品。最后,研究的结论。

是欣但等人利用深度学习模型来推断COVID-19的积极或消极的地位和报道,VGG19模型表现更好的准确性达90% COVID-19感染25日和25 non-COVID-19图像(9]。Toğacar等人将295年COVID-19图片,98肺炎影像和65正常图像MobileNet和SqueezeNet10]。他们从训练网络模型提取特征,然后使用SMO算法选择功能,总体精度99.27%报道SVM分类器。张等人研究了一个18-layer ResNet 100 COVID-19和1431肺炎模型图像和报告的准确性(95.18%11]。Apostolopoulos和Mpesiana pretrained VGG19于700年224 COVID-19,肺炎,和504个常规的图像,结果显示98.75%的准确性(12]。的作者(13)评估127 COVID-19 DarkNet 17卷积层使用,肺炎,500和500正常的图片和报道98.08%的准确性。在[14),CNN的性能提高通过图像预处理算法,导致模型的准确率达到了94.5%。

的作者(1)开发了一种COVID-19分类方法基于两个数据集,一个名为《盗梦空间》的CNN,一个pretrained Imagenet特征提取器,海洋食肉动物算法作为一种功能选择器,然而作为分类器。

第一个数据集包含200积极COVID-19图像和1675负面形象,而第二个数据集包含219积极COVID-19图像和1341负面形象。据报道98.7%精度数据集,数据集1为99.6%,2。通过结合VGG19 Canayaz验证COVID-19诊断模型,ResNet AlexNet, GoogLeNet两metaheuristic算法题为“二进制粒子群优化”和“二进制灰狼优化。“总体分类精度最高的99.38%用于选择二进制灰狼优化后功能从1092年从COVID-19 x射线图像,肺炎,和健康分类记录(15]。

以前作品的一个限制是他们依赖pretrained深网络,需要大量的记忆。此外,许多输入特性加上长时间的检测时间进一步这些方法的缺点。在这项研究中,深入学习方法提出了基于特征选择通过二进制微分进化算法来克服这些限制和改善COVID-19检测。

3所示。方法和模型

图1描述了该模型。最初,美联储卷积神经网络与肺图像。训练后的网络,从理想图像提取的特征。然后使用启发式方法来提取最优特性。因此,COVID-19的三个类,肺炎,和健康的更高的分类精度。

3.1。深的卷积

卷积神经网络用于机器学习作为一个特征提取器和分类方法。卷积网络的输入是原始数据,如图像。网络使用卷积函数自动提取功能。在学习,而不是手动提取功能,矩阵作为过滤器,主要输入图像幻灯片,并通过方程(卷积操作进行1)。最后,经过培训和映射输入图像输出标签,几个卷积层提取特征(16]。 IMG表示输入图像与身高=H宽度=W维度,tc的图像通道的数量,C是过滤矩阵维度,bs偏差值为每个过滤器C, 。

卷积后,多余的值使用ReLU层,然后输入是减少使用池层。有效的输入向量然后传递到完全连接层,功能类似于中长期规划。在深褶积层的最后一节,Softmax [17)、分类层执行分类使用亚当(自适应时刻优化器)18];失去了方程函数如下所示: 在哪里米表示样本大小,表示实际的类米th样本,表示的预测输出类米th输入数据表示正则化系数。

亚当是基于一个梯度优化算法,它使用的指数移动平均梯度和梯度的更新和解决神经网络的权值,有效深层网络问题。深层神经网络由许多层,每个都有自己的一套学习参数,即重量和偏见。最优特征选择算法应用到亚当优化器增加了优化的速度和准确性。

3.2。二进制微分进化

差分进化(DE) (19)是一种启发式演化方法最小化连续问题。二进制微分进化的概念(12)20.特征选择的扩展来解决问题。它由三个不同的建筑,包括变异、交叉和选择。最初,维D用于生成初始种群,在哪里D是优化特征的数量。变异操作,三个随机向量 , ,和选择的向量这样 ,在哪里k是一个人口向量安排。

如果dth向量的维度和是相等的,dth的特征向量的区别(方程(3)是零;否则,它具有相同的值作为向量 :

执行之后,变异和交叉操作,见以下方程: 在哪里W代表了向量,代表交叉多,代表一个随机数。在选择过程中,如果的健身价值向量大于当前的向量 ,它将被取代。否则,当前的向量存储为下一代。

4所示。实验结果

4.1。描述的数据

Canayaz发达COVID-19 x射线数据集,包括三个子组的病人,包括那些与COVID-19患有肺炎,那些是健康的(15]。通过结合数据从这个数据库中,共有364张图片为每个三类得到的平衡数据集(21- - - - - -23]。图像的总数等于类的数量乘以类实例的数量= ,以224×224维度。相同的数据被用于这项研究使用卷积神经网络预测COVID-19疾病和选择最优特性使用二进制微分metaheuristic算法。图2演示了一个代表性样本的三个输出分类:COVID-19,肺炎,和健康。

(一)

(b)

(c)

4.2。绩效评估

该模型在MATLAB运行版本9.1.0.441655 (R2018b)笔记本电脑配备了1.8 GHz处理器和4 gb的RAM。训练后在应用阶段,该方法把每个病人平均29秒,这可以减少通过改进硬件技术。COVID-19预测模型评估使用的准确性,敏感性,特异性,几何平均数,曲线下的面积(AUC-ROC) [24,25)性能指标(方程(6)- (9)),精度是指分类的正确性。的比例正确区分消极的情况下被称为“特异性”,而正确区分阳性病例的比例被称为“敏感性。“几何平均数的第二根敏感性和特异性的产品。更高的值曲线下的面积(AUC)在接受者操作特征表明改进的分类性能。在哪里TP意味着真正的阳性样本的数量正确标记为正FP是假阳性的数量样品,误认为是积极的TN意味着真正的底片是样品的数量是正确地贴上消极FN意味着假阴性的样本数量是误认为是负的

4.3。模型参数

图3说明了深卷积神经网络的网络结构。首先,图像输入层维度 ,和卷积算子使用八3 x3的过滤器。处理后第一个块的网络层,即。,image input, convolution, Batch Normalize, ReLU, max-pooling layers, fully connected layer 400, ReLU, and Drop out, the local features were automatically extracted. Finally, the second network block categorized the input images into three output classes by utilizing three fully connected layers, softmax, and classification. After 200 epochs, the validation accuracy was 97.25% when using the ADAM optimizer, and the minibatch size was 64 (Figure4)。由于神经网络的正规化和街垒过度拟合,批量标准化和辍学。

卷积网络是用于将数据转换成特征向量。考虑到一些网络特性可能会降低模型的性能(1),400年提取特征后完全连接在第一层,二进制微分metaheuristic算法用于选择最优特征子集和消除不必要的功能。二进制微分算法的参数数量= 20,迭代= 100(图5),交叉率1。数量(1 -(几何平均数))的支持向量机分类器26)被认为是人们的健身价值(图5)。二进制微分算法的执行后,340年最佳特征选择。

4.4。性能比较

传统的验证(CV)方法,该方法采用随机抽样,是训练和测试协议用于确定模型的准确性和评估结果进行验证。根据简历的方法,70%的数据被用于培训,15%进行验证,15%用于测试(27,28]。该方法应用于数据,和100年运行进行,防止过度拟合(29日]。所选择的最优特性的微分算法和最初的提取特性从深卷积神经网络输入到支持向量机分类器。

支持向量机分类器的原始的混淆矩阵和优化功能是显示在表1使用培训、测试、验证和数据。

表1描绘了混淆矩阵使用培训、测试、验证和数据总量的SVM分类器的原始特性和优化功能。TP、TN FP、FN、准确性、敏感性,特异性,几何平均数,和AUC指标的三个输出类加上每种类型的测试、培训、验证和数据计算(表2)。

5。讨论

预测疾病可以通过将图像与深神经网络相结合,在深层神经网络可以用来作为特征提取器。图像的大尺寸和体积应用于深层神经网络导致众多特性形成,增加培训和决策时间的预测模型。

该模型所面临的几个设计挑战,包括收集和改善肺图像和网络体系结构,在结构方面,数字,和类型的层,加上metaheuristic算法,初始种群,metaheuristic算法的目标函数类型。的存在效率低下的特点从深海中提取网络可以减少预测模型的精度和效率;因此,使用metaheuristic方法选择最优特性改进模型的记忆,时间,和准确性。

根据表3,该模型实现了精度为99.43%,敏感性为99.16%,特异性为99.57%,99.37%的几何平均数,AUC的0.99和0.1133的均方根误差(RMSE)通过CNN使用x射线图像的特征提取和特征优化使用二进制微分metaheuristic算法。COVID-19分类的准确性问题是计算在这项研究中,99.43%和相关特性的数量是304(表4),然而,在一项研究[15),这些数据被报道为99.38%和448年的特性,分别基于相同的数据。

迁移学习模型训练分类图像和1000个不同类型的对象必须重新训练分类COVID-19检测等具体问题。虽然学习过程等模型提示ResNet SqueezeNet,它们需要预处理输入图像,大小的数据集,并设置多个参数。上层提取颜色和边缘特征,而深层提取复杂特性。过程时间随着层数的增加转移增加学习模型。培训转移学习模式的特征映射和活化层必须定制特定COVID-19问题,这需要大量的记忆。微调pretrained后模型的主成分分析(PCA),可以使用启发式方法选择最优特性,自动编码器或variance-based选择器。最后,整体方法,如支持向量机的组合或其他分类器,可以用来预测COVID-19疾病诊断的准确性。使用semisupervised自学方法可能导致可接受的精度和降低标签的时间。

在未来的工作中,不同的特征选择算法和应用更多的学习者可能会产生改善的结果。随着图像,来自临床试验的参数可以创建一个新的模型与小说相结合的特性诊断疾病,并可能因此预测死亡率。

6。结论

COVID-19感染的人数也在急剧增加。机器视觉技术和人工智能技术在诊断和治疗疾病至关重要。本文的目的是提出一个方法的“COVID-19”问题通过一组肺图像,包括三个类别的肺炎,COVID-19和健康。

深卷积神经网络组成的11层应用于提取特征。二进制微分metaheuristic方法用于选择相关特性和消除不相关的功能。肺部x光图像分类使用支持向量机分类器基于这些最优特性。这项研究表明,相关提取的精度指标和功能比以前的方法使用相同的数据。基于神经网络和metaheuristic特征选择算法,该模型可用于其他各种医学应用。

数据可用性

使用的数据集和分析在当前研究可从相应的作者以合理的要求。

伦理批准

本文不包含任何数据或其他信息来源于研究或实验涉及人类或动物主题。

不适用。

的利益冲突

作者宣称没有利益冲突。

作者的贡献

Iraji Feizi-Derakhshi提出了图像分析算法;Iraji实现算法并分析了实验结果;Tanha提供临床指导;和Iraji Feizi-Derakhshi, Tanha结果进行验证。最后的手稿是阅读和批准所有作者。

确认

作者希望表达他们的感谢所有参与者。

引用

a . t . Sahlol d . Yousri a . a .母羊m·a·a . Al-Qaness r . Damasevicius和m . a . Elaziz”COVID-19图像分类算法使用深特性和分数阶海洋捕食者,”科学报告,10卷,不。1,第15415 - 15364页,2020。
视图: 出版商的网站 | 谷歌学术搜索
霍克n、d . k . Bhattacharyya和j . k . Kalita”MIFS-ND:互信息特征选择方法,”专家系统与应用程序第41卷。。14日,第6385 - 6371页,2014年。
视图: 出版商的网站 | 谷歌学术搜索
p . Lambin e . Rios-Velazquez r . Leijenaar et al .,“Radiomics:从医学图像中提取更多的信息使用高级特性分析,“欧洲癌症杂志,48卷,不。4、441 - 446年,2012页。
视图: 出版商的网站 | 谷歌学术搜索
d . y . Chong, h·j·金,p . Lo et al .,“Robustness-driven分类特征选择的纤维间质性肺疾病模式在计算机断层扫描使用3 d纹理特性,”IEEE医学成像,35卷,不。1,第157 - 144页,2015。
视图: 谷歌学术搜索
美国r . Acharya s·l·费尔南德斯,j . e . WeiKoh et al .,“阿尔茨海默病大脑使用MRI图像的自动检测和各种特征提取技术研究,“医疗系统杂志,43卷,不。9篇文章ID 302 2019。
视图: 出版商的网站 | 谷歌学术搜索
a . Afzali f . b . Mofrad, m . Pouladian”contour-based结核病检测特征选择从胸部x光图像,”书Contour-Based结核病检测特征选择从胸部x光图像IEEE,页194 - 198年,皮斯卡塔韦,新泽西,美国,2019年。
视图: 谷歌学术搜索
f·达·席尔瓦,m . x里贝罗j . d。e . s .巴蒂斯塔否决权,c . Traina Jr和a . j . m . Traina”改善医学图像检索的质量排名使用遗传特征选择方法,”决策支持系统,51卷,不。4、810 - 820年,2011页。
视图: 出版商的网站 | 谷歌学术搜索
d·s·约翰逊,d l l·约翰逊,p . Elavarasan和a . Karunanithi”特征选择使用花授粉优化诊断肺癌的CT图像,”书特征选择使用花授粉优化诊断肺癌的CT图像施普林格,页604 - 620年,柏林,德国,2020年。
视图: 谷歌学术搜索
大肠工作流管理。是欣但,m . a . Shouman和m . e . Karar”COVIDx-net:一个框架的深度学习分类器来诊断COVID-19 x射线图像,”2020年,https://arxiv.org/abs/2003.11055。
视图: 谷歌学术搜索
m . Toğacar b Ergen, z . Comert”COVID-19检测使用深度学习模型利用社会模拟优化和结构化的胸部x光图像使用模糊颜色和叠加方法,”计算机在生物学和医学文章ID 103805卷,121年,2020年。
视图: 出版商的网站 | 谷歌学术搜索
谢j . Zhang y, y, c .沈和y .夏,“COVID-19筛查在胸部x光图像使用基于深度学习的异常检测,”2020年,https://arxiv.org/abs/2003.12338。
视图: 谷歌学术搜索
拿身份证Apostolopoulos和t . a . Mpesiana COVID-19:自动检测x射线图像利用转移与卷积神经网络学习,”医学物理和工程科学,43卷,不。2、635 - 640年,2020页。
视图: 出版商的网站 | 谷歌学术搜索
t . Ozturk m . Talo e·a·Yildirim美国b . Baloglu o . Yildirim Rajendra Acharya和美国“自动检测COVID-19病例使用深层神经网络和x射线图像,”计算机在生物学和医学文章ID 103792卷,121年,2020年。
视图: 出版商的网站 | 谷歌学术搜索
m . Heidari对伊朗伊斯兰共和国通讯社表示,s . Mirniaharikandehei a . z . Khuzani g . Danala y秋和b .郑”提高CNN的性能预测的可能性COVID-19用胸部x光图像预处理算法,”国际医学信息学杂志》上文章ID 104284卷,144年,2020年。
视图: 出版商的网站 | 谷歌学术搜索
m . Canayaz“MH-COVIDNet:诊断COVID-19使用深层神经网络和meta-heuristic-based x射线图像特征选择,”生物医学信号处理和控制文章ID 102257卷,64年,2020年。
视图: 出版商的网站 | 谷歌学术搜索
y高,t·朱,徐x”骨龄评估基于深卷积神经网络与分割、合并”国际计算机辅助放射学杂志和手术,15卷,不。12日,第1962 - 1951页,2020年。
视图: 出版商的网站 | 谷歌学术搜索
k . Adem s Kilicarslan, o . Comert”分类和诊断宫颈癌和堆叠autoencoder softmax分类,“专家系统与应用程序卷,115年,第564 - 557页,2019年。
视图: 出版商的网站 | 谷歌学术搜索
m . Khaire和r . Dhanalakshmi“高维微阵列数据集分类优化器使用一种改进的亚当(iAdam)”环境智能和人性化计算杂志》上,11卷,不。11日,第5204 - 5187页,2020年。
视图: 出版商的网站 | 谷歌学术搜索
r . Storn和k .价格“微分进化简单和高效的启发式全局优化的连续空间,”杂志的全局优化,11卷,不。4、341 - 359年,1997页。
视图: 出版商的网站 | 谷歌学术搜索
大肠Zorarpacı和s . A·泽尔“微分进化的混合方法和人工蜜蜂殖民地特征选择,”专家系统与应用程序卷,62年,第103 - 91页,2016年。
视图: 谷歌学术搜索
j·p·科恩·莫里森l . Dao k·罗斯,t .问:Duong和m . Ghassemi”COVID-19图像数据收集:前瞻性预测未来,”2020年,https://arxiv.org/abs/2006.11988。
视图: 谷歌学术搜索
m . e . Chowdhury t·拉赫曼a Khandakar et al .,“人工智能可以帮助筛选病毒和COVID-19肺炎?“2020,https://arxiv.org/abs/2003.13145。
视图: 谷歌学术搜索
d . Kermany k . Zhang, m . Goldbaum”标签的光学相干断层扫描(OCT)和胸部x光图像分类,“Mendeley数据,2卷,2018年。
视图: 出版商的网站 | 谷歌学术搜索
a·a·法拉克a .阿里s Elshazly和a·a·法拉克,”功能对肺结节融合分类,国际计算机辅助放射学杂志和手术,12卷,不。10日,1809 - 1818年,2017页。
视图: 出版商的网站 | 谷歌学术搜索
江z, j . h,周et al .,“发展深度上优于图像资格验证系统的检测和过滤掉不合格的眼底图片:一项多中心研究中,“国际医学信息学杂志》上文章ID 104363卷,147年,2021年。
视图: 出版商的网站 | 谷歌学术搜索
l . l .徐x Wang白et al .,“概率支持向量机分类器系综选择基于GMDH-type神经网络,”模式识别文章ID 107373卷,106年,2020年。
视图: 出版商的网站 | 谷歌学术搜索
o .呃,a·c·Tanrikulu a . Abakay f . Temurtas,“一种基于概率神经网络的方法对间皮瘤的诊断疾病,”计算机与电气工程,38卷,不。1,第81 - 75页,2012。
视图: 出版商的网站 | 谷歌学术搜索
h . Temurtas: Yumusak, f . Temurtas”比较研究糖尿病疾病诊断使用神经网络,”专家系统与应用程序,36卷,不。4、8610 - 8615年,2009页。
视图: 出版商的网站 | 谷歌学术搜索
l . i Kuncheva结合模式分类器:方法和算法新泽西州霍博肯市约翰·威利& Sons,美国,2014年。

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

2015年

下载

991年

引用

复杂性