肺炎是一种很常见的和致命的疾病,需要确定初始阶段为了防止病人有这种疾病更大的伤害,帮助他/她在拯救他/她的生活。各种技术用于肺炎的诊断包括胸部x光,CT扫描,血培养、痰培养、液体样品,支气管镜检查,脉搏血氧仪。医学图像分析起着至关重要的作用在即等各种疾病的诊断,COVID-19,肺炎等,被认为是吉祥的研究领域之一。分析胸部x光图像准确,需要专家放射科医师拥有所需的领域的专业知识和经验。据世界卫生组织(世卫组织)报告,世界上三分之二的人仍然没有访问放射科医生,以诊断疾病。本研究提出了一个DL框架诊断肺炎疾病在一个高效和有效的方式。各种深卷积神经网络(DCNN)转移学习技术,如AlexNet SqueezeNet, VGG16, VGG19, Inception-V3用于从胸部x光图像中提取有用的特性。在这项研究中,几个机器学习(ML)分类器是利用。拟议的系统训练和测试在胸部x光片和CT图像数据集。为了检验该系统的稳定性和有效性,不同的性能已经利用措施。 The proposed system is intended to be beneficial and supportive for medical doctors to accurately and efficiently diagnose pneumonia disease.
慢性病和传染病已经大量的人的生活,创造了许多危机的国家,这对一个国家需要很长时间恢复这两个重大疫情造成的损失。一些疾病,提升在特定时间段内的人口是称为暴发和流行
肺炎是一种传染性的疾病,只要能气囊在单一或两肺引起的真菌,细菌和病毒(
肺炎感染和正常的肺。
在2017年,超过850000人死于肺炎。由于肺炎死亡比率非常高在南亚和撒哈拉以南非洲地区。根据2017年发表的一份报告,死亡比率在五个国家,即。,巴基斯坦,India, Ethiopia, Nigeria, and the Republic of Congo, was more than half of the deaths from childhood pneumonia and was called the ultimate disease of poverty [
从肺炎死亡率在世界各地按年龄从1990年到2017年(
在21世纪的开端,有几个冠状病毒通过物种栅栏在人类产生致命的肺炎。为了知道这些致命的流行病的起源和发展,专家们需要检查结构的病毒,这种病毒如何导致感染的方法。此外,这样做将有助于专家在找到合适的解决方案和提供适当的治疗和可能发展疫苗(
随着时间的推移过去疫情发生。
| 流行的名字 | 持续时间 | 接近死亡 |
|---|---|---|
| 安东尼瘟疫 | 170 - 180 | 500万年 |
| 布拉格的查士丁尼 | 541 - 543 | ~几百万 |
| 日本天花爆发 | 734 - 736 | 120万年 |
| 黑死病 | 1349 - 1353 | 2亿年 |
| 天花爆发 | 1520 + | 56 -万 |
| 意大利瘟疫爆发 | 1628 - 1630 | 100万年 |
| 黄热病(美国) | 1886 - 1891 | 150万年 |
| 西班牙流感 | 1918 - 1920 | 45 - 50几百万 |
| 第三瘟疫(中国和印度) | 1985 + | 1200万年 |
| 亚洲流感 | 1959 - 1960 | 120万年 |
| 艾滋病毒/艾滋病 | 1980 -至今 | 实现了几百万 |
| “非典” | 2002 - 03 | 700 - 800 |
| 猪流感 | 2009 - 10 | 020万年 |
| 埃博拉病毒 | 2014 - 2017 | 10000 - 11000 |
| 即 | 2015 -至今 | 860年 |
| COVID-19 | (2019)- 12/04/2021 | 294万年 |
严重急性呼吸系统综合症冠状病毒(冠)
中东的呼吸系统综合症冠状病毒(MERS-Cov)呼吸是一种病毒感染产生的病毒(
如今,世界正面临着一个危险的大流行发生由于病毒和COVID-19命名,承认2019年12月,第一次在中国,武汉省,导致很多人的死亡
医学图像分析起着至关重要的角色在即等各种疾病的诊断,Covid-19,肺炎,等,和被认为是一个吉祥的方法(
剩下的纸是组织如下。部分
肺炎是一种致命的疾病,对儿童和老年人人更危险。Toğacar et al。
Behzadi-Khormouji et al。
医学影像在众多疾病的识别中扮演着重要部分(
下面的小节描述了资源使用和随后的方法开展研究。
一个自动化的发展和智能系统广泛依赖于数据集的问题。这意味着问题特定的数据集有一个非常高的影响一个智能模型的效率。考虑到数据集的意义,胸部x光片和CT图像数据集使用网上在UCI Kaggle数据库。总共5856张图片的数据集包含两类/类,即。、肺炎和正常图像。图像数据集包含1583正常和4273肺炎。数据集分布在两部分(培训和测试),70%的数据用于训练模型,而30%的数据用于测试和验证模型。图
胸部x光图像的一个例子(a)正常,(b)肺炎。
提出系统的主要目的和目标来诊断一个人是否有肺炎或不是在早期阶段通过胸部x光图像,以防止更大的伤害。在这项研究中,最近的DCNN架构调整版本的基础上(CNN, AlexNet、SqueezeNet VGG16, VGG19,和《盗梦空间》V3)用于从图像中提取有用的特性。使用几种预处理技术,为了显示数据分类模型的标准化形式。各种毫升分类模型等资讯,支持向量机,LR, NB, AB,安被用于这项研究。不同的性能评估指标的计算来衡量和跟踪每个利用毫升模型的性能。Keras深度学习框架部署使用TensorFlow后台的建设和培训我们的提出的系统。使用的库和包的实现包括TensorFlow, Keras, Sklearn, Matplotlib Seaborn, NumPy。所有的实验都使用水蟒的Jupyter笔记本执行集成开发环境(IDE)。图
提出了肺炎识别框架。
数据预处理是一个至关重要的技术用于提供数据以有组织的方式分类模型,然后在使用规范化训练和测试数据。视觉信息质量的提高(去除噪声,增加对比度,删除高或低频率,等等)的每个输入图像,这些图像预处理的帮助下许多技术被用于分类器之前。强度归一化等预处理技术,对比有限的自适应直方图均衡化(CLAHE)和Min-Max规范化进行了调查研究。强度归一化、CLAHE Min-Max正态分布是有趣和重要的预处理技术在图像处理应用程序。图
图像预处理技术:应用之前和之后(a), (b)正常化,和(c) CLAHE。
看数据集代表两类,即。,pneumonia and normal images, almost 75% of the images represent pneumonia and the remaining 25% describe normal images which means that the dataset is imbalanced. To resolve the issue of unbalanced dataset and overfitting and to increase the accuracy of the models, various augmentation techniques have been used. The data augmentation techniques used include geometric transformations like rotations, zooms, rescale, shift, flips, and shears.
CNN是一个流行的深度学习模型尤其用于图像分类问题。它通常由五层组成,包括输入层、卷积层、汇聚层,完全连接层和输出层。CNN的实际援助有参数大大减少所花费的时间少了学习和减少训练模型所需的数据量。此外,可以训练CNN的端到端从图像特征的提取和选择,最后,可以用来预测或分类的图像。知道网络似乎有点难理解或进程一个图像,但功能征服在网络的各层执行更好的匹配与人类特性(
CNN模型的基本架构。
CNN架构用于研究中的实验工作有以下属性:
输入层:使用x射线图像作为输入,并在输入层提供。图像尺寸保存
卷积卷积层:我们使用3层
池层:我们使用max池计算每个特性的最大值在每一块地图。max-pooling大小设置为2×2步使用的值是2.0。
完全连接层:这一层用于拟议的架构利用外层乙状结肠激活函数。
输出层输出层:给我们预测的结果是否有肺炎的人。
DL架构广泛应用于图像处理特别是在医疗诊断各种疾病。这些DL技术从图像中提取有用的特性和现在他们的模型进行进一步的调查。在这里,在我们的研究中,我们使用五个重要DL架构如AlexNet VGG16, VGG19 Inception-V3, SqueezeNet。简要描述了DL架构给出以下。
AlexNet是CNN的类型,包括各层等输入,卷积,马克斯池、致密层和输出层,它的基本构建块。在2012年,它获得了ILSVRC竞争。它解决了输入图像的图像分类问题是1000种不同的类,这些类的输出是一个矢量。的
VGG(视觉几何组)是一种CNN架构首次提出在2014年由两位研究者Simonyan和Zisserman [
初始模型是一种深层神经网络(款)体系结构由一个名叫Szegedy研究员等人在2014年首次被任命为《盗梦空间》的模型(
SqueezeNet深神经网络是一种由斯坦福大学的研究人员开发的,并在2016年2月22日发布的第一次。这是一个类型的CNN架构组成的18层,特别是用于计算机视觉和图像处理。作者的主要目标和目标发展中SqueezeNet创建一个小的神经网络,由参数较少,很容易融入计算机内存(需要更少的内存),并且可以更容易通过计算机网络传输(需要较少的带宽)。首先,这个架构实施的最初版本的DL框架命名的咖啡。很短的一段时间后,研究人员开始使用这个架构的开源DL框架。SqueezeNet首先标记在一篇论文中提到与AlexNet相比,它实现了AlexNet水平精度与“少50 x”参数。AlexNet包含240 MB参数而SqueezeNet由仅5 MB的参数。SqueezeNet和AlexNet是两个不同的架构,款,他们只有一个共同点,即。时,其准确性评估ImageNet图像数据集。
各种毫升分类算法研究了诊断一个人是否有肺炎疾病或不是。每个分类算法都有自己的重要性,其意义从应用程序到应用程序。摘要6遥远的分类算法的性质,即资讯,支持向量机,LR, NB, AB,应用和安,为了选择最好的和广义预测模型。
为了追踪每个分类器的性能在这项研究中,使用几个性能措施利用如准确性、特异性、敏感性,
混淆矩阵。
| 预测(−) | 预测(+) | |
|---|---|---|
| 实际(−) | TN | 《外交政策》 |
| 实际(+) | FN | TP |
所有的上述公式进行混淆矩阵由以下基本组件:
真阳性(TP):这意味着模型预测是积极和事实上人肺炎。因此,主题是正确的诊断肺炎模型。
真阴性(TN):这意味着模型预测是负的,事实上没有肺炎疾病的人。因此,一个健康的人正确地诊断分类模型。
假阳性(FP):这意味着模型做了一个错误的预测分类肺炎病人健康的人。这也被称为1型错误。
假阴性(FN):这意味着模型做了一个错误的预测分类肺炎病人健康。这也被称为2型错误。
各种毫升分类算法的仿真结果通过使用不同的DL架构如AlexNet SqueezeNet, VGG-16, VGG-19, Inception-V3将在本节中讨论。这些DL架构,也称为转移学习技术,从图像中提取有用的特性是非常有用的分类正常和肺炎患者在一个有效的方法。所有利用毫升分类器的性能。,KNN, SVM, LR, NB, AB, and ANN, was checked on the pneumonia chest X-ray dataset on full feature space generated by the transfer learning techniques. For measuring the performance of ML classifiers, different performance measures are used. In addition, preprocessing techniques are also applied to all features before being used by the classification algorithms.
本节代表实验结果获得的CNN分类算法。我们执行多个实验基本CNN模型通过使用各种数字时代。首先,我们使用100时代,然后150时代,最后,我们用200时代,时代的准确性增加0到10时代,和之后,变得稳定,保持92.30%。图
ROC曲线的卷积神经网络(CNN)分类算法。
这部分是通过所有的仿真结果进行了利用毫升分类学习算法使用AlexNet传输技术。表
所有分类器的性能使用AlexNet传输学习架构。
| 分类模型 | 精度 | 灵敏度 | 特异性 | AUC |
|
世纪挑战集团 |
|---|---|---|---|---|---|---|
| 然而,( |
94.10 | 95.40 | 90.08 | 96.76 | 0.94 | 0.73 |
| 支持向量机(rbf) | 51.13 | 54.52 | 50.98 | 53.45 | 0.54 | 0.51 |
| 支持向量机(线性) | 88.65 | 92.98 | 72.53 | 88.94 | 0.85 | 0.70 |
| AB | 89.72 | 92.63 | 80.74 | 86.62 | 0.89 | 0.73 |
| 注 | 87.89 | 87.56 | 88.62 | 92.68 | 0.88 | 0.72 |
| LR | 95.94 | 96.98 | 91.40 | 98.42 | 0.95 | 0.89 |
| 安 | 96.44 | 96.82 | 92.62 | 98.84 | 0.96 | 0.91 |
表
图
所有分类器的性能使用AlexNet传输学习技术。
图
图
ROC曲线的6毫升学习分类器使用AlexNet传输技术。
从数据
实验结果和表演的所有利用6毫升分类器,利用SqueezeNet转移学习技术,将在本节讨论。转移学习技术用于从图像中提取有价值的特性,然后现在的分类器进行分类。表
所有分类器的性能使用SqueezeNet传输学习架构。
| 分类模型 | 精度 | 灵敏度 | 特异性 | AUC |
|
世纪挑战集团 |
|---|---|---|---|---|---|---|
| 然而,( |
95.16 | 96.44 | 91.05 | 97.80 | 0.95 | 0.73 |
| 支持向量机(rbf) | 52.03 | 55.43 | 51.88 | 54.33 | 0.55 | 0.52 |
| 支持向量机(线性) | 88.71 | 93.96 | 73.37 | 89.85 | 0.86 | 0.70 |
| AB | 90.12 | 93.13 | 81.43 | 87.34 | 0.90 | 0.74 |
| 注 | 88.51 | 88.23 | 89.26 | 93.20 | 0.89 | 0.73 |
| LR | 96.24 | 97.62 | 91.94 | 99.20 | 0.96 | 0.90 |
| 安 | 96.97 | 97.52 | 92.99 | 99.40 | 0.97 | 0.92 |
表
图
所有分类器的性能使用SqueezeNet传输学习技术。
图
图
ROC曲线的6毫升学习分类器使用SqueezeNet传输技术。
实验结果和表演的所有6毫升分类算法使用VGG-16传输学习本节中描述的技术。表
所有分类器的性能使用VGG16传输学习技巧。
| 分类模型 | 精度 | 灵敏度 | 特异性 | AUC |
|
世纪挑战集团 |
|---|---|---|---|---|---|---|
| 然而,( |
95.41 | 96.00 | 93.66 | 98.32 | 0.95 | 0.88 |
| 支持向量机(线性) | 81.72 | 81.23 | 82.99 | 87.33 | 0.83 | 0.59 |
| 支持向量机(rbf) | 50.30 | 86.24 | 47.42 | 69.30 | 0.70 | 0.35 |
| AB | 90.12 | 93.57 | 80.01 | 86.82 | 0.90 | 0.74 |
| 注 | 86.50 | 84.41 | 92.69 | 94.10 | 0.87 | 0.70 |
| LR | 96.82 | 97.80 | 94.03 | 99.51 | 0.97 | 0.92 |
| 安 | 96.56 | 97.52 | 93.28 | 99.22 | 0.97 | 0.91 |
从表
所有6毫升分类模型的性能,使用VGG-16传输学习技术,如图所示
学习表演的分类器使用VGG16传输技术。
图
ROC曲线的6毫升学习分类器使用VGG16传输技术。
本节展示了性能和实验结果通过所有6毫升分类模型学习使用VGG-19传输技术。转移学习技术从图像中提取有用的特性,然后现在的分类器进行进一步处理。所有6毫升分类模型的性能提出了表
所有分类器的性能使用VGG19传输学习技巧。
| 分类模型 | 精度 | 灵敏度 | 特异性 | AUC |
|
世纪挑战集团 |
|---|---|---|---|---|---|---|
| 然而,( |
96.10 | 96.09 | 94.11 | 97.89 | 0.96 | 0.89 |
| 支持向量机(线性) | 84.70 | 82.20 | 84.89 | 87.55 | 0.85 | 0.61 |
| 支持向量机(rbf) | 50.32 | 84.30 | 48.80 | 69.60 | 0.69 | 0.36 |
| AB | 92.42 | 90.27 | 82.10 | 86.92 | 0.91 | 0.75 |
| 注 | 88.40 | 86.33 | 93.09 | 94.60 | 0.89 | 0.72 |
| LR | 96.92 | 97.60 | 94.79 | 98.91 | 0.97 | 0.91 |
| 安 | 97.01 | 97.62 | 93.80 | 99.12 | 0.97 | 0.92 |
表
图
学习表演的分类器使用VGG19传输技术。
图
ROC曲线的6毫升学习分类器使用VGG19传输技术。
的性能和实验结果获得通过所有6毫升分类器使用Inception-V3 DL架构将在本节讨论。所有6毫升分类模型的性能使用Inception-V3体系结构见表
所有分类器的性能使用Inception-V3传输学习技巧。
| 分类模型 | 精度 | 灵敏度 | 特异性 | AUC |
|
世纪挑战集团 |
|---|---|---|---|---|---|---|
| 然而,( |
94.20 | 94.24 | 94.03 | 97.80 | 0.94 | 0.85 |
| 支持向量机(线性) | 85.02 | 92.03 | 86.41 | 87.33 | 0.85 | 0.78 |
| 支持向量机(rbf) | 50.30 | 84.23 | 48.39 | 50.20 | 0.74 | 0.33 |
| AB | 87.40 | 91.33 | 78.91 | 83.62 | 0.87 | 0.67 |
| 注 | 91.50 | 90.89 | 93.13 | 95.90 | 0.92 | 0.80 |
| LR | 97.08 | 97.90 | 94.33 | 99.52 | 0.97 | 0.92 |
| 安 | 97.19 | 97.88 | 94.92 | 99.53 | 0.97 | 0.92 |
表
所有6毫升分类模型的性能使用Inception-V3传输学习技术是显示在图
学习表演的分类器使用Inception-V3传输技术。
世纪挑战帐户集团和
ROC曲线的6毫升学习分类器使用Inception-V3传输技术。
所有五个利用DCNN转移学习技术的性能和6毫升分类算法使用不同的绩效评估指标评价了如上所述。从上述结果,很明显,Inception-V3和安中表现出色,获得了分类精度为97.19%,敏感性为97.92%,特异性为94.92%,AUC为99.53%,
此外,提出了系统的比较研究进行之前的ML和DL方法在过去(
提出了系统的比较研究和之前的方法。
| 出版物 | 方法 | 精度(%) |
|---|---|---|
| Kermany et al。 |
卷积神经网络(CNN) | 92.81 |
| Stephen et al。 |
DL模型4 conv-layers密度和2层 | 93.71 |
| Saraiva et al。 |
DL模型6 conv-layers密度和3层 | 95.29 |
| 梁和郑 |
DL密度模型和48 conv-layers 2层 | 96.01 |
| 吴et al。 |
CNN +随机森林 | 96.70 |
| 该方法 | 智能框架(Inception-V3 +安) | 97.19 |
表
肺炎是一种感染性疾病和非常危险的年龄和是专门为吸烟者更危险,酗酒者,最近的手术病人,哮喘患者,免疫系统低下的人,拥有一个不到5岁的孩子。肺炎可浓缩造成的死亡比率,如果病人诊断在初始阶段,按时提供药物和治疗。本研究提出了一种毫升,DL-based智能预测系统的诊断肺炎。胸部x光片和CT图像数据集用于训练和测试的系统。为了提高质量的每个输入图像的视觉信息,各种强度归一化等预处理方法,CLAHE, Min-Max正常化被用于这项研究。5调整版本的DL转移学习技术,如AlexNet SqueezeNet, VGG-16, VGG-19, Inception-V3利用从x射线图像中提取有用的特性,然后提出的分类器进行进一步处理。六个命令式毫升分类算法如资讯、NB,安,支持向量机,LR, AB是用来检查系统的效率。众多绩效评估措施,包括分类精度、灵敏度、特异性,
所有数据是可用的。
作者宣称没有利益冲突。
本文得到了塔伊夫大学的研究人员支持项目TURSP-2020/126数量,塔伊夫大学,塔伊夫,沙特阿拉伯。