文摘

新型冠状病毒(COVID-19)是一种新型冠状病毒,首次发现在集群SARS-CoV-2病毒引起的肺炎症状。它快速传播世界各地。大多数感染者会出现轻度至中度疾病和恢复无需住院。目前,实时定量一(rqRT-PCR)是受欢迎的冠状病毒检测由于其高特异性、简单的定量分析,比传统的rt - pcr和更高的灵敏度。抗原测试也被广泛使用。这是非常基本的自动检测COVID-19公开可用的资源。胸部x光片(CXR)图像用于COVID-19的分类,正常,病毒性肺炎病例。CXR分为图像子块寻找出每个子块的离散余弦变换(DCT)的方法。为了产生一个为每个CXR图像压缩版本,使用DCT的能量压缩功能。对于每一个图像,几乎没有几个光谱DCT组件作为特征。 The dimension of the final feature vectors is reduced by scanning the compressed images using average pooling windows. In the 3-set classification, a multilayer artificial neural network is used. It is essential to triage non-COVID-19 patients with pneumonia to give out hospital resources efficiently. Higher size feature vectors are used for designing binary classification for COVID-19 and pneumonia. The proposed method achieved an average accuracy of 95% and 94% for the 3-set classification and binary classification, respectively. The proposed method achieves better accuracy than that of the recent state-of-the-art techniques. Also, the time required for the implementation is less.

1。介绍

COVID-19或coronavirus-infected病人将经历轻度至中度呼吸系统疾病,有时可能会导致肺炎。为了限制冠状病毒的广泛,早期发现COVID-19是很重要的。检测COVID-19,聚合酶链反应(PCR)是应用最广泛的技术。发现PCR的灵敏度很低(1]。此外,PCR是耗时的,不是很准确2]。跟踪的病理特征的CXR COVID-19疑似患者(3,4),胸部x线摄影在全球执行诊断。不幸的是,CXR异常引起的COVID-19类似于病毒性肺炎(5,6]。为了检测和区分COVID-19和肺炎,自动化是必需的。

人工智能,如机器和深度学习,用来实现这种自动化基于CXR [7]。深度学习的方法来检测COVID-19和病毒性肺炎是实现文献[8用高精度实现resnet - 101。ResNet-50架构以及SVM分类器也产生良好的准确性(9]。Makris et al。10)雇佣几个卷积神经网络(CNN)模型和分类COVID-19相比他们的表演,肺炎,和正常的图像(10]。阿西夫et al。11]训练InceptionV3利用转移学习技术来区分COVID-19病毒性肺炎和正常CXR并获得精度高。Das et al。12使用统计平均值)开发了一个有趣的模型学习使用三个pretrained CNN网络;DenseNet201、Resnet50V2 InceptionV3达到很高的精度和灵敏度。Ridhi et al。13)分类COVID-19、肺炎和正常CXR用人堆DenseNet GoogleNet。古普塔et al。14)实现一个CNN网络称为InstaCovNet-19整合几个深网络和实现高精度在二进制(COVID-19比non-COVID-19)和三级分类(COVID-19、肺炎和正常)。另一个CNN网络提出了在文献[15)为二进制实现高精度,三级和四级分类。Canayaz et al。16)提出了一个诊断COVID-19使用深层神经网络和metaheuristic-based特征选择,取得了很高的精度。Khuzani et al。17应用灰度共生矩阵建立]采用特征提取使用空间域(,GLDM,和纹理),spectral-domain (FFT)和spaciospectral-domain美联储(小波变换)变换为三级前馈神经网络分类、COVID-19,肺炎,和正常17]。它显示了引用(17)特性与光谱相关领域有更好的预测能力比其他组(空间和spaciospectral)关于COVID-19预测从CXR图像。这里值得一提的是,模糊性可能引入的CXR图像采样技术,由于从三维转换到循环水可能需要实现的模糊图像技术来增强对比度和之前CXR边缘图像分类(18,19]。

这项工作提出了一种新颖有效的方法,三级分类,COVID-19,正常,肺炎。该方法使用的能量压缩属性DCT压缩spectral-domain特征提取。剩下的纸是组织如下:部分2总结了DCT的基本性质。提出的技术说明部分3。讨论了部分4阐述该技术的主要优势在目前最先进的方法。最后,部分5总结了工作。

2。离散余弦变换

DCT包含真正的正弦曲线,有许多有趣的特性。除了它的正交结构,DCT具有良好的能量集中特性。只有10%的DCT谱组件包含大约90%的总信号功率(20.]。因此,DCT是多媒体图像和视频压缩的核心技术,如联合摄影专家组(JPEG)和电影专家集团(MPEG)压缩标准(21]。此外,DCT具有良好decorrelating固有属性,可以用来减少之间存在高度的相关性,图像的行和列(22]。矩阵的元素T的情况下的一维DCTN有效输入向量可以定义如下21]:

否则。

DCT的另一个优点是它的二维可分性。如果X是一个输入图像,那么它的表示吗Y二维DCT变换域的可以计算如下(20.]:

频段现代图像应用程序输入图像分割成8×8块。因此,8×8 DCT给予特别考虑提供近似,计算简单。自从Haweel[的开创性工作20.]研究了DCT近似只需要24添加,其他文献中介绍了近似。所有有效的近似的比较研究一直在分析文献[22]。

3所示。提出技术

3.1。数据集

使用数据集包含COVID-19-positive CXR图像的情况下,正常,病毒性肺炎病例。这些CXR照片是拉希德医院放射科在阿联酋的迪拜。平衡组三组的选择,每个包含600 CXR图像。JPEG格式的图像尺寸1024×1024像素。

3.2。特征提取

所有图像大小为256×256灰度级,和每一个图像扫描的8×8面具。二维DCT计算每个蒙面块使用方程(2)。最高的64光谱成分,只有8像素变换(左上)保留所有其他改变像素被丢弃。也就是说,所有图片压缩了8倍。为了说明CXR压缩图像的质量,丢弃的像素调到零位,蒙面块转换到空间域(20.]。

1显示原始图像和压缩重构图像的三种情况。压缩图像的主观质量是显而易见的。百分比误差能量范数(锤头)被计算为一个客观衡量压缩引起的退化。锤头是定义如下(20.]: 在哪里(,n)是原CXR形象和红外(,n)是重建图像(压缩)。

1说明了锤头的三个案例表明,他们都低,几乎相等。因为这轻微的退化由于压缩为三套几乎是相同的,在分类舞台上压缩的影响可以忽略不计。

作为进一步的证据的低影响CHX图像DCT压缩,峰值信噪比(PSNR)估计的三种情况。PSNR定义如下(22]:

23例显示了PSNR。保留最高8转换每个8×8块的像素连接形成一个频段,所以压缩图像大小现在32×256。池平均窗口的面具4×4每压缩执行两次。在第一次运行,生成图像的平均尺寸是8×64年,在第二次运行,大小是2×16。最后平均图像夷为平地产生32-feature向量在每个类为每个CXR形象。图2说明了特征提取方法。

3.3。正常、COVID-19和肺炎的分类

采用前馈神经网络分类三组,如图3。输入层神经元是32 32-feature对应向量。两个隐藏层和50个和20个神经元,分别使用。隐藏层神经元的数目是最佳性能优化。输出层有3个神经元对应的三个分类集。上面的输出神经元(的值为1)如果32-feature向量对应于正常组,中间神经元COVID-19特征向量,最后,最后输出神经元在肺炎的特征向量所示(6),O是输出(目标)矩阵。

转移函数的神经元连接第二个隐层神经元的输出log-sigmoid由于swing的输出是在0和1之间。

Levenberg-Marquardt算法神经网络用于更新建议。像Levenberg-Marquardt拟牛顿方法,算法设计方法二阶训练速度,而无需计算海赛矩阵(23]。海赛矩阵,H,可以近似如下23]: 和梯度可以估计如下23]: 在哪里J是雅可比矩阵,包含网络的一阶导数对重量和偏见和错误吗e是一个向量的网络错误。Levenberg-Marquardt算法使用这种近似在以下Newton-like海赛矩阵更新最小化均方误差(MSE) [23]: 在哪里µ是一个适应变量。Levenberg-Marquardt是快速和更准确的附近一个误差最小µ附近是高度降低最低(24]。输入的数量CXR图像用于训练从每个类是500图片(共有15000张图片)。MSE学习曲线如图4在靠近最小均方误差的快速收敛性是显而易见的。训练算法达到88−90 dB的MSE时代。这个目标MSE是设置一个修道院停止培训项目作为收敛的迹象。图5显示的变化µ在训练阶段。一开始的价值µ是1 e−3和终值是1 e−15。它也指出µ目标最小MSE附近已经大大减少了。验证测试执行,确保使用神经网络没有overfit或underfit输入数据(特征源自3 CXR图像)。

收敛的神经网络已经从每个类测试使用100张图片(共有300张图片)。作为指示测试阶段的技术,提出五个测试输出向量对应真阳性COVID-19 CXR情况下表中列出3,它显示了几乎1和0在预期的位置。

3.4。COVID-19和肺炎的分类

在很多情况下,CXR表示怀疑主题和目标分类主题要么是COVID-19情况下,需要特别的照顾,或只是一个肺炎病例(25,26]。由于这个原因,一个二进制分类会话的数据集上进行了COVID-19和肺炎。第二个平均池4×4块3的方案图2已经减少到2×2,有128个样本特征向量。这个增加的特性向量是必要的跟踪小COVID-19 [CXR图像之间的差异27,28)和肺炎和提高二进制分类的准确性。进一步跟踪和学习二元波动,隐藏层已经增加到70,30个第一和第二个隐藏层,分别如图67

再次,隐层神经元的数目已经优化了更好的性能,和验证检查,以避免underfitting或过度拟合。的学习曲线收敛−70分贝的目标使用Levenberg-Marquardt算法如图8

3.5。性能

混淆矩阵通常用于评估网络的分类性能。表4说明了混淆矩阵的元素。通常采用以下指标;准确度,精密度,召回(灵敏度),F1-score [7,29日]。在平衡的数据集的情况下多级分类,为例,这些指标,通常,定义如下30.]: 在哪里类的总数(在本研究= 3)= 1,2,3,相应的正常,COVID-19,分别和肺炎。为每个类单独找到指标,使用的表达式是分子没有除以。该方法的估计指标见表5

4所示。讨论

最近的最先进的机器学习文献报道检测通过CNN COVID-19采用深度学习。然而,使用的参数的分析工作是巨大的,实际上数百万[17]。例如,GoogleNet-V1约有500万(31日),ResNet-50约有2500万(32),AlexNET约有6000万(33],VGG-16大约有1.38亿参数(34,35]。因此,训练和测试所需的时间也大(在成千上万的秒)的范围,甚至使用多个图形处理单元(gpu)。另一方面,神经网络的参数的数量使用机器学习技术,如拟议中的一个,在成千上万的范围,和处理时间是几十秒,即使没有gpu进行训练和测试。

5。结论

COVID-19人类是一个严重的大流行威胁。严重急性呼吸系统综合症冠状病毒的快速传播2 (SARS-CoV-2)导致COVID-19全球大流行。开发高度精确的方法识别和隔离SARS-CoV-2感染患者是至关重要的。机器学习是实现使用功能自动检测COVID-19从胸部x光图像。此工作使用特性的基于DCT谱转换CXR图像子块。不包含空间特性。DCT的能量压缩属性是用来压缩每个光谱子块。压缩谱进一步操纵通过减少的总数平均窗口功能元素代表每个CXR形象。包含COVID-19多层神经网络实现分类设置,正常,肺炎病例。神经网络融合迅速实现一个非常低的均方误差。 The proposed method achieved an average accuracy of about 95% for the 3-set classification (normal, COVID-19, and pneumonia) and 94% for the binary classification (COVID-19 and pneumonia). While achieving a comparable accuracy, the computational burden and the time required for both training and testing of the proposed technique are very low compared to the state-of-the-art methods based on convolutional neural network deep learning.

数据可用性

作者要感谢以下数据收集成员迪拜卫生Authority-Rashid医院,Dubai-U.A.E。:埃曼博士易卜拉欣Elzain哈桑。艾哈迈德博士Bedair穆罕默德。哈立德Alattar博士。Manoj Madhavan Nair Girijarajam先生。

的利益冲突

作者宣称没有利益冲突。

确认

作者有一个格兰特扎耶德大学迪拜,阿联酋,现在authorsI工作。