文摘
现在,人工智能(AI)的实现在医学诊断主要关注在学术文献和工业部门。人工智能包括深度学习(DL)模型,这些模型在医疗应用程序实现的性能。根据世界卫生组织(世卫组织),在2020年大约有2560万人死于心血管疾病(CVD)。因此,本文旨在鲱鱼在心脏病学,因为它被广泛认为是在医学领域最重要的一个。本文发展一个有效的DL模型自动诊断12导心电图(ECG)信号与27类,包括26个类型的心血管疾病和正常窦性心律。该模型由残余神经网络(ResNet-50)。实验工作已经进行使用结合公共数据库从美国,中国,德国作为一个概念验证。提出了模型的仿真结果实现了97.63%的准确性和精度为89.67%。实现结果最近文献中根据实际值进行验证。
1。介绍
如今,医学领域需要新技术和技术为了客观地评价信息。根据世界卫生组织(世卫组织)的数据,心血管疾病(CVD)代表全球死亡的主要原因,在心血管病占全球死亡率的30%以上,每年,据估计到2035年将达到约1.3亿人(1]。因此,研究人员正在开发新的方法来预防,检测和治疗的疾病与心血管疾病有关。有许多类型的心血管异常,而本研究着重于26日异常,这将在稍后引用。
心电图(ECG)是记录人类心脏的电活动,这被视为noninvasiveness和实时考试。它仍然是一个心脏问题的诊断的重要支柱。近年来,分析心血管病的方法增强了成像过程的引入,尤其是超声心动图。然而,这并不改变ecg的重要性和实用性,可以从这个信号提取和参数。领导的数量在一个典型的心电图采集设备将它划分为领导,3-lead, 6-lead、12导心电图。12导心电图是最经常使用这种在临床实践中由于其并行捕获能力的潜在变化12套电极贴片连接到身体在标准化的地方(2]。相比其他类型的心电图采集设备,12导心电图提供心脏活动的更多信息和经常使用在医院诊断和治疗。事实上,许多重要参数可以从心电信号中提取;例如,各种波的时间和模式,这表明特定的心脏异常。
专业医生经常进行心电图分析和解释(3],严重依赖于培训、资质、经验、和专业知识;因此很难从心电信号中提取所有信息(4,5]。在实践中,手动ECG信号的特征波的检测和分类的心跳是困难和乏味的任务,尤其是分析长期录音霍尔特检查或流动的情况下连续监测重症监护病房和复苏。
随着物理硬件的进步技术和算法,计算机辅助医疗诊断(CAMD)在诊断心血管病已成为至关重要的。CAMD基于心电图信号可以给专业的建议或决定立即通过寻找特征模式。它可以帮助医生作出诊断,然后似乎是必要的,因为大量的病人在重症监护单位需要持续的监控。这就是CAMD看起来使用心电图信号帮助心脏诊断。这些系统应该容易设置,可升级的,准确的,耐用和可靠的。的作者(6)强调利用优化技术来提高效率的重要性在医疗应用程序预测。
在过去的几十年中,很多技术检测提出了心血管病,其中一些是基于信号处理技术和分类算法和支持向量机(svm)。深层神经网络机器学习(毫升)和卷积神经网络(CNN)方法最近成为有效的工具在计算机视觉等大型应用程序和自然语言处理。明显,耦合毫升和DL医疗带来了巨大的优势,研究人员正努力找到更多的创新的解决方案。
这项工作的目的是对27类进行分类,心电图信号含有26种心血管病和正常窦性心律。这个分类,我们用四个数据库包含42511心电图记录训练、验证和评估模型等消费品安全委员会2018年消费品安全委员会2018 -额外的(7],PTB-XL [8),和格鲁吉亚(7]。使用数据集包含心电图12导信号,是一组典型的心电图用于临床病例和医院。它是训练模型基于残余神经Networks-50 (ResNet-50)从CNN的方法,被称为一个最有效的模型的分类。
本文的其余部分的结构如下。部分2概述相关的文学作品;部分3代表的背景资料的解释一个心电图。部分4描述了该模型和仿真的工作流。该心电图分类模型结果讨论部分5。最后,部分6给出了结论和未来的工作。
2。相关工作
DL是毫升的细分;毫升是人工智能的一个分支,人工智能是让机器像人一样行动。毫升是实现人工智能的方式使用算法训练数据,虽然DL是受人类大脑的结构或也被称为一个人工神经网络。毫升的特性与领域专家挑选出,而在DL他们检测到神经网络而无需人工干预。这就是为什么DL更高的数据量需要被训练来获得最佳的性能。人工智能已被证明在许多实验中能够自动识别异常心电图的注册。
一般来说,论文中使用的数据库对心电图诊断是公开的。第一个是生理网,麻省理工学院的Technology-Beth以色列医院(MITBIH) [9)只包含49录音与每个主题的30分钟的长度,包括五类,正常(N)、心室异位(V),室上异位年代)、融合(F),和未知的(问)。Enabio et al。10]MITBIH作为数据库用于心电图分类(11- - - - - -16]。使用第二个数据库主要是生理信号挑战2018(消费品安全委员会)7)这是一个公众。它由687712领先8心律失常心电图记录包括IAVB(1日学位AV块),心房颤动(房颤),确诊(左束支阻滞),PAC(过早心房收缩),RBBB(完全右束支块),和信噪比(正常窦押韵)17- - - - - -19]。第三个是报道Bundesanstalt (PTB) (20.)诊断数据库,该数据库包含54912领先心电图记录从290人21- - - - - -23]。Selvalingam et al。24)使用私有数据库与DL模型预测室性心律失常,CNN。此外,史密斯et al。25)收集数据来解释心电图心律失常。
一些研究而不是使用不止一个。例如,李et al。26)使用五个数据库(幻想曲,CEBSDB, NSRDB、STDB和变频器)。然而,他们不把数据对心电图进行分类;相反,他们分别为每个数据集测试他们的模型。Zhang et al。27使用四个数据库,Acharya et al。28]建造4集的组合三个数据库(MITBIH [9),幻想曲(29日],BIDMC [30.])。研究不同使用平衡和不平衡的。王等人。31日)使用两个数据库(MIT-BIH (9],CPSC2018 [7)对心电图进行分类与递归神经网络(RNN)模型。表1列出了不同的数据库用于心电信号分类。
事实上,在他们的工作流,毫升方法考虑四个基本步骤:(我)信号预处理,包括重采样、噪声去除(如带通滤波器)和信号归一化/标准化。(2)需要检测R-peak心跳细分(例如,QRS波群)使用平底锅和汤普金斯算法等算法(32),生理网提供的开源GQRS软件社区。(3)特征提取,需要将原始信号转化为功能最适合手头的工作(例如,分类,预测和回归)。(iv)心电信号分析使用传统的机器学习方法(如多层感知器(MLP)和决策树。
尽管传统ML算法与手工制作的心电图分析特性取得了良好的效果,深层神经网络(款)方法的力量自动特征提取和表示学习具有人类性能在生物医学信号分析33]。
DL方法,另一方面,需要大量的数据和多参数学习。此外,大多数的建议方法和工作流来评估心电图信号特定于任务,,,不能应用于其他生物医学主题。各种研究分类使用DL ECG数据的方法。里贝罗et al。34)创建了一个端到端能够识别的六款2322513心电图记录的心电图异常与数据库。检测精度范围从83.3%到100%。这个DL模型实现了97.57%的总体精度的预测心血管病。Ahsanuzzman et al。35)调查的分类和预测单个类心律失常,房颤(AFib),使用心电图信号。混合长短时记忆(LSTM)和RNN用于这一任务。Obeidat et al (36)分类六心电节拍类使用一个混合DL CNN和LSTM模型相结合。混合模型达到准确度和精密度的98.22%和98.27%,分别。此外,(37)强调利用优化方法在医疗应用程序来提高效率。
Adedinsewo et al。38)建造了一个CNN模型分类心律失常类型造成左心室收缩功能不全(LVSD)获得的准确性为85.9%。熊等。39)决定从消费品安全委员会培训8528名心电图记录数据,ResNet-16模型的精度达到82%。Zhang et al。17)使用CPSC2018数据库,包含6877心电图记录建立34-layer ResNet 1维模型以检测9不同心律失常12导心电图信号。这个模型的分类精度为96.6%心电图信号。
可以说,记录的数量用有点小火车DL的典范;然而,正如上面提到的,DL需要更高的数据量。在这项研究中,我们选择四个公共数据库结合,证实了模型的有效性。在这篇文章中,该模型已经成功诊断大多数27类,包括26心血管病和正常窦性心律,这将帮助领域专家识别病人的记录,而其他研究用心电图分类只是一个或两个异常(35,38]。
3所示。背景知识
理解电气心脏功能至关重要,因为心脏是一个机械器官确保周期性收缩和放松。细胞在节点级别分组负责电子流扩散到附近的心脏细胞(心肌)。之后,它recontacts能够驱逐其他器官的血液。
3.1。心电图主要
心电图是一个记录心脏的电活动,通常显示为一个图表的电压值与时间。电极用于检测电变化引起的心肌细胞去极化和复极化心脏的距离,通过皮肤。要注意,一个心电图仪是用于这次考试。图1代表了心脏的导电元素的简化图,由导电组织的包,巴赫曼的包,左和右束支,浦肯野纤维,和心脏细胞本身。收缩组织是心房和心室壁细胞。这个数字是至关重要的在显示心脏的主要部件,所以提取数据和信号可以以更精确的方式完成。
3.2。心电图判读的基础
心电图解释包括评估海浪的形态(外观)和间隔心电图曲线。因此,心电图解释需要一个结构化的评估的海浪和间隔。图2显示了一个心的去极化和复极化阶段所代表electrocardiographically各种P波、QRS, T波。(我)P波:这是一个心房去极化的结果,这是由窦房结。起搏细胞在这个节点携带信号向右和左心房。心电图显示不正常的心房复极化。(2)QRS波群:这是内部的平均值(心内膜)和外部(心外膜)心肌细胞去极化波。一个典型的QRS模式时形成心内膜心肌细胞去偏光有点早于外层。(一)Q波是第一个负变位后P波。问丢失如果第一偏转并不是负面的。(b)R波是积极的偏转。(c)S波的负偏差发生后,R波。(3)T波:它表示心室复极化。在T波,在心脏肌肉没有行动。
病态或异常心电图分析发现和分类根据他们偏离正常的心脏节律。正常窦性心律(NSR)是指正常心脏活动没有偏差或ECG信号的形态学的变化。
本文着重于ECG信号的分类27类;类1度AV块(IAVB),低QRS电压(LQRSV),右轴偏差(RAD),心房纤颤(房颤),非特异性脑室传导(NSIVCB)、心房扑动(AFL),心动过缓(Brady),完成正确的包,分支块(CRBBB),不完全右束支块(IRBBB),左前丛生的块(LAnfb)、节奏韵律(PR),右束支块(RBBB),过早心房收缩(PAC),过早心室收缩(PVC),窦性心律不齐(SA)、窦性心动过缓(某人),窦性心律(信噪比),窦性心动过速(止住血)、室上性早搏(SVPB),左轴偏差(小伙子),长期公关间隔(LPR),延长Qt间隔(LQT), T波异常(选项卡),T波倒置(Tinv)、左束支阻滞(更多),Qwave异常(Qab)和室性过早搏动(VPB)。图3显示每个样本27 ECG信号的类。
(一)
(b)
4所示。提出的模型
本文提出一种ResNet模型有四个数据库对ECG信号进行分类。本节首先介绍模型提出的架构,然后突出我们的工作方法。
4.1。提出了模型的体系结构
摘要ResNet-50的模型特征提取。事实上,它结合了卷积神经网络对心电图诊断。图4说明了模型的体系结构概述。使模型训练容易处理保证了剩余块与快捷连接。模型作为输入,以一个心电图信号x ℝnsamples×12。作为输出,multilabel分类的结果ỹ ℝ1×27。
一层一维卷积(conv1D)应用到这些输入,一批标准化层(BN),纠正线性单元激活层(ReLU),和一个马克斯池层。同时,16剩余块被用来提取深度特性。有两种类型的残块如下:(我)Res_Block_1由三个Conv1d层,三个BatchNorm1d层,和两个ReLU活化层。一方面,一个Conv1d层和一个BatchNorm1d层用于匹配维度和跳过连接。(2)Res_Block_2仅由三个Conv1d层,三个BatchNorm1d层,和两个ReLU活化层。
Conv1d层用于特征提取和BatchNorm1d层是用来使模型更快更稳定。介绍了ReLU层执行非线性激活。特征提取的残留块使用平均池,池,池结果收集和发送到输出层,使用乙状结肠激活函数产生的预测。
4.2。数据集的特点
数据集用于这项工作结合四个公共数据库包含42511 12导心电图记录。这种类型的心电图是临床中使用的大多数情况下,因为它产生的大量的信息。这些录音是在500赫兹的频率采样。表2描述每个数据库的特点。
数据集用于这项工作包含27类,其中26类心血管疾病和一个类代表一个正常的心脏状态。图5显示了这些类的分布在每个数据库。图6概述其在数据集的分布数据不平衡和数据不足的问题在哪里注意到。
4.3。模拟工作流程
图7说明了该方法的工作流程,实现在我们的研究中。每一步的工作流将在以下部分解释。
4.3.1。数据预处理
信号的四个数据库不同的长度从6秒到60秒。因此,它已经决定统一所有的长度n样本。自常见的长度是10秒,我们设置5000个样本(10 s, 500 Hz采样率)。对ecg录音时间优于10秒,前十年代。否则,信号将在直到有10年代持续时间。图8描述这种预处理技术,在这一步中,信号计数小于5000的样品将在获得5000个样本。信号包含超过5000样本高于这个值将被丢弃。
图9更详细地展示了统一的技术减少ECG信号的长度,我们有一个信号长度的7500减少到5000来训练我们的模型。数据预处理是解释为每算法1。
(一)
(b)
|
4.3.2。数据增加
如数据所示4和5,数据不足和数据不平衡的问题是心血管病的严重。为了处理这个问题,振幅数据增强技术扩展应用。创建实际的数据,以防止数据稀缺性被称为数据增大。实际上,它提高了模型的鲁棒性和减少拟合问题类似的例子(14]。振幅比例ECG信号的乘法的随机因素α。这种技术旨在压缩或伸展幅度。的因素α样本来自正态分布N(0.1)。振幅缩放算法的算法算法所示2。
|
4.3.3。数据分割(火车、验证、测试)
就像前面提到的4.2由42511个心电图记录使用的数据集。首先,数据集被分成两组:测试集和训练和验证集的比例0.75:0.25。分层之后,10倍交叉验证方法应用设置的培训和验证。这将返回10分层折叠。这些折叠将由保存样品的比例为每一个类。这力量类分布在每个数据分割匹配分布在整个训练数据集。
一般来说,训练数据致力于培养模型。验证数据是用于优化模型。因此,寻找最佳的参数化不使用测试数据完成测量模型性能和允许我们评估模型泛化能力。最后,我们获得一个测试集和训练和验证与10627年和31884年心电图记录,分别。此外,每个培训褶皱的形状和验证褶皱心电图记录,是25507年和6377年分别。图10说明了这个方法的概述。
4.3.4。培训和评估
试错的方法用于确定hyperparameters。从本质上说,亚当的学习速率优化器采用三分。使用二进制叉损失函数。最优值的hyperparameters深层神经网络如下:12导心电图输入的长度设置为5000,批量大小是32,时代的数量等于100。
减少学习速率,我们学习速率调度器使用以下安排:
4.4。评价指标
multiclassification问题,精密度和准确度通常用来评估模型的性能。一个算法的性能通常是测量四个变量为每一个记录。这两个性能指标(准确度和精密度)可以计算方程(2)和(3) TP表示真阳性,FP表示假阳性,TN表示真阴性,FN表示假阴性。
5。结果与讨论
本节提供了视觉和描述性的讨论基于提出的模型。此外,引入了一个对比表比较提出对其他研究相关工作按表中引用3。要注意,OVH云一直使用以下特点,训练该模型。(我)记忆:45(2)vCore: 8(3)GPU: NVIDIA Tesla V100 16
精密度和准确度通常用作multiclassification两个性能指标评估模型的性能模型。在我们的情况下,精度表示的概率模型做出正确的预测,而精度之间的比率的定义是正确的比例所作的预测模型和总数量的预测。
在训练和验证阶段,分别获得的准确性为97.63%和97.58%。在精度方面,我们获得了89.67%和88.85%,分别。损失值表示该模型的基础是好是坏每次迭代后执行。的损失,收于3.10点−3和1.27.10−2每个阶段都达到表中可以看到4。
因为使用分层10折叠data-splitting一步,从折叠过渡到另一个,模型经历了一个障碍,直到稳定在过去的褶皱。60次迭代后,我们可以观察到模型逐步收敛到一个稳定的精度,精度和损失在第100届迭代。数据11- - - - - -13证明这些性能指标的演变。
疾病诊断是非常重要的改善心血管疾病的正确分类的性能指标。ResNet-50显示更好的分类性能相比其他研究援引相关作品中可以看到比较表3。
在该模型性能的评估,创建了一个规范化的混淆矩阵图中可以看到14每一行指的是一个实际的类,而每一列表示一个预测类。该模型表现良好、NSR RBBB,止住血,TInv,房颤,IRBBB,确诊类。实际上,他们的预测准确率高于80%。它执行适度CRBB,布雷迪,SA, PAC, PVC,某人类。接下来NSIVCB、IAVB LanFB AFL, RAD,正确预测的比例高于60%。剩下的课程,像QAb,小伙子,LPR,公关,模型表现糟糕。这个问题是由于较低的预测数据不平衡虽然振幅扩展应用。
表5显示了该模型的测试结果,包括不正确的样品(测试1和2)和正确的(测试3和4)样本被检测到我们的模型,以及它的预测和心电图的当前状态。
6。结论和未来的工作
一个有效的DL方法基于ResNet-50提出了本文对心血管疾病进行分类。类的数量被认为是27日,26日属于心脏异常和1属于正常状态。在这项研究中使用的数据集相结合四个数据集收集来自三个不同的国家。实现结果证明了该模型的可行性和效率。结果,同时,对值进行比较和验证在最近发表的文献。然而,该模型遭受高计算复杂度和低范围的可解释性。因此,未来的研究,该方法将改进理想适应广泛的不同的医疗保健应用程序。
数据可用性
使用的数据来支持本研究的结果包括在本文中。
的利益冲突
作者宣称没有利益冲突。
确认
这项研究是由塔伊夫大学科研院长以来,沙特阿拉伯王国,塔伊夫大学的研究人员支持项目没有。TURSP-2020/265。