文摘

心律失常是最危险的疾病之一,在各种心血管疾病。重要的是要实现高效、准确的自动检测心律失常临床心血管疾病的诊断和治疗。基于先前的研究心电图(ECG)自动检测和分类算法,本文使用ResNet34网络学习心电图信号的形态特征和信号的重要信息,然后进入三层堆叠长期和短期记忆网络的上下文依赖特性。最后,四个分类任务实现2017年生理网挑战测试数据集通过将softmax函数。激活函数改变从ReLu函数米什函数在这个模型。负面信息的心电图信号被认为是在训练过程中,使模型更加稳定和准确的分类能力。此外,本文计算并比较正确分类样本的平均信息熵和分类错误的样本在测试集。此外,它消除了影响明显的信号异常(冗余或损失)模型的分类结果,更加全面、准确地解释模型的分类效果和性能。消除异常信号的可能性后,ResNet34-LSTM3模型平均获得 平均得分0.861和接受者操作特征曲线下面积(ROC) 0.972测试数据集,这表明该模型可以有效地提取心电信号的特点和诊断心律失常的疾病。比较的结果ResNet34模型和ResNet-18模型在相同的测试数据集,我们可以看到,本文改进的模型有更好的分类和识别影响心电图信号作为一个整体,它可以更有效地识别房颤疾病。

1。介绍

与人们的生活和工作压力的加大,心血管疾病已逐渐成为一种重要的疾病威胁着人类的生命和健康。根据世界卫生组织的报告,心血管疾病的死亡率排名第一的各种疾病,占33.3%的其他疾病。心律失常是一种心血管疾病的高发病率和高在所有心血管疾病的风险。心房颤动(房颤)是最常见的心律失常疾病。患者心房心律失常的临床表现或无效的收缩。这些疾病通常发生在老年人口有很高的发病率和漫长。很容易导致心脏衰竭、中风和其他并发症,患者的安全构成了严重威胁。因此,早期、准确检测这种心律失常的临床工作中是一个重要的挑战。目前,诊断心律失常的主要工具是心电图(ECG)。通过分析病人的心电图信号,医务人员可以作出准确的诊断不同类型的心律失常。 However, this kind of manual detection method relying on the clinical experience and a lot of professional knowledge of medical workers is often prone to make mistakes [1,它还需要投入大量的人力和精力。不断发展和成熟的计算机技术和电子信息技术,使用计算机的任务分析心律失常的心电图信号实现自动检测已成为现阶段研究的热点,它可以提供一个更有效的和可靠的诊断依据为医务工作者,从而减轻了人力资源投资(2]。

现有的心电图分类算法通常包括信号预处理,如小波变换和人工特征提取,但计算的数量将会增加延迟的实时分类系统。近年来,深学习算法自动学习功能的优势越来越多地用于医疗领域,如医学图像识别和分割,时间序列数据监控和分析。目前,优秀的算法可以建立一个端到端的款网络学习的特点,使用广泛的数字心电图记录ECG数据的特点,可以节省大量的信号预处理步骤。因为款的性能随训练数据量,该方法可以充分利用广泛的ECG数据的数字化。

本文的其余部分组织如下。第二部分回顾了相关的研究。第三部分中描述的数据和方法。第四部分介绍和分析了实验结果。第五部分总结了该方法的优缺点,提出了前景。

使检测到的心电信号自动检测的常见分类任务通常有三个步骤,预处理、信号特征提取和分类识别(3]。由于心电图信号获得使用心电图采集记录仪、原始信号与几个混合噪声和无效的信号。一般来说,低通滤波器、小波变换和其他相对经典去噪方法中使用的预处理步骤。信号经过信号预处理、特征提取。传统的特征提取方法利用离散傅里叶变换或小波变换提取时间序列信号的形态学特征(4,5),如坡度、振幅,山峰,间隔,和其他特征信息,并组成特征向量加法的所有类型的传统的机器学习算法,如主成分分析和独立成分分析。更高效、可靠和紧凑的特征向量可以从心电图信号获得。这些传统的特征提取算法需要提供手工或feature-specific含义。然而,往往需要专业的选择和组合特征,和选择过程是费时的6]。全球与深度学习理论的发展,研究人员开始使用深度学习算法自动从数据中提取感兴趣的特性。

在深度上优于心律失常的检测研究中,Kiranyaz et al。7)开发了一个卷积神经网络(CNN)分类算法基于一维卷积对应的疾病类的心电图,可以完成基本的分类任务,但低灵敏度的心律失常分类sveb类型。Rajpurkar et al。8)提出了卷积神经网络算法与残余结构,它利用心电图信号从一个单一铅可穿戴设备收集的心律失常的检测信息(9)和使用AlexNet网络作为输入ECG信号的双谱谱,和实验终于平均精度为91.3%。Mostayed et al。10提出了递归神经网络算法;他们训练12导心电图信号输入模型由两个双向长期短期记忆(LSTM)网络来检测疾病的信号。Yildirim [11)利用小波变换的心电信号分解为一个小波序列,然后进入一个双向LSTM模型进行训练和分类,并获得了理想条件下识别精度99.39%。随后,Saadatnejad et al。12)提出了一种轻量级的特征自动提取方法将小波变换与LSTM网络相结合,可以实现连续实时分类心电图信号。冯et al。13)提出了一个16层卷积神经网络,并把它跟长期记忆网络实现多通道的分类,在分类准确率达到95.4%心肌梗死疾病在PTB数据库。

除了上述深度学习算法直接利用一维心电图数据训练,文献[14)三个相邻的节拍ECG信号转变成一个二维耦合矩阵,这个矩阵,获得信号之间的相关性击败和形态学信息(15,16)6月et al。17)中的每个打信号转换为二维灰度图像,当时作为一个二维卷积神经网络的输入。然后,这种2 d方法需要1 d cardioelectrical信号转换成二维信息,也占用磁盘空间,同时增加计算成本。总之,许多现有算法受到复杂的预处理过程(18,19和时间成本高17]。

3所示。心电图数据集介绍和Resnet34-LSTM3分类和检测方法

基于端到端网络特征,本研究试图结合34-layer ResNet网络(ResNet34)与三叠LSTM网络(LSTM-3)结合以前的经验。此外,该模型不需要太复杂的程序,如信号预处理和人工特征提取,和它使用ResNet34网络学习心电图描记的信号的形态学特征和获得信号的重要信息(网络的特征提取主要是深层异常波形特征信息包含在F波,P波、QRS波群ECG信号)。上下文依赖的特性就获得了利用三层堆叠LSTM网络。最后,multiclassification任务2017年挑战生理网(https://physionet.org/challenge/2017/)测试数据集是通过将softmax函数实现的。该模型利用max池层,辍学层、和批处理标准化层多次优化计算,提高分类精度。同时,它的目的是改变激活函数从ReLu米什函数,模型考虑了负值ECG信号的信息在培训过程中,同时使模型更稳定。此外,本文使用模型对ECG信号进行分类,计算并比较正确分类样本的平均信息熵和错误分类样本。它消除了影响明显的信号异常(冗余或损失)模型分类结果后,更加全面、准确地解释模型的分类效果和性能。

3.1。介绍心电图数据集

生理网中使用的数据集的实验挑战2017短单管线心电图AF分类网站的竞争。训练集包含8528个单管线ECG信号取样记录,从9秒到60秒多一点;每个ECG样本的采样频率为300赫兹和带通滤波的AliveCor设备。每个示例包含一个垫文件相应的心电图和头脑包含波形信息的文件,而心电图样品都是由人类心脏病专家分为四类:正常(N),心房纤颤(a),其他节奏(O)和噪声(~)。

训练集和测试集的数据部分如图1,其中有8528个数据训练集和852年数据在测试集。更多细节的训练集如表所示1,SD代表标准差和地中海代表值。图2显示心电波形的例子在四个类别(持续20秒)从上到下,与正常的旋律,如梵正常(N),心房纤颤(A),其他节奏(O)和噪声(~)从左到右。

3.2。心电图数据预处理

训练更有效地建立深度学习模型,每个输入网络的序列长度需要固定。出于这个原因,本研究首先遍历ECG信号样本数据集,找到最大的序列长度和定义为 另一方面,因为大多数的ECG信号采样点数据集的约9000(采样时间是大约30秒),和相当数量的样本是18000年,所以对于样品采样点接近 ,如果采样点的数量大于 ,只有第一个 将采样点的样本。如果采样点的数量小于样本 ,然后样品null-filled以便其序列长度 同样,接近样品的取样点 ,如果这个样品的采样点数大于 ,只有第一个 这个示例将采样点。如果这个样品的采样点数小于 ,那么样品将zero-filled以便其序列长度 上面的ECG信号样本处理后被称为归一化样本,并且流程如图3

类别向量目前包含四个不同的标签,也就是N, O,心电图,~,每个样本对应一个标签被人类心脏病专家。在这项研究中,每个标准化样本分为 输入序列的长度相同。每个输入序列的标签规范与原样品一致(20.), 被定义为

在实验中, 设置为256, 是一个整数操作。

最后输入矩阵的形状 ),在1表明一个输入序列是一维的,最终的输出矩阵的形状是什么 ),其中4代表了四种类型的标签。

3.3。ResNet34-LSTM3分类和检测方法
3.3.1。ResNet34-LSTM3模型结构

由ResNet34和LSTM-3 ResNet34-LSTM3网络模型。ResNet34网络是用来提取特征信息的不同级别的心电图信号,和跳过结构网络中用于避免网络退化梯度消失和培训等精度退化由于太大网络深度。LSTM-3叠加网络捕获相关信息序列的特点。因此,可以提取的上下文依赖性特性ResNet34网络的输入特征向量和输出到LSTM-3网络。几个最大池层、批归一化层和辍学层排列在网络优化计算,提高分类精度。考虑ECG信号的负面信息,米什函数作为激活函数的模型。的网络结构图如图ResNet34-LSTM3模型4

3.3.2。ResNet34网络体系结构

一般深卷积网络栈更多的网络层更好地提取空间特征在不同层次上的信号序列或图像。然而,它已经发现,深CNN模型是困难的训练。因为网络深度的增加,训练精度会先上升,达到饱和,然后继续增加;网络深度会导致精度降低,也就是说,网络开始退化(21]。为了解决退化问题,深层残留网络中使用本研究稳定模型的训练精度,同时增加网络深度。相对于其他类型的CNN模型如VGGs和AlexNet深处,深残余网络解决了网络退化问题,添加一个跳过结构,如图5

深层网络问题的恶化是由于非线性激活函数的存在 ,导致很多重要的信息损失为每个激活层从输入到输出,使这一过程几乎不可逆(22]。剩余结构的目的是使深卷积网络映射能力是相等的。这样,当网络加深,至少深卷积网络的性能和肤浅的网络平衡。现有的神经网络很难适应潜在标识映射函数 ,但是如果网络设计 (如图5),即身份映射直接网络剩余结构的一部分,和网络直接安装剩余函数 ,标识映射 可以更快的获得,从而解决退化问题深卷积网络(22]。

同时,剩余结构的输出函数 ,和常数1衍生的结果 还可以缓解可能消失的渐变深网络反向传播时发生。

本研究使用ResNet34提取不同级别的输入心电信号的特征。如图4,ResNet34网络由信号输入层,一维卷积层,BN层(批量标准化单元),活化层,辍学层,和最大池层作为一个整体。卷积层重量和本地连接共享的特点,可用于提取心电信号的局部特征。一维卷积的计算公式如下:

的重量和抵消吗 层和 是卷积核的大小。

批归一化层可实现数据的分布特征在每个级别,保证输入特性分布具有相同的均值和方差,使模型损失值和梯度的变化更稳定(23]。BN的计算公式如下:

从上面的公式,BN层首先计算的意思 和方差 每个minibatch数据,可实现数据的意思是0和方差1 ( 是为了防止方差为零)。最后,两个参数,可以学到(尺度参数 和偏移量参数 )作为输出用于线性变化。据,一些有用的特性数据归一化后信息丢失。因此,引入线性变化将在一定程度上恢复模型。

激活层可以使模型适合非线性分类的能力。许多先前的研究使用 函数(公式(4))的激活函数。然而,使用 函数将失去ECG信号的负面信息,导致分类效果很差。因此,本文灵活的使用功能 激活函数(公式(5))。这两个激活函数曲线如图6。从图6,很明显,这个函数也有类似的非线性的能力 函数,同时保留少量的负面信息的心电图信号,因此网络的分类性能更好。

保存ECG信号的每一层的重要信息,减少网络计算的复杂性,最多汇聚层的步骤1和2被添加到网络的一个核心大小。此外,辍学层添加到网络随机丢弃的一部分信息,防止过度拟合模型的训练。

3.4。LSTM-3网络结构

LSTM网络是一个时间序列模型,可以从任何序列数据中提取时域特征(24]。与递归神经网络相比,LSTM可以解决问题的梯度消失在长期序列学习,从而提高模型的学习能力。LSTM单元的结构如图7

方程计算LSTM细胞的内部参数如下:

在方程(6)- (10), 是重量参数, 偏差, 函数,ht是当前单元的隐藏状态,下标的吗 代表三个不同的重量和偏差盖茨,分别。 , , , 输入盖茨,忘记了盖茨,细胞状态,分别和输出盖茨。的 是一个双曲正切函数。

如方程所示(6),忘记门控制的输入信息从以前的单位。它决定了多少信息需要保存或传播到下一个单元。输入门控制从外部输入的新信息。它决定应该使用多少新的信息。当前单元状态可以通过结合更新忘记门的输出与输入门见方程(9)。隐藏状态的计算当前单元格的细胞产量和最新的细胞状态。

基于时间序列的优点LSTM网络,本研究使用了一个三层堆叠LSTM网络后ResNet34网络心电信号特征提取上下文依赖性。每个LSTM网络包含相同数量的LSTM单位,这是设置为256。单层LSTM网络结构的示意图如图8

LSTM-3网络,输出序列前LSTM网络构成的输入序列的下一个LSTM网络,添加了十亿层和辍学层之间每两个LSTM网络。假设ResNet34网络的输出的特征向量 ,LSTM-3网络的学习过程可以表示为以下几点:

在上面的公式中, 代表一个操作的函数LSTM层,用于处理功能序列,序列号码 ,代表三个先后的序号连接LSTM层,和 隐藏的状态和相应的LSTM层状态组件层。

3.5。网络输出层设计

LSTM-3网络的输出后,与1024年完全连接层神经元连接。最后,输入的四个分类ECG信号是通过将softmax函数实现的。将softmax公式如下:

的预测概率分布 属于所有可能的类。 是一个积累的过程变量,从1到4(类别总数)。

3.6。信息熵的验证

信息熵的概念是用来描述一个信息来源的不确定性。香农信息论之父,在他的论文中提出:“任何信息冗余,冗余与发生概率的大小或每个符号的不确定性信息。“香农,借助热力学的概念,所谓的平均数量的信息在消除冗余信息作为“信息熵。“在实验中,每个ECG样本的抽样值是不确定的,可根据其发生概率来衡量。如果采样值的概率很大,不确定性很小,提供的信息量很小;相反,不确定性大。

心电图的平均信息熵计算的样本,它是假定 采样值可以出现在一个特定的心电图样本传输信息: ,相应的概率是 一般来说,它可以被认为是发生各种采样值是相互独立的。这时,单次抽样的不确定性ECG信号样本的价值 ,和它的平均信息熵 计算公式如下:

训练Resnet34-LSTM3模型完成后测试集上的分类任务,本文计算了平均正确分类样本信号的信息熵和错误分类样本信号,分别。然后,两种样品的平均信息熵进行比较。如果平均正确分类样本信号的信息熵明显高于或低于后者,这表明信号样本的误分类模型可能是由于这些样本的异常信号。如果平均信息熵的两种类型的样本信号是相同的,这表明信号样本的误分类模型是由模型本身的因素引起的。

本文计算并比较样本的平均信息熵的信号,它可以消除的影响明显信号异常(冗余或损失)模型的分类结果,更加全面、准确地解释模型的分类效果和性能。

4所示。培训和结果

模型训练和评估使用官方网站提供的训练和测试数据集的生理网挑战2017短单管线心电图AF分类竞争。

本研究中使用的开发IDE PyCharm专业版,和编译环境是Python 3.6。模型的训练和测试使用kern 2.3.1框架与TensorFlow 2.0.0后端。硬件设备根据整个实验过程如表所示2

4.1。模型训练

网络训练的最大时期设置为50,批量大小是32。使用亚当优化器来更新网络重量,最初的学习速率设置为0.001。在培训过程中,如果模型验证的准确性并不是增加了两个连续的时代,学习率减少到原来的10倍,和设置为最低的学习速度 一维卷积核的初始长度设置为16个,每个卷积卷积核层的初始数量设置为32,和卷积核的数量翻了一番卷积后每两层。卷积粒重初始化的正态分布。

防止过度拟合模型在培训过程中,如果不优化模型的各种指标8时代后,模型的训练将会提前停止。损失值曲线和准确性曲线模型的训练过程如图所示9。从图可以看出9损失值曲线和曲线模型的准确性已经聚集在20世纪之前的训练。

4.2。评估结果

模型训练完成后,的平均信息熵模型在测试集上的分类计算,如表所示3。平均正确分类样本信号的信息熵和正确分类样本信号是8.9088和8.9057,分别。因此,样本信号参与模型分类测试没有明显异常。

后确保样本中没有明显的异常信号,整体平均精度,记得, 分数、特异性和阴性预测值(NPV)模型的计算测试集,如表所示4

从表中可以看出,总体平均精度,记得, 分数、特异性和NPV ResNet34-LSTM3分类检测方法的测试集是87.3%,85.2%,86.1%,96.9%,和97.1%,分别。

得分值模型的噪声(~),正常的节奏(N),心房纤颤(A),和其他节奏(O)是0.978,0.890,0.786,和0.790,分别。它表明该模型可以识别噪音信号的测试集,消除噪声的干扰下的样本与样本容量非常有限的训练数据集。与此同时,它也有一个良好的分类效果正常节奏(N),心房纤颤(a),和其他节奏(O)。此外,对各种模型的特异性分数高于0.95的样品,这表明该模型具有良好的识别能力为负的情况。

为了更好地评估模型的分类能力对心电图信号,ResNet34-LSTM3模型本文与ResNet34模型和ResNet18模型相比,这对ECG信号具有较好的分类能力。混淆矩阵的比较三个不同的模型如图1011。与此同时, 分数和AUC值的三个模型四种心率分类得到如表所示56。获得的实验数据在两个表是基于生理网提供的测试数据集挑战2017短单管线心电图AF分类官方网站的竞争。

根据表中的数据56,整体 分数的平均和AUC平均ResNet34-LSTM3模型在测试集是0.861和0.972,分别均高于其他两个分类模型。因此,它可以表明,ResNet34-LSTM3模型具有更好的分类和识别影响心电图信号作为一个整体。的 分数和AUC值ResNet34-LSTM3模型的心房纤颤(A)分别为0.786和0.967,分别是高于ResNet34模型(0.777和0.959),表明改进后的模型能更好地识别心房纤颤(A)的疾病。的 分数和AUC值ResNet34-LSTM3模型和ResNet34模型的正常节奏(N),其他节奏(O)和噪声(~)是相同的,这表明改进后的模型仍然可以识别其他节律信号样本,而且没有分类能力下降。整体 分数和AUC ResNet34-LSTM3模型在测试集明显高于ResNet18的模型,这表明本文ResNet34-LSTM3模型明显优于ResNet18模型在ECG信号的分类能力。

5。结论

本文基于ResNet34网络三层堆叠的长期和短期记忆网络,和米什函数作为激活函数。最后改进模型可以获取的上下文依赖特性和留住ECG信号的负面信息。平均 得分0.861和0.972的平均AUC值改善ResNet34-LSTM3模型得到的2017年生理网挑战测试数据集,这表明该模型可以有效地提取心电信号的特点和诊断心律失常的疾病。比较前面的评价结果ResNet34模型和ResNet18模型在相同的测试数据集,可以看出,改进后的模型有更好的分类和识别影响心电图信号作为一个整体,它可以更有效地识别心律失常如心房纤颤,这将提供一个医务工作者更有效和可靠的诊断依据。

在这项研究中有一些重要的局限性。的输入数据集实验生理网挑战2017短单管线心电图信号,它提供了一个有限的信号与标准12导心电图信号。因此,是否ResNet34-LSTM3模型分类性能更好的12导心电图信号仍有待确定。此外,当临床使用的算法,它可能会受到ECG信号的持续时间,和应用程序的各种算法,包括算法,最终必须定制特定的ECG信号预处理方法临床应用为目标。因此,在下一步的研究中,我们考虑分段信号补充信号段通过复制其他心电图信号在同一类别为了最大化的使用信息。在未来,我们将与更多类型的心电图数据进行实验来证明我们的模型的性能。

一句话,摘要ResNet34-LSTM3网络模型可以区分信号与不同的同心法律短单管线心电图信号,其分类性能也优于前人的部分分数。如果更多的测试是在临床环境中进行的,这种方法可以帮助医务人员提高心电图临床解释的效率和精度。

数据可用性

使用的数据来支持本研究的结果包括在本文中。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

这部分工作是在山东省自然科学基金的支持下,中国(没有。ZR2020MF014)。作者还要感谢匿名审稿人的宝贵意见。