文摘
发现共享,不变的特征表示在受试者心电图(ECG)分类任务是至关重要的为提高模型的泛化未知的病人。虽然深层神经网络最近出现在提取可概括的心电图特征,他们通常依赖于大量的标记样本对象保证泛化。提取不变表示从一个小主体可变性的今天仍然是一个挑战由于个人生理差异。为了解决这个问题,我们提出了一种敌对的深层神经网络框架interpatient心跳分类通过整合敌对的学习变成一个卷积神经网络学习subject-invariant class-discriminative特性。该方法是评估MIT-BIH心律失常心电图数据库是一个公开的数据集收集来自47个病人。与最先进的方法相比,该方法达到了最高的性能检测室上异位搏动(SVEBs),这是非常具有挑战性的识别,也获得类似性能的检测心室异位搏动(veb)。SVEBs和veb的敏感性是78.8%和92.5%,分别。SVEBs的精度测量和veb分别为90.8%和94.3%,分别。使用高性能的病理检测类(即。,SVEBs and VEBs), this work provides a promising method for ECG classification tasks when the number of patients is limited.
1。介绍
分类的心电图心跳心脏疾病是必要的(例如,心律失常)的诊断。然而,是耗费时间的心脏病专家手动检查一个长期的心电图(ECG),使自动心电图分析有用的。目前,已经提出了大量的方法心电图分类。两个范例,被称为intrapatient interpatient范例,通常采用评估心电图分类方法。intrapatient范式,心跳不同患者随机分为训练集和评价集。这个评价范式不是高度可靠在现实世界中自心跳相同的病人可能被用于训练和测试,使分类器的泛化偏见的评价。在实践中,一个自动心电图分类系统应该提供一个准确的诊断对任何未知的病人(病人不是在训练集)。interpatient范式指定用于训练和测试的心跳都来自不同的个体来获得一个更现实的评估。然而,自动interpatient心电图分类是一个挑战今天由于心电图形态和节奏的变化由个体生理差异造成的。
如图1心跳,一个心电图主要包括P波、QRS波群波,和T波,这反映出电活动的心房和心室去极化和复极化过程。一般来说,一个完整的心电图分类系统包括三个过程:(1)心电信号预处理,去除基线漂移和心跳等分割;(2)特征提取,主要包括形态学特征(1- - - - - -4),统计功能(5- - - - - -7],P-QRS-T特性[8- - - - - -10),和小波的特性11- - - - - -13];(3)分类,如支持向量机(SVM) [3,9,14,15)和人工神经网络(ANN) (8,16]。陈等人。9)结合投影心电图特点和加权RR间隔功能,然后将这些特征输入支持向量机心跳分类。尽管他们的方法取得了较高的分类性能intrapatient评价范式下,检测的灵敏度和精度指标室上异位搏动interpatient评价范式下只有29.5%和38.4%的MIT-BIH心律失常数据库。Raj et al。17]介绍了稀疏表示技术代表ECG信号中提取特征和使用机器学习技术(如支持向量机和再)对这些特性进行分类,获得一个好的结果在检测室上异位搏动。Mondejar et al。4形态学特征提取和基于小波的特性,高阶统计,局部二进制模式和RR间隔。他们提议给每个类型的特性为单个支持向量机训练,获得特定的SVM模型。然后,这些支持向量机的预测模型组合得到最终的预测,实现了整体性能良好的interpatient心跳分类。这些方法依赖于专家知识和经验的工程特性。因此,分类性能可以提取的质量特性非常敏感。
最近,许多研究心电图分类越来越关注深度学习由于其强大的能力进行自动特征学习和分类。足够的训练数据集时,深层神经网络(例如,卷积神经网络(CNN))显示非常主要在分类任务18- - - - - -22]。Hannun等人提出了一个34-layer深CNN对准91232心电图记录收集从53549个人,这实现cardiologist-level在心律失常的分类精度。然而,复杂的模型,如CNN容易过度拟合当病人的数量是有限的(例如,47个不同患者纳入MIT-BIH心律失常数据库),使其难以分类未知的病人的心跳。事实上,一些基于深度学习方法(23- - - - - -25)取得了令人满意的结果等小型数据库MIT-BIH心律失常数据库interpatient心电图分类。李等人。23)开发了一种多尺度卷积神经网络的3 d功能包含形态特点,beat-to-beat相关特性,和RR间隔被作为输入。妞妞et al。24)提出了一种深度学习框架,引入了一个编号代表心跳的节奏和形态学方法和提要符号表示成multiperspective卷积神经网络。然而,当前的方法缺乏明确的机制,探索在受试者心电图特征不变性。他们通常站在假设他们提出的模型可以在训练本质上可归纳的学习特性。这个隐式学习是自然受制于个人的心电图数据量。因此,如何明确学习不变表示对主体间的变化是一个重要的问题,特别是当病人的数量是有限的。
在本文中,我们提出一个敌对的心跳心电图分类框架基于卷积神经网络,如图2。该框架集成了敌对的学习变成一个卷积神经网络,延伸深度学习模型心电图识别任务。敌对的美国有线电视新闻网由一个编码器,分类器,和对手网络。编码器网络从心电图心跳信号提取特征和相应的RR间隔。分类器和对手网络负责预测和最小化最大化类标签ID识别。由这个对手比赛,训练学习subject-invariant编码器,class-discriminative特性。该方法是评估MIT-BIH心律失常心电图数据库是一个公开的数据集收集来自47个病人。消融研究表明我们对抗subject-invariant特性学习显著增强interpatient心电图心跳分类精度比传统深度学习的方法。
本文的主要贡献的结论如下:(1)我们的目标是,深度学习模型学习的特性可以概括为心电图识别未知的病人/分类任务。为此,心跳deep-learning-based心电图分类框架提出了应对的学习可概括的特征。具体来说,我们引入一个对手损失卷积神经网络,鼓励模型学习subject-invariant class-discriminative表示从一个不足通过对手的比赛。(2)公开和常用数据集上的实验,MIT-BIH数据库,表明该方法可以实现先进的性能检测的病态类当受试者的数量是有限的。
2。方法
2.1。问题描述
让表明训练集,表示原始ECG的心跳, 表示的类标签 ,和 表示主体身份(ID)的数量 。合理的假设是心电图数据是共同依赖类标签IDs和主题 。心电图分类预测的任务鉴于 。在现实世界中,这个任务需要预测不变 ,也就是说,学科之间可概括的模型是必要的。在这项研究中,我们把讨厌的变量,旨在开发一个卷积神经网络模型学习可概括的特征不变的主题 。
2.2。数据预处理和特征提取
所有原始心电图记录预处理生成拟议中的对抗性的卷积神经网络的输入,如图所示2(a)。首先,我们部分原始心电图记录到心跳的位置R山峰MIT-BIH心律失常数据库的注释。具体地说,之前之后的50分R峰和100点后的电流R峰是作为一个心跳。这个细分允许心跳包含一个更健壮的P-QRS-T复杂波形由于心率是不断变化的,相对于当前的和固定的起点R峰值可能引入干扰信息(与短RR心跳间隔)或丢失信息与多种波形(心跳)。我们的分割将导致不同长度的心跳;然而,cnn无法接受varied-length输入。因此,在第二步中,我们都重新取样心跳相同的长度为128。第三,所有心跳段的平均减去抑制基线漂移。
除了预处理心跳信号,心跳节律提取(RR区间信息)作为另一个输入的一部分,如图2(b)。pre-RR间隔(电流之间的时间间隔R和前一个)是一个典型的RR峰值间隔功能,通常可以区分心律失常和正常心跳的人(27]。然而,无节奏的心跳可能重叠的pre-RR间隔分布与正常心跳作为个人基本心率是不同的,尤其是对于病人的人口。消除重叠,我们提取pre-RR比率(当前pre-RR间隔的比值的平均值的所有pre-RR间隔对应的记录)统一每个人的基本的心率。此外,near-pre-RR比率(当前pre-RR间隔的比值的平均值此前十pre-RR间隔)也提取自个人基本心率变化与情绪和运动状态(1]。建立敌对的卷积神经网络的输入,我们重复这两个标量特征向量长度为128,然后连接与预处理心跳信号。
2.3。对抗的模式学习
拟议中的对抗性的心电图心跳分类模型主要由三部分组成:一个编码器,分类器,和对手子网,如图2(c)编码器网络 参数化用于学习表示 。在实现中,卷积神经网络编码器,详细的部分2.4。编码器输出的表示 ,和被送入分类器参数化和对手网络参数化分开。分类器和对手,组成的一个完全连接层与softmax函数,用于分类表示到心跳类中IDs和主题 ,分别。消除干扰所致内嵌在 ,我们提出一个对抗的游戏。在这里,对手是训练预测对象id通过最大化的可能性 ,同时,编码器是训练有素的隐藏信息在通过最小化这种可能性和保留足够的区别的信息分类器估计类标签通过最大化 。总的来说,我们的火车编码器、分级机和对手网络共同的目的: 在哪里是叉损失函数,定义为 在哪里表示对抗体重之间的权衡与task-discriminative性能更强的不变性。一个更高的增强了不变性科目,而 部队学习功能的编码器有识别力的类标签,以及主题id,预计不会在我们的心电图分类任务。
2.4。卷积网络体系结构
心电图特征卷积编码器由7层,总共三个时空关注模块。具体的配置编码器网络表所示1。卷积后的第一层,三个剩余卷积块平均池快捷方式是建立促进网络的优化和分类精度。第二个(最后)卷积层每个剩余块使用的膨胀率3扩大接受域不增加数量的参数。毕竟卷积层,批正常化(BN) [28)是用于加速模型收敛renormalizing培训minibatch的分布。修正的线性单元(ReLU)函数(29日)应用于激活每个BN层的输出,从而防止梯度消失的问题。此外,我们引入一个时空的注意机制(30.),包括空间和时间关注模块,剩余卷积嵌在每一块。这种机制可以专注于更丰富的功能通过分配不同的权重,渠道和时间的特征映射。
学表征编码器网络分类器的输入和对手的任务ID歧视歧视(心跳类)和主题。分类器和对手由一个完全连接层和softmax单位,分别输出规范化log-probabilities将用来计算损失在方程(2)。
3所示。实验研究和结果
3.1。数据集
MIT-BIH心律失常数据库(31日)是用于评估该方法的性能。这个数据库包含48两起动态心电图记录收集来自47个个体,在录音201年和202年获得相同的主题。每个记录持续大约30分钟,在360 Hz取样。根据ANSI / AAMI EC57:1998 [32),所有的心跳都可以分成五个超类:心跳起源于窦节点(N),室上异位搏动(SVEBs或S),室性异位搏动(veb或V),融合胜(F),和未知的类型(问)。
AAMI-recommended实践后,四个节奏录音不习惯。获得一个更现实的评估,De Chazal et al。33)建议将剩下的44个录音分成DS1和DS2为训练集和测试集,分别。这种分裂分裂录音通过考虑病人的识别和类之间的平衡,保证了心跳的训练集和测试集是来自不同的病人。本文中使用的详细的心跳分布如表所示2。
3.2。培训背景
20%的训练数据随机选择验证数据,剩下的数据作为训练样本。我们设置了敌对的重量0.005通过整合这个参数。拟议中的对抗性的深度学习框架是通过使用一种自适应训练的时刻估计(亚当)优化器34最初的学习速率为0.001。在培训过程中,模型参数更新迭代的基于批128个训练样本。当损失验证数据仍然undeclined 10时代,学习速率降低到0.0001,在20世纪,培训将会终止。心跳的表现最好的模型验证数据分类保存。
3.3。评价指标
四种典型的指标,包括准确性(Acc),灵敏度(Sen),精密(前)和分数,是用来测量方法的分类性能。这里,该方法准确性措施的整体分类性能,而灵敏度和精度指标计算为每个特定的类。分数是调和平均数的精度和召回。这些指标被定义为 TP、TN、FP和FN指真阳性的样本数量,真正的负面,假阳性和假阴性。实际上,精度指标在很大程度上是由类(类N)更大数量的样本。近年来反映病理模型类的分类性能和V,除了类级别分数和对于这两个类,我们进一步定义平均水平分数的年代和V
3.4。分类性能
AAMI的建议后,我们特别关注类的分类性能和V以来这两个无节奏的训练样本类的比例要高得多(2.8%和7.0%)和覆盖大部分的心律失常。F和类的训练样本问非常稀缺的整个数据集(0.8%),和检测精度通常也很低在文献中。图3提出了心跳的混淆矩阵分类结果DS2、深点的颜色显示更准确的预测。总体而言,该方法实现高心电图心跳分类性能类N, S,和诉的大多数情况下类N, S,和V是正确分类。然而,F和类的分类问是不满意的。这主要是由于相当少量的训练样本对这两个类,见表2。此外,我们评估记录级DS2、方法的分类结果如表所示3。18岁的22个录音达到的精度在90%以上。分类精度的其他4录音105,202年,213年和214年是87.9%,85.4%,88.7%,和65.2%,分别。类V的整体分类性能精度灵敏度(92.5%和94.3%)优于类精度灵敏度(78.8%和90.8%)。这部分是因为类子类样本量较小但比类V。
3.5。性能比较
表4比较了interpatient心跳的分类性能和我们的其他方法。一样我们的评估方案,这些方法训练他们的模型使用DS1集和评估在DS2,确保一个公平的比较。正如上面提到的,我们将更多的注意力放在类的分类性能和V而不是整体精度主要由类N非常大的实例(90%的整个数据集)。在诊所,失踪的诊断是特别严重的,可以反映在敏感性指标。同时,精确的诊断是必要的。因此,比较关注分数为病态类和V,考虑灵敏度和精度指标。此外,它很容易做个比较不同方法之间的一个指标。因此,得分的平均值和病态类和V,作为最终的指标。
在[3,4,17,35),采用传统的心电图分类管道,从生的或预处理提取特征基于经验心电图信号,然后将这些提取的特征输入分类器。与这些方法相比,该方法有更高的分数的11.4% - -25%。(23,24),我们利用深度学习模型自动提取有用的特性和分类,再加上一些工艺品的特性。拟议中的对抗性的CNN优于(23,2417.2%和5.8%分别得分。它可以观察到,该方法达到了最高得分。总的来说,该方法在检测病理类优势,特别是类年代MIT-BIH挑战识别的数据集,并获得令人满意的性能(分数> 90%)在检测类V。
4所示。讨论
4.1。RR比特性的影响
探索pre-RR比率的影响和心律失常分类(即near-pre-RR率。,classes N, S, V, F, and Q), the box plots that show the distribution of these two RR ratios among classes are given as Figure4。它显然是观察到两个RR比率可以区分病态类年代从阶级N和V。然而,很难区分年代和诉这是合理的由于病态心电图记录之间的一些共同的特点,如速度过快或过慢节奏。因此,额外的心电图特征学习其他技术是必要的,如深度学习使用。类F,心室的融合和正常跳动时,有一个分布的两个RR比率接近类n类问由未知的节拍。因此,RR比率跨度范围广泛的分布。比较之间的分类性能/没有pre-RR比率和near-pre-RR比例如表所示5。实验结果表明,这两种RR比例特性大大提高检测的灵敏度和精度病态类S和V通过提供更多关于心律的先验知识的深度网络。
(一)
(b)
4.2。常规CNN与敌对的CNN
在这里,普通CNN表示encoder-classifier网络。我们把对手子网从拟议的框架来验证敌对的学习的有效性。相同的数据处理、特征提取和实验设置执行常规CNN和提议之间的敌对的CNN。分类性能的比较如表所示6。很明显,拟议中的对抗性的CNN远优于常规CNN,除了类V是略低的精度指标。常规的CNN是数据驱动的本质上。然而,MIT-BIH数据库中提供的心电图记录收集从一个足够数量的科目。因此,挑战来捕获的特点与使用常规CNN,主体可变性和学习功能可能受到相关的。相反,提出对抗CNN是隐藏对象id的信息对抗的游戏。实验结果表明,学科之间敌对的学习可以大大促进学习可概括的特征是不变的主题。
4.3。选择对抗重量参数
敌对的重量使得学科之间的权衡不变性和task-discriminative性能。一个非常强大的将促进学习的编码器subject-invariant信息。然而,越来越多的会导致失去task-discriminative信息。在这里,我们实现了几个实验来分析不同的敌对的重量的影响 。表7展示了实验结果。为类N,灵敏度和精度不同都是高于90%,这应该归功于大样本数量的年代和V类n类,可以看出,更高的性能低(当 ,0.05和0.1)。当 ,整体性能是最高的。
4.4。学特性的可视化
t-distributed随机邻居嵌入(t-SNE) [36)可以减少二维地图非线性高维数据。在这里,我们应用t-SNE评估该方法直观地。预处理心跳段是256 -维向量(长度是128和通道数量是2)。结合RR比特性和心跳,768维的向量(两个RR比特性和心跳段都是256 -维的向量)被用作输入的敌对的CNN。我们从不同的层提取的输出。可视化图所示5。类的样本大小N是减少数据可视化。它可以观察到从数据5(一个)和5 (b)没有明显的集群存在的输入特征向量。随着层的加深,集群变得明显(数据5 (c)和5 (f))。然而,在前三个残块,每个类的聚类仍然是分离。这意味着这些特征向量不能区分类N, S, V, F,问好,还需要进一步的非线性操作。由全球average-pooling特征向量输出层(图5 (f)),集群非常明显。图5 (f)表明该方法提取的特征的歧视对多级心律失常进行分类。它指出,每一个类可能包含多个集群。这是因为每一个类包含多个子类的一些特性是不同的。例如,束支块击败,正常打属于类N,虽然他们有不同的QRS波群的持续时间。
(一)
(b)
(c)
(d)
(e)
(f)
5。结论
摘要CNN-based敌对的深度学习interpatient心跳分类框架使用一个小主题ECG信号的数量。拟议的框架由一个编码器,分类器,和对手网络。编码器是用来学习表示输入数据生成的原始信号预处理和特征提取过程。然后,这些表示分别输入到分类器和对手对心跳和主题标识进行分类。总体框架是由心跳分类损失最小化和最大化训练对象ID识别损失,执行编码器隐瞒信息对象ID和保留足够的歧视(心跳)分类信息的任务。拟议的框架可以帮助消除interpatient可变性和获得不变表示学科之间利用敌对的学习。因此,特别适用于心电图分类任务的患者数量不足。
数据可用性
MIT-BIH心律失常数据库用于支持本研究的发现是公开的,可以下载https://physionet.org/content/mitdb/1.0.0/。
的利益冲突
作者宣称没有利益冲突。
确认
这项工作得到了国家自然科学基金(批准61922075)和科大双一流的研究资金计划(YD2100002004)。