文摘
心脏节律障碍,心房颤动(房颤)是最致命的。因此,心电图信号起到至关重要的作用在预防心血管疾病的及时检测心房纤颤的病人。不幸的是,定位可靠的自动对焦在临床设置仍然是困难的。今天,深度学习复杂的数据分析是一个强有力的工具,因为它需要小pre和后处理。结果,几个机器学习和深度学习方法最近被应用于心电图数据自动诊断房颤。本研究分析心电图(ECG)数据从生理网/计算2017年心脏病(CinC)挑战区分心房纤颤(房颤)和三个其他节奏:正常,,太嘈杂的评估。心电图数据,包括房颤节律,分类使用新颖的模型是基于传统的机器学习技术和神经网络。从心电图数据分类房颤节律,这种混合模型结合卷积神经网络(残余网络(ResNet))与双向悠久的短期记忆(BLSTM)网络和径向基函数(RBF)神经网络。F1-score和最终的混合模型的准确性相对较高,分别为0.80%和0.85%。
1。介绍
一种常见的心律失常被称为心房纤颤(房颤)与心脏相关疾病(中风和心力衰竭(1,2]。它失望会增加心血管疾病的风险,因此,显著影响抑郁和死亡率(3,4]。此外,房颤在全世界影响许多人,风险随着年龄的增加5]。人工智能(AI)的能力和人工智能技术来提高心血管疾病的早期检测与一些努力在心电图测试仍主要是未知的。2017年心脏生理网/计算竞争阻碍了主流学者从编程AF提议解决方案检测短暂单管线心电图数据(1]。测试是作为一个传统的机器学习问题,明显准备组和建议评估隐形测试集的记录。无论最后的位置的主要评估该模型的精度,各种不同特性应该为每个命题的拨款之前评估在临床实践中。因为它完美地捕捉的电子运动心脏活动(1心电图的决心可以提供主管AF检测在临床实践3]。因为症状发生在集,它是具有挑战性的研究房颤在正常办公室访问(2]。最近的技术考虑检测房颤中的高死亡率和不足(6]。ECG信号的AF本地化进行考试时间或复发。目前房颤复发通常评估/删除QRS波群和标志T峰大厦(7,8]。本研究旨在提供一个描述模型和评估的能力单独短暂单管线心电图信号分为房颤,正常(N),噪声和其他节奏(O)使用2017年心脏病挑战生理网/计算数据库(9]。
最常见症状的工具识别心律失常心电图。房颤是最常见的心脏乐感问题特点是混乱室压缩(4]。房颤发病率的增加与每个成功十年的年龄,从50到59年的0.5%约9%在80 - 90年10]。据估计,230万年美国成年人患有房颤,预计到2050年将增加到560万随着人口老龄化(11]。房颤被认为是实质性的死因和痛苦,因为它会增加心力衰竭和中风的风险。
出于这个原因,各式各样的编程计算管理表面心电图信号提出了近年来。许多滥用这两个变化引发心律失常的心电图。从一个角度来看,房颤是快速心房运动的描述,它的速度可以改变在240年和540年之间驱动/分钟(12]。因为每个贝壳房室(AV)中心,一个快速和零星的心室反应可以看到心电图。毫无疑问,这种行为与普通的例子的rr临时安排在典型窦情绪(NSR)。然而,NSR期间,齐次p波与心室去极化被一系列low-fullness fibrillatory波与不同形态(f-waves) [12,13]。房颤病人后通常underanalyzed和杰出的礼物中风或心脏衰竭等严重并发症。
药物可以缓解副作用并帮助阻止真正的困难,例如,中风。电生理医疗程序和射频除有效恢复一个普通的情绪[14]。后期进展的创新(安排和计算电网)使它可能增长最少的努力,广泛易得,确切的药用产品。这些设备可以用于解决缺乏医疗服务资产创建场景和较低的发达国家的社会保险的费用。房颤发现者考虑初步筛选和识别证明房颤与手动策略。最新的计算中发现心室和心房运动调查的反应。加西亚et al。15,16)描述房颤,包括脉冲变化,小波熵和纵波的认可。然而,目前房颤识别策略在临床设置限制(17]。在以往的考试中,订单执行只是清洁的信息。尽管如此,喧闹不停地观察设置是不可避免的,因为铅分离,呼吸,或运动。
此外,这样的设置区别房颤信号从常见的迹象17]。由于房颤是经常误诊为其他类型的心律失常,房颤的表征与选修节奏有助于使搜索更加健壮。房颤是一位杰出的可能性,这种全面的多功能设计创新的影响将会很高。在任何情况下,尽管有少量付出治疗设备的可用性,能够合理地处理信息通过电话,和的庞大数据库的可用性生物,几乎什么也没做作出深刻的计算可以自然地翻译这个治疗信息。2017年心脏病挑战生理网/计算(18)地址这一主题。它激发全球分析师创建方法安排房颤从短单管线心电图(ECG)记录了使用手机。
工作已经进入了心电图分类,更多的是在这个过程中完成的。在[19),加西亚等人提出一种新的策略,利用心室和心房活动变化,表面上看心电图(ECG)所示。首先,生成的时间序列从RR区间和fibrillatory波形态来源于TQ是发达。样本熵的系数是用来测量他们的规律(COSEn)。收集数据终于统一通过多类支持向量机方法处理感知在短的房颤发作,正常窦性心律(NSR),和其他节奏(或)。
Rajpurkar et al。20.)建议使用ResNet模型对心电数据进行分类分为四个不同的组。Rajpurkar等人也把其他一些高级特性,比如心房活动的统计建模,研究心率变异性的频率和时间域,功率频谱分析,等等。他们设计了一个分层分类模型采用过采样技术跨类别来确定心电图信号是正常的,吵闹的,表现出心房纤颤(房颤),或显示另一种节奏。Maknickas V和Maknickas (21建议使用一个LSTM网络心电数据的分类。这个网络利用直接从预先计算的QRS波群特征学习模式。从每个脉冲的过程中提取信息的心电图数据描述在文献[22]。
Jimenez-Serrano et al。972年)发明了一种自动提取方法从8528心电图记录心室活动参数提交给2017年心脏生理网/计算挑战。之后,使用一组执行网格搜索前馈神经网络(FFNN)训练参数进行特征选择(FS)和培训/验证方法(3]。作者使用模板响应某个心率变异性,波形和演算法分类器。multiparametric心房纤颤的分类描述的是(23]。这种分类是基于HRV分析、噪音检测,发现心房活动的存在纵波在平均节拍和f-waves TQ间隔,并击败强大的合成平均后的形态学分析节拍和界定P, QRS, T波。(23是被引用的例子。一个线性判别分类器被用来分类心电图数据,当时分为四类。此外,Ojha et al。24)建造了一个深autoencoder-based SVM分类器进行分类使用心律失常的心电图信号分为五类数据库和先前发表的研究,用更好的结果。这导致了一个更准确的ECG信号的分类。
这种分类任务执行使用各种模式识别算法。因此,本研究旨在开发一种新的模型基于深度学习技术的早期诊断心律失常的心电图信号。也就是说,它侧重于心律失常和心电图信号处理和分类模型提出新的模型,可以帮助心脏病的早期诊断心律失常。
本文的重大贡献是以下:(我)本文的数据集是来自生理网挑战(计算心脏病挑战)2017(2)首先,我们进行了数据预处理任务使用巴特沃斯带通滤波器消除噪声的ECG信号(3)之后,z分数标准化执行过滤ECG信号的振幅值(iv)本文使用的数据集是高度不平衡。因此,我们使用杀少数抽样技术(合成)技术来平衡数据集,然后测试数据集分为训练数据集建模(v)我们有训练有素的三种不同组合的深度学习模型的训练数据集,即ResNet, BLSTM的混合物和ResNet ResNet RBF技术的结合为心房纤颤的心跳ECG信号的检测(vi)然后,执行验证测试数据集分类ECG信号分成四类:正常,房颤,噪声等(七)最后,本研究引入了一个新的混合模型基于深度学习技术分类ECG信号分成四类:正常,房颤,噪声等。这些模型也提高效率和有效性的心跳比其他机器学习分类和深度学习模式使用相同的数据集ECG信号的挑战
剩下的论文结构如下:部分中描述的方法和材料2。部分3介绍了提出的设计方法的结果和讨论结果。最后,部分4本文的结论。
2。材料和方法
深度学习技术是现在最常用的医疗。提出了两个深度学习方法在这项研究中,卷积神经网络(CNN)和LSTM。参数共享、平移不变性和稀疏连接使CNN训练计算有效且受人爱戴的在计算机视觉25,26]。cnn的缺点是,他们依赖于网状结构函数(例如,图像或固定段windows)。他们在图所示1。
最近的一个发现,帮助培训和提高精度的更深层次的cnn是残余网络(ResNet) [27]。利用快捷身份的连接类似于前馈LSTM (RNNs亚型)[18,28],ResNet特性映射从较低的层可以在更高的阶段。
2.1。数据集集合
心电图监测读数在使用AliveCor工具和公开的挑战。生理网的挑战与开放的数据库服务器用于训练的8528单管线ECG和相应的注释和测试使用一个封闭的数据库3658年心电图记录(数据)。正常窦性心律(N),心房纤颤(A),其他节奏(O),嘈杂的录音是ecg的四类数据库中发现。这些范围从9到61秒的长度,单管线300 Hz心电图记录。信息存储库提供了一个可下载的zip文件。表1和图2为各种类别显示心跳的总和。
2.2。信号预处理和标准化
每个ECG段预处理使用10阶巴特沃斯带通滤波器(29日]。这些过滤器的截止频率5赫兹或45赫兹(窄带)或1 Hz或100赫兹(宽带)。巴特沃斯滤波器的频率响应是完全平坦的(即。,没有涟漪)在通带和阻带中趋于零。过滤器有平滑的强度曲线。对于这一分析,我们选择了心电图数据分割成20秒样本,每个代表一个心跳。
考虑到有一个300 Hz采样率。
因此,每一段训练都是20秒的长度,匹配CinC 2017数据库的需求。分段心电图记录之前,记录规范化是一个零均值和标准差。这是因为心电图已经带通滤波(22)的记录装置,所以不需要任何额外的过滤器。使用z分数归一化技术,振幅值转化为0 - 1的范围,使其更具有可比性。 在哪里代表了每个样本的心跳,意思是通过计算平均20秒ECG信号的值。在这里代表标准偏差。
2.3。过采样
预测精度通常用于评估深度学习算法的性能。尽管如此,这是不可接受的,当数据不平衡,和不同的成本错误发生显著的变化。目前的工作使用合成少数过采样技术(打)30.]。它是基于过采样策略,少数下课检查通过“制造”模型,而不是过度检查更换。击杀方法生成新的合成少数类样本数据没有口是心非。再计算每个少数类观察邻居。然后,合成数据样本创建使用一个或多个再邻居,需要根据采样过密的程度。
2.4。提出深刻的学习模式
在目前的工作中,我们采用了两种不同的方式。一个类似于(20.],ResNet模型用于分类的心电图记录分成四类,和其他方法使用多个模型,包括ResNet模型。这个ResNet模型有36层,结合卷积层,max-pooling层,和完全连接层。这种方法使用双向长期短期记忆(BLSTM)和径向基函数(RBF)模型。是一个直观的混合方法看透如何结合不同的神经网络模型组合起来,形成一个奇异混合模型,可以通过提高效率完成分类任务。
2.4.1。双向LSTM (BLSTM)
双向LSTMs增强模型性能分组描述任务增加传统LSTM [31日,32]。BLSTM列车两LSTMs而不是一个信息。第一个是基于序列的信息,而第二个是基于信息的重复序列转过身(33]。它包括复制断断续续的主要层系统中,目前有两层彼此相邻,让信息分组对顶层的贡献和切换重复第二信息安排(https://machinelearningmastery.com/develop-bidirectional-lstm-sequence-classification-python-keras/)。LSTM单位之间的关系使数据通过一个圆在附近的时间步骤,使得一个内部条件的批评,使系统能够理解时间的想法和发现内部的瞬态元素引入数据。LSTM单位可以召回或忽视数据通过保持内存的状态。最关键的数据保存和back-engineered,而忽略关键数据和丢弃的越少34]。BLSTM网络的体系结构如图3。
2.4.2。混合架构
一般分类直接用于LSTM不产生特定的结果。因此,它是一个很好的策略,使用混合模型结合ResNet (CNN)与LSTM有更精确的结果35,36]。ResNet (CNN) LSTM模型利用ResNet层特性加入LSTM层来帮助学习准确的预测。ResNet (CNN)和LSTM在ECG信号表现相当不错。此外,深刻学习模型不需要任何手工提取亮点,他们通常是简单的实现(34]。从今以后,本文使用的混合这两个计算来确定心律失常。双向LSTM支持收益率ResNet工程订单信息分成四类,即,房颤,正常,噪音等等。图4显示了混合结构的ResNet和BLSTM模型。
另一个变体包括喂养ResNet模型的输出为一个RBF (37,38]。RBF神经网络分类的任务是传入的数据从ResNet模型到上述四类,如图5。
3所示。结果与讨论
上述模型训练和测试使用公开可用的免费云笔记本(http://colab.research.google.com)。Google Collab环境提供了一个免费的GPU上限高达11 g和358.27 GB的内存,CPU频率为2.3 GHz的特斯拉T4系统内存时钟频率为1.59 GHz。数据集是直接从生理网下载的网站,以避免从本地机器上传数据的开销。因此,上述硬件设置提供了一个有效的方式来训练和测试深度学习神经网络没有任何本地设备的干扰。0.001使用的学习速率模型,和亚当优化器使用,存在于Keras库。交叉验证是一个重采样的方法来评估人工智能模型与有限样本信息。摘要利用5倍交叉验证策略。给定的方法只包含一个参数, ,指会议的数量,包括一个特定信息测试。这种方法通常被称为k-fold交叉验证。整个数据集是首先在这个策略分为k相等的部分。然后K - 1部分是用于训练分类模型,最后Kth部分是用于测试训练模型。因此,在这种方式中,模型是训练有素的Kth时间在数据集的不同部分,每一次,我们测试模型的一个新的Kth数据集的一部分,模型在培训期间,没有看到。
下表描述了我们的实验结果,不同的模型训练和测试使用5倍交叉验证策略。训练和测试数据集分成80 - 20为本文中使用的所有模型。准确性和F1评分被用来评估模型的性能。F1是一个指标,结合精度和召回评估模型的正确性。
表2给5倍交叉验证结果ResNet-36模型和情节的变化验证准确性验证运行和F1计算分数,实现整个F1分数的80.58%。
图6情节的变化验证准确性与ResNet 36模型对不同时代5、10、15、20。可以推断,时代的最大验证准确性达到84.40% 20与交叉验证数字5。验证准确性一直线性增长时代的数量。
表3介绍了准确性和计算F1分数使用5倍交叉验证ResNet和双向LSTM的混合模型。整体计算F1得分是80.08%,与不同的F1得分在5倍交叉验证为71.73,77.97,79.85,84.93,85.94%,respectively.Figure7显示了时代的数量如何影响各种交叉验证方法验证的准确性。它实现了验证精度最高的82.87%,增加了与时代。
表4显示了F1的变化分数和验证准确性ResNet和RBF网络使用5倍交叉验证。它已经达到整体F1分数的80.20%。数据8和9显示精度变化和F1分数不同的时代实现验证精度最高的84.56%。
在目前的工作中,我们简单的心电图记录分为四类使用ResNet等深度学习神经网络混合模型(ResNet和双向LSTM), ResNet + RBF神经网络。我们比较不同模型的结果并得出结论,提出模型相比,取得了显著的成果中讨论相关工作(29日]。中使用的模型(29日]是有限的扩展模型只有一个特定值由于计算杠杆,但我们目前的工作没有考虑因素。我们的结果已经得到了明显的改善。然而,扭曲的局限性和噪声信号提出了一种挫折,导致底部整体精度和计算F1评分。
工作证明了加西亚et al。19)多类支持向量机方法用于分类,取得了73%的F1的分数。相比之下,Rajpurkar et al。20.)使用的方法ResNet(34层),将心电图样本序列转换为一系列的节奏类。他们实现了79.9%的总体F1的分数。另一方面,科波拉et al。1)层次分类模型用于心电图分类到不同的节奏类F1分数的78.55%。Maknickas V和Maknickas (21)使用LSTM网络学习模式直接从预先计算的QRS波群特征分类心电图信号,实现了F1分数的78%。施瓦布et al。22)使用合奏RNN与LSTM注意力模型,取得了79%的F1的分数。Andreotti et al。29日)使用ResNet模型并实现了79%的准确性。Jimenez-Serrano et al。9使用前馈神经网络(FFNN) F1分数的77%。我们现在的工作有两种不同的方法,一个类似于(20.,29日]ResNet模型,另一个是ResNet混合模型的变异与BLSTM ResNet RBF的F1分数达到80.58%,80.08%,和80.20%,分别。表5和图10描述该模型的性能比较与现有的作品。
4所示。结论
总的来说,许多研究已经完成心电图分类、节奏和目前的工作增加了ResNet模型的另一个变体和两个新的混合架构涉及BLSTM和RBF网络。结果显示承诺和以各种方式可以增加更多的公开和公开数据的可访问性,目前的研究已连续障碍。新的生物医学技术让研究人员应对前所未有的精确数据。然而,鉴于这项工作的性质和不同的深层神经网络,我们可以放心,有一个广泛的范围可以做改进。许多研究人员不断致力于这个问题域,和许多研发机构的兴趣。因此,它让我们假设这个领域蓬勃发展和超越。
虽然我们也尽力了将在这一领域最大的模型,鉴于时间和计算资源有限,一个巨大的大量技术和模型像多层感知器(MLP)等,可以应用于给定的问题域。因为工作涉及到大量的计算和物理数据资源,随着新的和更好的技术,我们可以试着减少复杂性来推断导致更多的优化时间。
数据可用性
数据将在需求。
的利益冲突
作者宣称没有利益冲突。