文摘
提出一种新颖的最大利润与免疫进化聚类方法(IEMMC)自动心电图(ECG)心律失常的诊断。该诊断系统由信号处理、特征提取和IEMMC心电图心律失常的聚类算法。首先,原始心电图心电图信号处理的自适应滤波器基于小波变换,并检测ECG信号的波形;然后,特点是集群从心电信号中提取不同类型的心律失常的IEMMC算法。三种类型的绩效评估指标用来评估心电图心律失常的IEMMC方法的影响,如灵敏度、特异性和准确性。相比之下,KIEMMC算法和iterSVR算法,则反映出更好的性能不仅在聚类结果,而且在全局搜索能力和收敛能力,证明了其有效性的检测心电图心律失常。
1。介绍
心电图(ECG)是广泛应用于心脏病学,因为它由有效、简单、无创、低成本的程序诊断心血管疾病(心血管病)。因为心脏的心的状态通常反映在心电图波形的形状和心率、心电图信号被认为是代表心脏生理、有用的诊断心脏疾病和检测任何心律失常1,2]。
心电图心律失常可以被定义为任何一组条件,心脏的电活动是不规则的,会导致心跳缓慢或快速。它可以发生在一个健康的心脏和最小的结果,但他们也可能表明一个严重的问题,导致中风或心脏性猝死。作为心律失常心电图信号的非平稳信号,可能发生在随机时间尺度,这意味着,心律失常的症状可能不会显示所有的时间,但白天会体现在某些不规则的间隔。因此,对于有效的诊断,ECG信号的变化可能需要观察几个小时。出于这个原因,连同这一事实的心电图数据量是巨大的,这项研究是繁琐和费时。因此,和电脑自动检测和分类的心律失常临床心脏病学至关重要,特别是对于病人的治疗在重症监护室1]。
近年来,几种方法已经开发出来的文献心电图心律失常的检测和分类。人工神经网络(ANN)的分类方法是心电图心律失常识别的主要方法之一。减少很多数据的集成和特征提取技术,如主成分分析(PCA)、独立分量分析,模糊逻辑,以及小波变换(WT),改善安技术已经被证明能够准确识别和分类心电图心律失常(3- - - - - -7]。然而,许多ANN算法受到缓慢收敛到局部和全局最小值,从随机设置权重的初始值(7]。由于支持向量机(SVM)分类器不陷阱在局部最小值点和需要较少的训练输入,各种方法的支持向量机采用心电信号分类和被证明是有效的8- - - - - -11]。
尽管许多心电图心律失常分类方法显示良好的性能在实验室里,只有一些技术的实际应用中很流行。的主要原因之一是,大多数方法是监督方法需要多个样本手动贴上正确的类型的心电图信号在上下文。从这些样本,监督系统可以预测的正确意义相似的心电图信号在一个新的环境。然而,这些数据集是劳动密集型,耗费时间,和生产成本;因此,一些数据可能是标签和可能只是几个模糊的类型。因此,使用这种技术来检测各种心律失常不是最优的诊断心血管心律失常。此外,相同的心脏心脏呈现不同的心电波形的不同个人特征,因为他们身体的差异,如心脏体积和冠状动脉。即使是同一个人,波形将呈现不同的形状,当样本参与不同的活动状态,如散步、跑步,和睡觉。为了解决这个问题,一些开发方法包含无监督技术分析心电图心律失常(4- - - - - -6,12- - - - - -16),不需要任何标记训练样本,可以发现未知的心电图心律失常。在这些方法中,关键是设计一个理想的聚类方法,作为聚类分析的准确性显著影响总体性能。
在本文中,我们提出一个新颖的免疫进化最大边缘聚类方法(IEMMC)心电图检测心律失常。具体来说,我们将心电图心律失常诊断过程分解为三个步骤,包括信号处理、特征提取、聚类。首先,我们运用基于小波变换的自适应滤波器消除噪声和检测心电图波形。然后,表示ECG信号特征提取。最后,我们采用最大边缘集群(MMC)方法来识别心电图心律失常。考虑到大量的心电图数据和昂贵的传统MMC算法计算17),我们建议IEMMC算法改进现有的MMC和使它更适合检测心电图异常。我们的主要贡献是利用免疫进化算法进行优化直接在非凸优化问题由原始MMC制定问题,找到的最优解最大利润。我们IEMMC方法避免解决一个非凸整数问题的要求和半定规划(SDP)在传统松口MMC算法,计算昂贵和耗时。由于杰出的免疫进化算法的全局搜索能力和鲁棒性,IEMMC算法的性能可以保持在一个较高的水平即使随机初始化,质量差和IEMMC方法的收敛性也优于现有方法。
本文的其余部分组织如下。部分2描述了我们提出的心电图心律失常检测系统,包括信号预处理,特征提取,IEMMC心电图心律失常的方法。然后,集群性能是通过仿真实验研究部分3。最后,给出了结论部分4。
2。一种新颖的自动检测系统为心电图心律失常
心电图心律失常自动检测系统包括三个阶段,构建了如图1。第一阶段是预处理包括过滤、基线校正和波形检测。第二阶段是特征提取旨在找到最好的系数设置为描述ECG信号。最后一个阶段是设计集群心电图时期使用IEMMC算法根据以前提取的特征来构造心律失常类。
2.1。预处理
2.1.1。心电图信号滤波
心电图信号可以与几种类型的噪声污染,如运动工件(MA)、肌电图(EMG)噪音,和基线徘徊(BW),从而影响特征提取算法。所以,心电图样品前应该预处理特征提取和集群。由于心电信号和噪声之间的频谱重叠运动工件和基线游荡小于7赫兹,传统的小波分解和小波阈值法将ECG波形失真,失真等波或波信号。对于这种情况,我们采用基于小波变换的自适应滤波器相结合小波变换和自适应滤波技术的优点对ECG信号进行预处理。建设我们的ECG信号过滤显示在图2。
如图2所示,心电图信号滤波器的过程可以概括为以下四个步骤。(1)根据ECG信号的采样频率,至少小波分解层次可以确定通过将ECG信号从高频噪音。然后,心电图信号与噪声小波分解成鳞片。(2)经过小波分解和去除含有高频噪声信号的精确的组件,我们设置了近似组件含有ECG信号没有高频噪声作为主要的自适应滤波器的输入信号。(3)各种波形与频谱的关系和低频噪声,如基线漂移和运动工件,至少小波分解层次可以单独的心电图信号从低频噪声会决定。通过小波分解成天平,左边近似组件包含基线漂移、运动工件,和其他低频干扰将会作为参考自适应滤波器的输入信号。(4)至少意味着广场(LMS)自适应滤波用于预处理的主要输入信号,得到清晰的心电信号。
2.1.2。波形检测
心电图的波形检测信号特征提取的基础。实际上有三个独立的算法,每一个都指定检测ECG信号的波形。
。的检测在心电图波形检测复杂需要一个至关重要的作用。为了实现QRS波群检测,必须位于第一波。根据这一事实波拥有最大的斜坡,心电图振幅差生成数组山峰更加明显。然后,实际上下限是用来去除无关的噪声信号的峰值。为了避免干扰大波,相对不应期,持续200毫秒峰值检测,应该跳过。与此同时,每一个时间间隔应判断逃过检查高峰。
检测。完成后的定位波,和山峰可以根据形态特征识别。和峰值出现在峰在0.1秒之内。连接基线和下降沿的转折点就是高峰。同样的,年代峰能找到正确的一边。
和 波检测。根据正常的心电图信号的波形特征,发现波,波,波交替出现。此外,峰值之间的差距波和不超过0.16秒。这表明,最大电压在0.16秒内峰值应峰,而最大电压之间峰值和下一个峰的高峰。
2.2。特征提取
特征提取是一个过程确定最佳系数可以准确描述心电图波形。为了提取的最佳特性,代表ECG信号的结构,九次域系数属于两个成功心电图时期被认为是,如表所示1。表中第一行的名字是功能,而其余显示每个特性的值。列出所有功能如下:(一)归一化收购之间的间隔波和前面的波();(b)归一化RR收购之间的间隔波和下面的波();(c)归一化QRS获得击败的间隔();(d)归一化公关获得击败的间隔();(e)归一化QT区间属于收购打败);(f)归一化圣获得击败的间隔();(g)归一化获得击败的振幅();(h)归一化获得击败的振幅();(我)归一化获得击败的振幅()。
区间计算之间的时间间隔波和波。区间计算之间的时间间隔峰和高峰。区间计算之间的时间间隔波和高峰。时间间隔测量之间的时间间隔波的起始时间波。从医学角度来看,心律失常的检测依赖于两个或两个以上的ECG信号周期。前一时期的当前心律失常的心电图信号有许多指标。所以,在我们的方法中,两个时间的参数和被认为是心电信号的特征。振幅峰值之间的距离来衡量的波和基线。振幅和振幅以同样的方式。
2.3。心电图心律失常的聚类方法
2.3.1。最大优势集群
MMC SVM的理论延伸到无人监督的情况下,旨在找到一种标签样品通过运行隐式支持向量机与最大利润在所有可能的标签(18]。
数学上,点集和他们的标签,支持向量机寻找一个超平面通过求解优化问题如下: 在哪里是一个非线性函数映射的数据样本在高维特征空间,使原始数据空间中的不可分的问题空间分离的特性。的值称为松弛变量是一个手动选择常数。
不同的支持向量机,给出了类标签,唯一的变量是超平面参数,MMC不仅旨在寻找最优超平面,但也最优标签向量(17]。最初,这个任务是制定的以下优化问题[18]:
然而,前面的优化问题有一个非常“最佳”的解决方案,这是将所有数据分配给相同的类和获得一个无界的保证金。此外,另一个不受欢迎的解决方案是将一个离群值或一个非常小的组剩下的样本数据。为了减轻这些琐碎的解决方案,徐et al。18)实施类平衡约束, 在哪里是一个常数控制类不平衡,可以绑定类大小的差异,避免将所有模式分配给相同的类,然后呢是一个一个向量。
MMC的方法通常优于常见的聚类方法的准确性(17,18]。可以预期,心电图心律失常的检测使用MMC算法将达到一个高水平的准确性。然而,应用方法需要求解一个凸整数问题,计算昂贵,只有较小的数据集可以由MMC处理方法到目前为止。目前,各种优化技术应用于解决这个问题。徐et al。18]提出几个原始MMC松口问题和用它作为SDP问题,然后可以解决标准解决SDP SDPT3和SeDuMi等。Valizadegan和金19)进一步提出了广义MMC算法能显著降低原始SDP的规模问题。为使MMC方法更加实用,Zhang et al。17]提出一种迭代方法,应用支持向量机来提高最初的候选人获得的——预处理步骤。最近,赵et al。20.)提出了一个基于构建的剖切面MMC方法序列中间任务和每个中间任务,解决了使用限制凹凸过程。尽管最近提议的方法改善了MMC的效率的方法,这些方法的应用并不总是得到保证。例如,作为一个迭代方法,iterSVR算法的性能(17)开始与分配一组初始标签对初始化的质量是至关重要的。随机初始化通常会导致不好的集群。
2.3.2。最大利润与免疫进化聚类
支持向量机的概念可以被认为是一个特例正则化问题的以下形式: 在哪里是一个固定的实数,是一个损失函数测量的性能预测函数在训练集是平方准则在再生核希尔伯特空间由内核函数。在支持向量机方法(1),铰链的损失与使用。而不是使用铰链损失,我们的方法惩罚过于自信的预测使用方的损失导致
所以,在我们的MMC算法,我们的目标是找到一个解决方案
为了解决问题(6),原来的非凸问题被认为是优化问题的一个特例,和免疫进化算法找到最优解。最近的研究表明,免疫进化算法具有几个有吸引力的免疫特性,允许进化算法来避免过早收敛和提高局部搜索能力21- - - - - -25]。利用强大的全局搜索能力和免疫进化算法的快速收敛,IEMMC避免SDP的松弛,能找到最优解MMC的有效方法。
IEMMC算法的过程。我们IEMMC算法给出了算法的框架1。
算法1(最大利润率与免疫进化聚类)。
一步1。生成一组候选解决方案记忆细胞的,组成的子集加入剩下的。应满足平衡约束(3),抑制阈值。
一步2。计算亲和力值为每一个。
一步3所示。确定最好的个体,的人口基于一个亲和力措施。执行克隆选择的人口生成一个临时的克隆。
一步4所示。确定最好的个体,剩余的数量基于一个亲和力措施。应用变异抗体人口,hypermutation正比于抗体的亲和力。成熟抗体的人口是生成的。
一步5。重新选择改进的个人和写内存集和人口。
一步6。执行受体编辑,代替一些低亲和力抗体的人口通过随机创建新的抗体,保持其多样性。
一步7所示。如果终止条件不满意,转到第2步。
一步8。回报最好的个人。
的起点是生成一组候选解决方案记忆细胞的,组成的子集加入剩下的。每一个个体构成优化问题可能的解决方案(6)。在我们IEMMC算法,我们可以确保只创建有效的个人;也就是说,个人应满足平衡约束(3)。在步骤2中,关联值计算每个最初的个人,在哪里 根据关联值,抗体生成的副本,和克隆选择上执行个体。在步骤4中,突变过程应用于抗体。如果新抗体的亲和力值比初始值,新的抗体存储在原来的地方;否则,老抗体保存在人口。突变过程后,受体编辑应用于抗体种群。在受体编辑过程中,取而代之的是抗体的抗体人口比例随机创造了新的抗体。最好的个人满足终止条件时,将返回。
健身计算。固定的解决方案,问题制定的函数(6)可以通过标准的支持向量机学习算法来解决。因此,我们可以计算像往常一样从Karush-Kuhn-Tucker(马)条件集群之间的利润最大化。但这个解决方案不是最优聚类问题(解决方案6)。因此,我们继续寻找更好的偏见和聚类标签通过修复和最小化问题(6),这是减少
然后,问题(8)可以解决,而无需使用任何优化解算器由以下命题。起初,我们和使用的中点之间的任何两个连续的值的候选人。从这些候选人,第一个最后一个候选人应该删除不满足类平衡约束(3)。对于每个剩余的候选人,我们确定并计算相应的客观价值(8)。最后,我们选择和相应的最优目标。因为两个和就下定决心、健身价值为新个体可以获得的。
3所示。实验和结果
3.1。实验数据
实验数据在这项研究中使用的心电图心律失常取自MIT-BIH心电图心律失常数据库(26]。所有心电图数据分为五类根据标准促进协会医学仪器(AAMI) [27),因为这个数据库敦促所有用户遵循AAMI推荐。在这个标准,异常心电图可分为以下四种类型。类型包含心房过早(美联社),节点过早(NP)和室上过早(SP)。V型包含过早心室收缩(PVC)和心室异位(VE)。F型包含心室的融合和正常的节奏。类型问包含节奏节拍、节奏的融合和正常的节奏,和非机密的击败。另一种心跳视为N型,包括正常的跳动,心房逃脱(AE),节点逃脱(NE),右束支块(R)和左束支阻滞(L)。
选择完全1682心电图时期从七个麻省理工学院的记录/波黑数据库测试IEMMC算法的正确性。记录的分布如表所示2。第一行对应标签根据AAMI标准。第一列的名称记录,而其他包含心跳的每种类型的数量。
3.2。实验结果
在本节中,我们将演示的优越性提出IEMMC心电图心律失常的检测过程,和以下三种类型的绩效评估指标用于评估心电图的影响心律失常聚类方法: 真阳性(TP)意味着真正的心律失常的数量已经成功地检测到;假阳性的数量(FP)是真正的心律失常,已经错过了;真阴性(TN)意味着相应的数量不属预定目标的心律失常,正确检测到;假阴性(FN)的计数不属预定目标的心律失常,已经检测到错误。
仿真结果表中列出3的性能分析,聚类结果表4。如表所示3和4的正确性,通过使用IEMMC算法,心电图心律失常是在一个较高的水平。
从结果,我们可以发现,N型是最普通和无数心跳,很容易与其他类型分离;所以,它的结果比其他类型。然而,F型的性能低于之前的情况。鉴于形态学F型通常是非常相似的其他类型的,很难描述类型F。
为了验证和测量IEMMC算法的优越性,并行开发三种方法比较与我们的算法,包括标准算法,则iterSVR这是第一种方法能够处理大型数据集(17),而支持向量机已被证明是一个成功的监督学习方法心电图识别和分类8- - - - - -11]。所有聚类方法的性能图所示3。两个初始化方案开发iterSVR和IEMMC实验:随机的;标准——集群(公里)。在第一个方案中,初始候选解IEMMC和iterSVR是随机生成的。在第二个方案,iterSVR初始化的标准——集群。只有一个初始化IEMMC候选解决方案的标准——集群,其余的解决方案是随机生成的。类平衡参数IEMMC和iterSVR总是设置为。此外,20%的心电图数据随机提取支持向量机的训练数据分类。激进的基函数(RBF)的内核用于所有内核方法的实验。至于正则化参数,我们选择最有价值的候选人(1、10、100、500)为每个数据集。所有的算法,分别重复三次,因为固有的随机性。为每个方法和每个数据集,我们报告结果与最佳值选择的候选人。
(一)敏感性
(b)特异性
(c)准确性
从图3IEMMC的性能一样类似的SVM和比的聚类方法。同时,我们可以发现iterSVR的性能很大程度上取决于初始化的优越性。用随机初始化、集群iterSVR比这更糟的结果则算法。以来的表现甚至也不满意,则初始化则,iterSVR仍不能满足期望的心电图诊断心律失常。然而,继承优秀的免疫进化算法的全局优化能力,IEMMC算法可以找到最好的聚类目标函数在很短的进化时期,即使在随机初始化的情况下。此外,IEMMC算法不仅擅长而且在收敛性能。虽然iterSVR需要重复十次找到解决方案,IEMMC算法只需要发展四代。尤其是IEMMC算法可以获得相同的最优解几代人不同的初始化的演进,由于突出的收敛性和全局搜索能力。性能优良的实验证明,IEMMC算法非常有效的检测心电图心律失常。
4所示。结论
摘要小说IEMMC算法集群ECG信号和检测心电图心律失常,迭代更新质量的候选人通过免疫进化不雇佣任何培训过程。实验分析表明,我们的方法收益率比一些竞争方法在大多数情况下更好的聚类性能。
在未来,我们将使用一些其他的生物原理基于进化算法解决MMC问题,如蚁群优化和粒子群优化器,因为它们已经被证明有全球optimizaton能力。此外,与免疫进化算法将找出更有效的完成心电图数据聚类算法。
确认
这部分工作是支持中国国家自然科学基金重点项目(没有。61134009),专门研究基金会上海领导人才,上海市科学技术委员会项目(xd1400100 11号和11 jc1400200),中央大学和基础研究基金。