文摘
人工神经网络(ann)是机器学习技术,受到生物神经元中的原则。该技术已被用于预测和分类问题在许多领域的医学信号处理。本文的目的是确定个人的死亡风险高的急性心肌梗塞后使用安。训练数据集连续安1705病人24小时心电图监测、短心电图分析、无创性beat-to-beat心率变异性,压力反射敏感性,随访3年。为生存所提出的神经网络分类器显示良好的性能预测:88%的准确率,敏感性81%,特异性93%,收于0.85点测量,曲线下的面积值为0.77。这些发现支持这一理论,高患者交感神经活动(减少压力反射敏感性)死亡率独立于其他风险因素的风险增加,人工神经网络可以显示个人更高的风险。
1。介绍
许多研究已经出版的心脏风险评估,目标识别的子群死亡的高危患者心肌梗死(MI)后(1]。识别那些在更高的个人发展第二个心血管事件的风险是非常重要的,这样他们可以正确地遵循和治疗。当代心脏康复/二级预防(CR / SP)计划旨在减少心血管风险和事件率,促进健康行为,促进积极的生活方式(2]。心脏病学家非常困难的挑战是确定哪些病人风险足够高的心律不齐的死亡。因此有必要确认arrhythmogenic个人背景谁将获得受益于一个植入型心律转复除颤器(ICD)的初级预防心源性猝死(SCD)的基于心率变异性分析(3]。在先前的研究心率变异性参数后被证明是独立的风险预测SCD MI (4]。尽管所有这些知识风险分层模型预测精度有限。最近发表的研究显示,超过半数的初级预防植入设备没有发表任何冲击前电池需要更换(5]。精确的分类和准确预测模型可以提高临床路径的最脆弱的患者。使用统计模型的预测能力是有限的,所以出现替代模型,人工神经网络(ann)变得更受欢迎6]。
安了机器学习技术,有可能提高性能的预测临床结果。人工神经网络是很好的解决方案分类器与多个输入参数和模式识别问题(7]。安能预测一个特定类别的一组输入变量,可以进一步用于详细的分析。先前的研究未能发现特殊的简单的心肌梗死后预后风险评估的准确性(8]。限制强调偶然输入变量之间的关联,它可能是有益的指导人工神经网络发展呈现一个子集的输入变量更容易预测的结果。本文处理的分类和风险评估不同的自主神经系统组心率变异性某些参数的基础上使用一个人工神经网络(ANN)。我们的研究使用安的主要动机是解决高度非线性问题的能力和发现未知输入参数之间的关系。研究的第一个目的是为了提高死亡的预测使用不同的预测技术,像安和标准的统计模型在急性心肌梗死后早期阶段。第二个目标是识别这些患者全因死亡率更高的心血管风险。最后但并非最不重要,问题应该指出的方法准备数据、变量选择、确定截止值表示变量,并使一个精确的预测模型。提出了本研究的方法和初步结果和讨论在第七届国际研讨会上的无创性心电学(9]。
测定患者高心血管风险后的急性期心肌梗死使用自主神经系统模式和先前的独立风险预测因子提高使用安[10,11]。
变量模式的识别相关的不良结果导致自主的理解背景和安的“学习”能力之间的复杂关系的一系列输入(预测)变量和相应的输出(结果)变量12]。根据输入和输出变量之间的关系确定,训练数据集可用于模式识别或分类任务在一个单独的测试数据集。常用的统计模型使用变量的线性组合,因此,不善于严重非线性复杂的交互建模为已经证明在复杂的心血管系统(13]。在此前进行的研究的一些优势安在标准的统计方法已经提出:神经网络模型需要更少的正式统计培训开发,可以隐式地检测复杂非线性独立和相关的变量之间的关系,有能力检测所有可能的预测变量之间的相互作用,可以开发和使用多个不同的训练算法(12]。安已经成功地应用于广泛的生物医学问题,安和先前的研究已经表明,各种方法可以准确地预测一个结果(14- - - - - -17]。
2。材料和方法
2.1。研究人群
用于安训练的患者人群包括1705名患者承认在2003年和2013年之间冠心病监护病房的临床医院中心Bežanijska科莎公司,贝尔格莱德,塞尔维亚。承认患者记录急性心肌梗死后的第一天使用心电图(ECG)和短期HRV分析,虽然霍尔特心电图记录两周后。第一次访问的日期作为起始日期,和生存状态是由接触病人。生存数据被用来评估他们的危险比和确定全因死亡率。
所有实验协议被批准的当地科学大学临床中心伦理委员会”Bežanijska科莎公司,“1039/3许可证号码。所有的参与者都充分了解研究,给他们书面同意同意《赫尔辛基宣言》。
入选标准是人> 40岁或绝经后妇女,急性缺血性心脏病心肌生化标记,验证了st段抑郁,或让反演≥0.1 mV在至少两个连续的领导没有伴随Q-waves的存在这些线索。
排除标准是左心室肥大,右心室肥大,左、右束支块,心房扑动和颤动,前部和后部hemiblock,节奏韵律,Wolff-Parkinson-White综合症和室性心动过速或不完整或错误的数据。
2.2。数据库
数据获得使用短心电图分析席勒(10),非侵入式beat-to-beat心率变异性,和压力反射敏感性(专责小组监控)和24小时动态心电图监测与长期HRV分析。从12-channel获得心电图参数记录在过去5分钟使用商业软件(席勒10、奥地利)。工作组监视器(CNSystems、格拉茨、奥地利)用于监控beat-to-beat心率的心电图和血压beat-to-beat血管卸载技术(18),自动修正的示波的血压测量侧的手臂。专责小组监控自动提供的beat-to-beat光谱分析心率和收缩压和舒张压变异性,应用自回归方法。压力感受性反射敏感性(BRS)自动评估使用序列技术根据Parati et al。19]。干预是可以设置使用工作组监控;它有助于定义时间自动统计分析(20.]。均值和标准偏差(SD)定义的自动测量参数计算稳态周期。得到了24小时动态心电图记录12导心电图,采样率为1000 Hz每个铅(美国DMS Cardioscan),由一位有经验的分析师和分析。检查记录,并加以纠正,进行进一步分析。频率的分析(光谱)域参数进行使用快速傅里叶变换(FFT)和汉宁窗。
2.3。预处理
在收集数据的分析,发现几个问题:极端值,缺失值,和不平衡数据。在记录期间极端值是错误的结果(病人运动,可怜的连接,等等),手动删除,以确保我们不切断一些真实数据没有错误。极端值是容易识别,因为它们通常是十倍大于预期的范围。缺少相应的属性值与平均值取代相应的类的所有实例。虽然这是最简单的技术,它保证它不会干扰数据集的统计数据。不平衡数据的最大问题是训练神经网络分类器,分类器的性能评估。平衡的数据集是由随机选取相同数量的病人(200)两类病人(存活和死亡)。这些并不是唯一的技术(和可能不是最好的),可以使用,但是他们是常见的做法,他们给好的结果。详细描述本研究中使用的所有15个参数表提供1。
这些参数被选为死亡风险预测的基础上,统计分析之前进行的研究(21,22]。基于这些研究,这些参数已被选定为安训练在这项研究中,为了进一步研究他们的预测能力。统计分析是用来评估选定的参数的预测能力。
2.4。统计分析
存活曲线(图1)使用kaplan meier创建的方法。这项研究的主要终点是全因死亡率。变量和死亡率之间的关联是通过考克斯多元逐步回归分析评估。死亡率随着时间的比例风险评估与Cox回归。回归模型是由最初包括与重要因素( )单变量关联。多变量Cox回归(SPSS软件,版本19;SPSS Inc .)是用来确定修正的风险比(人力资源)可能的混杂变量。小时和95%置信区间(CIs)介绍;一个值≤0.05被认为是具有统计学意义。这些结果表明,选择参数预测全因死亡率有显著预测力。
2.5。神经网络训练
训练一个神经网络分类器、神经网络软件Neuroph (http://neuroph.sourceforge.net/(图)被使用2)。Neuroph是免费的,开放源码软件,并提供一个图形用户界面和可视化工具(图3),这使实验有不同的设置神经网络架构和培训。
多层感知器神经网络架构与反向传播学习算法被用来训练神经网络。这个架构是很出名的,申请分类问题。随机抽取70%的数据集被用来训练神经网络分类器,而其余的人(30%)是用于测试。这种数据集分割是常见的做法在神经网络训练中,用于避免过度拟合的网络,实现良好的分类性能数据并没有被用于训练(23]。确切的分流比主要取决于数据的数量,和最优比率可以确定启发式的。相同的技术已经被用于其他相关研究(7]。
培训和测试程序是重复多次来确定最优的神经网络设置(隐藏层和神经元的数量)和学习规则参数。
3所示。结果
在平均随访3年(范围1.2 - -4.8 y), 286(16.77%)的1705名患者死于心脏的原因。未经调整的kaplan meier生存显示更糟糕的生存下的减少br 5, 33 /毫米汞柱(女士= 0005(图)2)。单变量Cox比例风险模型显示以下协变量在统计上显著的风险率表2和间隔使用,建议截止值进行进一步的分类和预测。多变量回归分析揭示了重要的关联,减少br 5下,33女士/毫米汞柱(人力资源:5.58,95% CI: 1.25—-24.95, )与生存。没有统计上显著差异或全因心血管死亡率的风险比率LFnu-RRI, HFnu-RRI,低频/ HF-RRI。
在神经网络训练,许多不同的设置神经网络架构进行了测试。为每个训练模式的一组标准计算使用测试集分类性能措施。最成功的训练和分类器性能的关键参数是隐藏层,许多隐藏的神经元,误差阈值。结果如表所示3。
所有架构了11个输入神经元对应11输入参数和一个输出神经元,它对应于一个单一的二进制输出。神经网络架构在第一隐层神经元25和30第二隐层神经元(数量)显示最佳的分类性能:88%的准确率,敏感性81%,特异性93%,0.85测量。接受者操作特征(ROC)曲线最好的神经网络分类器(建筑数量)如图3。曲线下的面积值如下:AUC = 0.77。
另一个关键参数获得良好的网络的泛化能力和测试结果的误差阈值。0.03误差阈值的价值表现出最好的结果。
4所示。讨论
心电图和血压监测可用于评价心肌梗死后患者在早期阶段。在过去的几年里,以计算机为基础的学习模型显著提高预测能力不良心脏事件(24]。的当前理解临床相关预测患者AMI后本文综述。压力反射敏感性受损心肌梗死后被广为记载在先前的研究25,26]。在人类中,心肌梗死后抑郁的BRS临床预测死亡率增加的27- - - - - -29日]。在我们的研究中,多变量分析表明,减少压力反射敏感性的价值低于5.33 ms /毫米汞柱观察组患者是唯一独立的风险预测的研究参数。
预测模型是建立在最初包括单变量分析有统计学意义的因素。单变量分析的主要缺点是,它描述了生存的因素正在调查但一定忽略了其他的影响(30.]。然而,很可能要求的假设Cox模型可能并不满意,因为模型假设潜在的风险率是独立变量的函数,而不是生存时间(31日]。生存分析通常使用Cox回归模型显示了结果基于整个人口,但这不足以预测个人的水平。个别病人生存的预测,神经网络构成的好选择经典统计方法(32]。
尽管一些先前的研究显示间隔之间的关系长期高职院校学前教育专业或全因死亡率和心血管死亡率在一般人群中,其他的研究表明,关系不一致,风险可能是小33,34]。在我们的研究中,单变量Cox回归分析的个体风险使用心电图参数预测,短期心率变异参数,和24小时动态心电监测参数没有显示统计学意义的生存患者心肌梗死后使用基本面分析。使自主神经系统模式为每个参数及其分析为特定值区间统计意义,指出了使用这种方法的优势在统计数据。一项研究心电图表现连续随访间隔> 440 ms AMI后表明,高职院校学前教育专业在出院独立价值预测重大心脏事件(35];另一组间隔> 445 ms独立预测表明,高职院校学前教育专业STEMI患者的全因死亡和心脏衰竭(36]。我们的研究显示统计学意义全因心脏死亡率在一组间隔与高职院校学前教育专业> 434 ms。ATRAMI研究表明,低价值的心率变异性(SDNN < 70 ms)或br (< 3.0 ms /毫米汞柱)是一种重要的多元心脏死亡率的风险(37)相比,我们的研究减少SDNN < 120 ms建议更高的风险。各种参数的预测价值评估使用安。增加数据分析的人工神经网络在急性心肌梗死患者的生存方法明显改善,证实该模型完全和准确的应用于风险分层和随访。使用标准的统计模型,我们得出结论,该集团与高心血管风险有交感神经过度活跃。按照结果,治疗应包括肾上腺素能封锁提出(β-受体阻滞剂、血管紧张素转换酶抑制剂等)。类似的结果已发表在其他研究[38,39]。安显示明显比另一个更好的结果在预测患者的生存模型常用的不同的研究(40- - - - - -42]。
为生存所提出的神经网络分类器显示良好的性能预测,尽管样本量不足,确保统计的满意度。问题的一部分在准备的数据是不完整的和错误的数据,由计算手动解决相应的值或删除样本。
神经网络训练需要大量的实验找出最佳的架构(隐藏层和神经元的数量),实现最优的分类性能。已经取得良好的效果,一个隐层15隐藏神经元;然而这个数字增加到30隐藏神经元没有给出任何改善分类性能。所以结论是,使用一个隐藏层神经元与超过15增加计算要求,不增加分类器的性能,可能导致过度拟合模型。
添加另一个隐藏层和使用11-15-7-1神经元的结构层,分别,也没有给出任何改进。所以结论是,添加一个层上的第一个隐层也不会导致分类器的性能提升。
用建筑5号,11-25-30-1层的神经元,给最好的分类性能。也是有趣的注意,增加更多的隐藏神经元第二个隐藏层(架构)给比建筑更糟的结果(几乎和架构)。这些结果表明,使用更多的隐藏层神经元和不能带来改善分类器的性能,这是一个关键参数,需要进一步研究这种类型的应用程序。最优结构和分类性能很大程度上取决于使用的输入参数。结果表明,统计分析可以表明一个可靠的输入参数的选择。
5。限制
本研究有一定的局限性。本研究的局限性之一认为心率变异性分析所需的信号。为了获得明确的信号,消除样品与任何噪音或心律失常,这减少了一群患者心肌梗死后更高的心血管风险。克服的局限性,有必要在大组患者进行研究。心电图参数间隔在放电和放电后并不像高职院校学前教育专业测量或分析,它是未知是否有更好的预测价值。mi后时期,心血管风险评估参数应该多次重复。另一个限制是黑盒相关算法的性质。在这一点上,很难解释和调试结果,以及理解可能不同的结果。使更大的数据集有多个输入变量更长时间的随访期间将提供更精确的结论尤其是参与心血管疾病的发病机制非常复杂的机制。风险因素的选择将作为神经网络的输入应该是派生通过训练集的特征选择过程,在安交叉验证过程。 Further investigation needs to be established, but a good survival predictor must be able to deal with these obstacles.
6。结论
本研究提出的一种生存状态预测基于ANN分类器训练与HRV分析获得的数据。受过训练的人工神经网络实现令人满意的贡献的预测结果在心肌梗死后患者更高的风险。该研究概述了临床决策过程建立基于神经网络的算法,包括数据预处理、特征选择、神经网络优化和性能评估。分类的基础上,自主神经系统模式可以可靠地表明个人更高的风险。这些知识是至关重要的决定进一步观察和治疗。
分类器的性能很大程度上取决于输入参数,用于培训的安和隐藏层数和神经元。安培训适合使用输入参数可以确定使用统计分析和kaplan meier心脏死亡的生存曲线。最优的神经网络结构(隐藏层和神经元的数量)可以被系统地确定实验添加隐藏层神经元和和观察每个设置的分类器的性能。应该进一步研究该方法的性能使用数据库从其他来源。
的利益冲突
作者宣称没有利益冲突有关这篇文章的出版。
确认
这项工作由教育部的支持,科学和技术发展下的塞尔维亚授予第三tp - 32040和45003。