文摘
有持续的努力研究团体近些年开发算法,自动分析心音。的主要挑战之一是识别主要的心音,S1和S2,因为他们代表参考事件分析。的研究分析改善的可能性基于形状上下文的结构特征和结构评估使用少量的描述符。尤其是主声音特征的自适应波形滤波应用基于毯子分形维数为每个预处理声音候选人属于儿科学科。这是紧随其后的是应用基于形状的方法选择的结构评估主要的心音。不同的方法,如分形的,用于比较。心音的分析模式是使用支持向量机分类器执行显示出可喜的成果(95%以上精度)。结果表明,可以改善识别过程使用的形状相关的方法很少应用。这可以帮助应用程序涉及自动心音分析。
1。介绍
听诊广泛用于评估心脏功能。由于心音分析主要取决于医生的个人技能,有一个不断增长的需求自动心音解释方法和系统(1]。Phonocardiography是一个具有成本效益的非侵入性方法使听力和可视化的内容心音信号。它被认为是有助于避免复杂和昂贵的成像设备(2]。
心音分析的一个主要问题是确定第一(S1)和第二心音(S2) (3]。适当的识别是关键重要的其他信号解释的组件,如额外的声音,杂音发现之间的基本的声音,在收缩(S1-S2)和舒张(S2-S1)间隔。二尖瓣和三尖瓣的关闭阀门形式S1, S2声音是由主动脉和肺动脉阀门的关闭。使用心电图参考,S1的识别是容易执行的定位QRS波群。更经常出现的情况是,有一个需要识别的声音没有使用任何同步记录参考。这是一个具有挑战性的任务,因为这些声音发现作为组件的相对较高的能量在同一低频率范围有相似的形态4]。因此,描述典型的心音,如S1和S2,多年来获得大受欢迎(5- - - - - -8]。
现有的方法描述的声音通常都用envelograms引入能量的计算方面,比如基于香农能量的一个,更高的能量通常是与S1 (5,6,9]。类似的辅助应用信封(使用不同的联合时频表示8,10,11]。第一心音识别方法通常认为信号/信封特征(如最大、方差、频率和正面/负面区域(6,9,12])。注意到标签S1和S2是传统分配不考虑不同能量的声音8,10),需要改进的特征无论假设关于候选人之间的时间间隔(例如,重复序列S1-S2对,没有兴奋,也错过了候选人也误解了收缩的间隔时间短(9,10])。
另一方面,形状描述符的结构特征为识别被认为是有价值的,即使他们很少应用。偏态包络波形的测量中使用的高阶统计量(4)的结构、S2的不对称的能量分布假定是由于关闭阀门。另一个形状相关的方法是基于峰度计算的尖峰的声音8]。分形框架的优点也承认对心脏的声音,在不同的分形维数(FD)方法相关的变异和波形应用的结构。典型的心音S1和S2,短时间内(20 - 200 ms)和低频率(20 - 200 Hz),可以考虑分形性质(2,11]。
到目前为止,分形复杂度用于心率变异性(13,14),以及听诊的记录分类(15],FD显示为一个令人满意的工具相比其他时频特性。作为测量分形的复杂性,S1和S2心音识别、方差FD (VFD)是应用于(16]。对肺的声音属于儿科患者,Katz FD (KFD) [17)是应用于陶瓷器皿和吞咽的识别(18,19]。在[20.),覆盖方法(BFD)用于潮汐卷估计使用气管的声音。在前面的工作我们的小组,覆盖方法的初步检查显示为一个可能的工具为主要心音(21]。此外,在我们之前的工作11,12),新方法提出了有效分类的听诊的录音没有主要的心音检测使用一些多重分形谱相关特性。
本研究作出贡献的研究方法对心音分析利用分形理论的优点和形状上下文,用相对较少的描述符。节2分形概念的描述,识别主要心音是短暂的。波形模式的分析,提出了新的形状相关的方法,基于自适应过滤和修改覆盖方法牢记最极端的点在心音信号。测试新方法在实际心音属于儿科主题和与其他方法相比,从文学。这项研究的结果发表在部分3。节4,一些结论。
2。材料和方法
基本心脏声音S1(听到“滑”声音)和S2(听到“配音”声音)通常是发现在一个听诊的记录作为特征组件的相对较高的能量。每个击败由四部分组成:S1声音,收缩,S2声音,和心脏舒张期3]。其他额外的声音中发现一个心音信号(点击,破口大骂,杂音等)可能传达有价值的信息,但任何额外的声音的解释取决于S1和S2的识别。图1显示记录的一部分(两秒时间)属于一个儿科的话题。S1和S2的标签由医生给出基本的心音。
为了检查中发现的结构模式听诊的录音,超过一千的数据集序列属于儿科学科聚集。特别是,心音收集符合道德标准的顶端。执行收购心音在健康中心“Zvezdara”和额外的超声心动图检查大学儿童医院在贝尔格莱德,塞尔维亚。最初的声音记录8 kHz和downsampled 1 kHz以来分析的基本结构将采样后的波形不退化。利特曼4100 ws听诊器用于收购。
2.1。分形概念的模式特征
自相似性的波形是基于类似的模式在不同尺度的存在。即可能出现类似的形状,当观察整个尺度结构,这些结构(分形)可以被描述为他们的分形维数17]。分形方法被发现有效的工具来描述复杂的结构,在不同的覆盖技术和扩展从信封测量区域可以使用12,13,17,18]。
为了澄清的基本数学概念应用于FD计算,为更好的理解给出一个简短的解释。原理计算维FD (BCFD),作为最常用的方法之一,是基于波形箱子的大小通过适当的网格,定义为等间距的广场,在箱子的数量, ,需要盖一个信号计算(12]。大小的正方形, 与规模变化。当倾向于零,维度可以估计通过幂律:
FD估计的算法大多是容易计算,定义一个波形可以被描述为一个分形测量。当应用于特定声音的结构相对较短的时间,他们可能有价值的识别。有许多不同的方法,其中有一些是直接相关的结构分析。值得一提的是,KFD是最常见的应用之一,相关的模式特征(17,22),认为该曲线的长度, ,的总和计算连续样本之间的欧氏距离。KFD是计算平均连续样本之间的距离作为 在哪里 和的平面直径波形之间的距离定义为最大第一和任何其他点的波形。
信封可以应用在测量领域,用于BFD方法。通过定义结构的毯子覆盖,可以定义足够的覆盖区域和执行合适的对数域 在哪里可以描述如下:(我)该地区相邻之间的变化在[23(这里表示BFD1)或(2)曲线长度估计在[24)(这里表示BFD2)。
2.2。多尺度心音识别
尽管S1的组件预计数量越高,解释每个主要的心音波形识别的目的不是一项容易的任务(7]。S1和S2心音的结构由心脏收缩,关闭阀在不同的尺度可以被认为是类似的。通过假设的重要性最突然的变化波形识别的大小,我们提出一种适应技术如下: 在哪里 在哪里 最初, 和 。该技术计算上(“高于”)和低(“低于”)信封从最大和最小点,分别。信封是根据最突出的极端点形成的。曲线是适应原始波形结构和极端点在每个迭代中 。极端提取相关的信息自适应结构过滤(4),(4 b),(5)和(5 b),所以当地的最大值影响变异的信封,而局部最小值的影响上。此外,它假定最突然的波形的变化是由夹紧相关的分类使用的最大值和最小值的曲线结构。在图2,并给出了信封BFD1和新的基于(覆盖方法4),(4 b),(5)和(5 b)。极端的影响能力变化的信封可以注意到在图2 (b)。
(一)
(b)
为了描述主要的心音,覆盖区域分为两部分:当浏览的区域结构从“以上”(),当浏览的区域结构从“低于”(),同样在23]。上部和下部区域计算 应用过滤减少曲线和原结构的区别。这使得波形的strip-like估计到积极的上部和下部区域之间的差异变得可以忽略不计( )。扩展测量区域是由自适应过滤为了评估每一个结构。
自适应滤波后,三种不同的方法来表征的主要听起来了。提出的方法是基于结构评估使用覆盖的地区之间的差异。注意到在FD计算和结构/模式估计(25),最初几个迭代主要敏感结构,也就是说,他们最明显的等级。因此,自适应技术在第一个迭代识别似乎是有用的。波形是有界最突然的变化波形的使用阈值大小 。经验阈值确定 ,在那里上部和下部信封表示最大的区别: 。通过测试,发现较小的阈值会导致误解,即检测当地极端不占主导地位。
在第一种方法中,价值是计算 对于每一个尺度,它可以解释为斜坡覆盖区域的值之间的差异。密集的实验后,我们发现第三个迭代适合描述S1和S2的声音。
第二种方法计算多尺度结构面积估算 在哪里 的值在每次迭代中减少。
第三个方法是基于slope-difference。它是用于评估结构 在哪里 覆盖面积值的斜率向量计算跨尺度( )。评估后,当地的方向是总结,形成结果的收益率相关信息的结构主要的心音。类似的方法基于加法当地方向被用于图像处理的不同结构形状上下文方法(26,27]。在我们的方法中,所描述的和当地的方向,(9)和(9 b),是申请心音识别。
每个方法(7),(8),(8 b),(9)和(9 b)能够让你了解的内容和形状结构。多尺度结构的计算误差估计不会产生重大后果提出了方法的适用性。计算错误,错误的舍入噪声特性等影响上部和下部区域,和以类似的方式;因此,整体影响是微乎其微的。
2.3。分类和评价
分类方法是基于支持向量机(SVM)分类器,它被认为是一个合适的工具,歧视的任务(28- - - - - -30.]。即应用支持向量机作为分类器,区分数据通过分离超平面与类之间的最大的优势。当应用到波形时,它所描述的是内核函数和正则化参数,基于权衡拥有大型标准化保证金和约束违反。内核函数是用来训练支持向量机,在最常见的内核类型是线性和高斯径向基函数(RBF)所描述的平方带宽(21,30.]。
基于支持向量机的分类是使用5倍交叉验证(执行28),使用九百个声音序列。这个分离的候选人是在交叉验证正确估计总体性能,分类在哪里执行没有任何先验知识,也就是说,使用的序列训练阶段并不是一个用于测试的数据集的一部分。递归特性消除技术是用于提高分类精度通过消除最低有效描述符(29日,30.]。
评价结果得到使用接受者操作特征(ROC)曲线。ROC曲线礼物真阳性率与假阳性率为不同决策阈值,而性能测量曲线下的面积(AUC)计算。此外,分类精度和测量计算, 分别在哪里是真正的阳性(S1打),是真正的底片(S2),假阳性(错过S2),假阴性(错过S1)。的测量描述了类不平衡。
3所示。结果与讨论
描述的方法,提出的三个部分2。2,首先测试了单独的结构评估心脏的声音,根据他们的AUC的性能。他们比较文学的其他方法。我们认为是标准方法基于信号或其基于香农能量的信封(5](如方差、振幅/信封值最高,信号/信封,和积极/消极信号区(6,10,11])和不同的分形方法:BCFD, KFD BFD1, BFD2(描述表达式(1)- (3)),(变频16),Sevcik(陕西林业局)[31日],Higuchi (HFD) [22]。五FD方法可以被认为是高度相关的形状(KFD, BFD1, BFD2、陕西林业局和HFD)。作者的知识,其中一些还没有被检查到目前为止的主要声音识别,比如陕西林业局或者BFD2。我们还考虑了统计和形状相关的方法、基于峰度和偏态4,8]。
3.1。结果
的AUC性能提出的方法与其他方法相比,只有AUC值高于60%的方法呈现在图3。在图3,积极的和消极的区域计算按照声音的振幅,而总面积1和2的总面积计算使用基于声音振幅和香农能量的信封,分别。结果呈现在图3表明,这三种方法提出了部分2。2给更好的性能相比其他测试的方法。
注意,我们建议的方法与形状特性有关。通过测试相关的其他形状的方法,我们发现BFD2 S1和S2作为最佳选择分类(AUC > 90%)。预计KFD可能显示有前景的结果(AUC > 85%)以来的方法被认为是高度一致的形状特征在不同的应用程序(例如,脑电图分析(22])。一些支安打,错过了候选人的例子为一组波形使用第三种方法,描述(9)和(9 b),呈现在图4,只有少数候选人误解由于其结构。
AUC性能的测试是紧随其后的是基于支持向量机的分类和交叉验证,方法的选择是由使用功能消除和网格搜索技术(28- - - - - -30.]。为了获得可靠的结果在声音特性,计算精度在五重复把录音以随机的方式。基于支持向量机的分类,我们分析了所有先前的方法被单独测试。的分类,不同的数量( )的描述符是消除技术中使用的特性。
的情况下 两个提议,最好的结果是获得形状上下文方法和 ,决定边界呈现在图在哪里5(一个)。为不同的值N,获得的准确性和AUC值呈现在图5 (b)显示精度相比,AUC的明显变化的性能。这主要是由于第三个方法所示为最重要的一个波形特征的检测方法之一。找到最佳的性能 提出了形状上下文,选择描述符的值和 ,BFD2,总面积计算 在这种情况下最好的精度结果获得并展示在表1。在表1,结果代表了平均值显示95%以上精度为每个类和AUC高于98%的分类。大约4%精度高的结果是获得使用RBF核相比,线性的。
(一)
(b)
提出了基于SVM的分类利用自适应过滤和声音的测量区域分类。摘要交叉验证执行只根据健康小儿科目。额外的验证模型是在波形上执行属于十病人并不包括在交叉验证过程,提出的结构评估方法显示优秀结果AUC为97.6%,准确性为90.6% (0.91)的测量。
3.2。讨论和比较
应用本文研究和测试的主心音识别过程的基础上塑造相关表征儿科学科。提议的方法的优势依赖于应用自适应滤波和所选结构评估。高精度的分类结果有效地获得,没有耗时的表征方法,采用上下文特征和形状保持少量的描述符。相比最先进的方法,采用FD方法,评估结构表征方法不使用平均/拟合估计,像中使用的最小二乘在对数域(3)。应用也克服了高的迭代计算方法。尤其是高迭代发现BFD1/2似乎没有带来新的相关信息的结构和可能防止FD反映声音与高精度(图类型2)。因此,应用过滤对结构使适应最突出的极端点。它可以注意到S1适应结构遇到更多的突出当地极端S2。提议的方法的局限性是声音特性直接相关。特别是,是不是听起来是呈现在图中发现错过的示例4。这些限制相关发现最突出的最大和最小的位置用于夹紧信封,有些细节可能会产生误解。该模型调整健康的人。额外的实验nonhealthy集团180年使用一组波形是在同样的条件下执行提供高精度的结果。
这项研究是基于形状上下文描述和自动心音分析可以被认为是有价值的。获得精度高(95%以上)的分类和标签的主要声音不管intersound关系。识别从[相比5,11),最高的包络值()申请S1-systole S2-diastole分化,评估结构克服了错误发现由于不同能量信号,如图所示6(一)。反复听起来不分类模型的假定,因此可能克服错误的方法发现由于nondetected候选人和类似的误解。最后,方法显示显著改善的准确性的方法相比高出6% (21),如表所示2。获得的ROC曲线呈现在图6 (b)AUC值高6.5%,0.08高测量。
(一)
(b)
4所示。结论
本文研究分析使用形状上下文的可能性和分形理论在S1和S2模式特征。结果表明,该方法能够显著提高精度(高于95%),避免平均尺度和拟合过程。基于分形理论的方法使开发新方法保持少量的描述符识别的主要声音。
研究显示形状上下文的重要性和能力区分变量的声音无论能源价值甚至没有考虑intersound关系。此外,结果表明,形状相关的方法是有价值的进一步改进识别心脏的声音。
的利益冲突
作者宣称没有利益冲突有关这篇文章的出版。
确认
这项研究部分由教育部、科学和技术发展下的塞尔维亚共和国批准号III44009。