文摘
非线性相关尺寸等措施,相关熵和噪声水平是本文中使用描述正常和病理的声音。这些不变量估计通过自动化算法基于最近提议U-correlation积分。我们的结果表明,该语音动态维度较低。相关尺寸更大的价值比正常细胞病理的声音。此外,它的价值随着声音的类型也会增加。相关性低熵值获得正常和病理类型1和类型2的声音表明他们的动力学几乎是周期性的。对于噪声水平,声音信号的上下文中,它可以被视为一个添加剂随机扰动内在的力量生产系统的声音。我们的估计表明,病态的噪音更大比正常的声音。此外,它增加随着声音的类型,是最高的类型的声音。从这些结果,我们可以得出这样的结论:声音生产动力系统更复杂的病理变化。此外,固有的随机扰动的存在加强了随着声音的类型。最后,根据我们的研究结果,我们建议噪音水平可以用来定量区分类型和类型的声音。
1。介绍
人类的声音是最重要的通讯手段之一。由于口头沟通,寻求帮助等活动在我们的日常生活显然是微不足道的。因此,一个声音障碍可以限制我们的能力来弥补我们最基本的需求,对我们的生活质量产生负面影响。出于这个原因,它是非常重要的,不仅增加我们的知识的声音生产但也描述其动力学机制在正常和病理条件。
在文献中,有几个方法来评估可以发现人类的声音。然而,它们的可靠性取决于研究声音的性质。因此,Titze提出了一个定性分类为声音信号(1]。Titze提出的改进方案,将信号划分为三种类型:类型信号几乎是周期性的声音信号,类型有很强的调制信号或次谐波,类型信号的特点是一个非常不规则,甚至混乱的行为。Sprecher等人提出了修改方案。他们重新定义了类型声音是确定性的混沌信号,添加第四个类型,特点是主导random-like行为(2]。
图1显示了时间序列的状态空间重建,和每种类型的光谱图的声音。正常的声音(第一列)的特点是准周期的时间表示和平稳状态空间重构吸引子。此外,从它的光谱图,可以很容易地观察到一个基本频率及其谐波。病理类型声音(第二列)显示一系列更多的不规则的时间比正常的声音。注意,尽管他们的流动相似,病理类型吸引子并不是那么顺利。此外,两色也类似,人们仍然可以区分基频及其谐波。然而,模糊了高频率的谐波噪声内容。在病理类型声音(第三列),可以观察到一个不太常规时间序列,与病理类型的声音。卷被其吸引子一直在减少,这是很难区分一个平滑的形状。在它的光谱图,一个可以找到次谐波频率。病理类型声音(第四列)的特点是一个不规则的时间序列。状态空间重建类似于高斯白噪声之一。其光谱图显示了基本频率但其谐波迅速模糊。最后,病理类型声音(第五纵队)有一个不规则的时间序列表示和常规状态空间重建,喜欢的类型的声音。在其光谱图,一个人可以找到一个基频谐波。
这些表示区分某些声音非常有用,例如,正常和病理类型之间的关系的声音。然而,很难区分正常和病理类型之间的语音或类型和类型的声音。的重要性,这种分类是基于传统微扰措施像抖动和微光给可靠的结果,如果他们被应用到类型和类型信号。相反,应该使用非线性动力学的概念来描述类型的声音,而应用于类型时,他们是不可靠的信号。而且,直到现在,类型的分类声音所做的主观视觉检查(2]。
在过去的三十年中,非线性行为的强有力的证据收集声音的生产机制(3- - - - - -6),导致科学界发展概念和方法基于非线性动力学与混沌理论。存在一组广泛的出版物中,这些概念被用来描述健康和病态的声音。维度的相关性和熵的关系两个量是用来描述一个动力系统的复杂性。前者可以被认为是一个估计的数量变量参与动力学(自由度)[7]。后者措施的速率随时间动态的信息丢失。更复杂的系统通常通过高维特征和熵值(8]。
相关积分是用来估计的数量和(9]。它已广泛应用于生物医学领域,因为它提出了由Grassberger和早期Procaccia 19年代(9]。
据我们所知,到目前为止,这种相关性积分被用于所有估计的研究和从语音信号。然而,众所周知,Grassberger Procaccia方法并不是强大的噪音,和它需要特殊条件收敛10]。更健壮的变异的相关性提出了积分,如高斯积分(GCI)[相关核11)和U-correlation积分(12]。
本文的目的是描述的动力学正常和病理的声音通过维度的相关性,相关熵和噪音水平 。此外,我们寻求统计分析这些不变量的四种类型的声音。新奇,我们获得这些不变量使用U-correlation积分通过自动化算法(12使我们避免主观判断。最后,我们提出一种新的定量的方法来区分类型和类型的声音。
2。材料和方法
相关维度和相关熵的不变量,描述自然测量动力系统(13]。这些不变量可以很容易地计算从间接获得的相关积分时间的措施之一,系统的变量(9]。观察平稳时间序列的长度 , ,重建的维延迟向量 必须形成。积分的关系 ,在它的一般形式,被定义为距离的概率 两个随机选择的维延迟向量和小于一个值(13]: 在哪里 是内核函数和的概率密度函数(pdf)对延迟向量之间的距离。在本文中,我们使用了欧氏距离。
Grassberger和Procaccia相关积分使用作为一个内核函数 ,在那里是亥维赛阶跃函数9]。另一方面,提出的GCI Diks et al ., ,采用 (11]。的主要优势的GCI Grassberger Procaccia相关积分是前者允许我们模型相似律上加性噪声的影响。
为时间序列的方差加性高斯白噪声的方差 ,比例原则是(11,14,15] 在哪里
重要的是说所有时间序列用于这项工作被新统一的标准偏差。从这个意义上说,重新调节后的噪音水平;也就是说, 清洁时间序列和对应 意味着纯粹的随机过程。信噪比(信噪比)可以计算的
在实际应用程序中,非常重要的是能够量化 ,在时间序列的噪声水平。这是因为它允许我们正确的估计和 。此外,结论由不变量的解释计算的高水平的噪音应采取谨慎。出于这个原因,估计的噪声水平也必须报道,让读者意识到估计的局限性。另一方面,当数据在控制条件下,像数据库中的声音分析,高噪音水平可以被视为主导基础添加剂随机过程的一项指标。
GCI的主要缺点是,它需要高的值获得的收敛估计(10,15]。这是因为interpoint距离变化的pdf嵌入维数,而GCI的内核不(见(1))。因此,收敛快的是慢了下来12]。最后声明,也适用于Grassberger Procaccia相关积分。作为一个解决方案,我们最近提出了U-correlation积分(UCI) [12]: 在哪里 是上面的不完整的伽马函数,γ函数, 的pdf平方interpoint距离。有两个重要的方面值得提到这种相关性积分。首先,请注意,UCI的内核函数,给出的 有一个参数用于将信息嵌入维度。换句话说,这个内核函数能够根据变化 。第二,我们现在使用的平方interpoint距离,也就是说, ,以减少计算成本。
UCI的标度律是(12] 在哪里是归一化常数和 是高斯超几何函数。UCI与U-correlation近似求和在这篇文章中,计算如下:首先,我们获得每一对之间的距离平方维延迟向量 ,在那里 ,然后 在哪里 。的评价函数 要求数值积分计算昂贵。相反,我们通过样条插值函数的执行评估 ,在那里 为每个值 。
一旦相关求和计算,我们估计 , ,和使用粗粒度的估计。这些都是显式表达式 , ,和的函数和(13]。这些函数是非常有用的,因为他们允许我们估计不变量和视觉确认扩展机制。在[16),我们提出了三个粗粒度功能: , ,和基于UCI。作为一个优势,他们可以从两个U-correlation以自动化的方式计算积分。此外,我们提出了一个自动算法来估计 , ,和从这些粗粒度的估计(16]。
2.1。基于UCI的粗粒度的估计
在这里,我们在这项研究中使用的粗粒度的估计。可以找到更详细的描述(12,16]。
我们定义噪声电平的功能(12] 在哪里
这个函数的对数导数的区别是两个U-correlation积分: ,这是UCI与距离平方计算来自维延迟向量和一个内核参数 , 。最后一个是对之间的距离对获得的相关积分维延迟向量和一个内核参数 。
我们所示(12),是一个函数,减少单调来规模与价值成正比 。从这个噪音功能,我们可以定义噪声级粗粒度的估计量(12]
的粗粒度的估计和可以解读为16] 分别。
的计算需要评估和两个相关的积分:和 。另一方面,取决于相关积分和 , ,对数导数 ,和粗粒度的估计量 。
2.2。数据库
本研究使用马萨诸塞州的眼睛和耳朵医务室(MEEI)语音障碍数据库、分布式凯Elemetrics(17]。我们选择的一个子集记录(正常的,病理)持续发声的元音/ /(18]。每个记录是downsampledkHz和受试者的描述性统计数据表1。从这组的声音,我们排除在外因为它们含有少于记录采样点,共有结束记录进行分析。
为每一个记录,一个为中心的窗口 数据点被选择和规范化的零均值和统一的标准偏差。然后,U-correlation金额计算 , , 。此外,最近的时间邻居每个延迟向量丢弃的7]。最后,算法1是应用。我们必须澄清的范围值嵌入维度选择考虑的研究6,19- - - - - -21),一个低维的系统建议( 病态的声音)。另一方面,嵌入延迟被选为平均滞后(对所有的声音)的第一个最小互信息函数发生(7,10]。
在初步研究中,病理记录分为Titze方案基于视觉观察的时间序列及其谱图。分类结果类型记录和类型记录。其余的声音,拆卸,因为这些技术不能区分类型和类型的声音。以下类型的定义声音由Sprecher等人在2),我们计算了粗粒度的估计和对于这些的声音。然后,我们组合在一起的声音,显示缩放政权(有限相关维度和熵)类型和那些没有类型 。
3所示。结果
第一个结果可以观察到的模拟图2。它显示了粗粒度的估计 , ,和正常的声音(数字2(一),2(f)2(k)),病理类型声音(数据2(b),2(g)2(左)),病理类型声音(数据2(c),2(h)和2(m)),病理类型声音(数据2(d),2(我),2(n))和病理类型声音(数据2(e),2(j)2(o))。
重要的是观察,所有粗粒度的估计目前的扩展区域,除了维度和的相关性熵的类型的声音。这突出了这些估计量的适用性分析正常和病理类型 ,类型 ,和类型)的声音。
它可以观察到在第一行的图2,病态的噪音水平更大的声音比正常的声音,在病理情况下,它增加以及类型。这意味着,对正常和病理的声音,有一个潜在的随机组件及其水平提高病理学的存在。
估计量的行为提出了图的第二行吗2。可以看到,这个估计量显示的值 为正常声音略大的病理类型的值和类型的声音。然而,很难说是否有差异分析正常和病理的声音。然而,这些结果表明,生产系统的维数相对较低的声音。
关于估计量 ,它可以观察到从第三排图2,声音分析,估计量的收敛值接近于零。这表明存在很强的谐波分量。此外,存在一个小的增加从正常的声音熵病理类型从后者的声音和病理类型的声音。这反映了越来越多的不规则程度常与复杂性的增加。
的类型的声音,它可以观察到在第四列图2噪音水平粗粒度的估计值收敛于一个更高的价值比对应的类型的声音。然而,它仍然是有可能的观察一个比例在这两个范围和 。此外,这些估计收敛于更高的值的类型的声音。另一方面,类型声音(第五列图2),是不可能找到一个比例范围在维度或熵的估计量。预计这种行为,因为根据定义,这些类型的声音具有无限价值的维度和熵。
正如我们前面所提到的,这种非线性技术不应该使用类型的声音。注意,从曲线的和(数据2(j)和2(o)、职责),它是不容易的决定是否有一个缩放范围。从这个意义上说,一个未经训练的人可能错误地确定它的存在,导致误导估计。
另一方面,可以找到扩展范围(图2(e)),它收敛于一个非常高的噪声电平值 (信噪比dB)。这表明,动力学主要是由底层的随机组件。提到这种行为是很重要的在所有的声音是一致的,没有扩展区域和(类型声音)。基于这些结果,我们建议的价值很高可能是一个定量的指标类型的声音。
为了找到一个噪声电平值,使我们能够区分类型和类型声音,我们选择通过目视检查所有的声音,估计没有显示了一个扩展的区域和 。然后,对于每一个信号,我们估计噪声电平值并选择最小的值( )作为一个阈值。
3.1。自动估计的不变量
为了获得可靠的估计 , ,和 ,有必要验证扩展行为的存在在粗粒度的估计。一旦发现,我们必须选择一个范围的值的估计不变量。这个选择是至关重要的,因为在实际应用中,粗粒度估计强烈不同规模的函数。为了避免主观判断,我们提出了一个算法(参见算法1)自动估计 , ,和基于粗粒度的估计 , ,和 ,分别为(16]。
该算法选择缩放范围这些不变量应该估计基于未来标准:(i)的粗粒度的估计必须常数范围规模价值观和(2)不变的价值应该收敛随着嵌入维数的增加。
该算法首先近似U-correlation积分和为不同的值( )使用(8)。请注意,必须计算 因为不完整的形状参数γ和伽马函数必须大于零。接下来,对数导数和必须计算为了获得吗(见(9))。观察到的相关性积分等于相关积分评估在 。在这篇文章中,得到了对数衍生品使用小波变换方法(22]。这产生一个光滑的版本的衍生品允许我们更好地估计不变量。
噪音水平必须从一系列的计算粗粒度的估计量几乎是常数和它的变化值是最小的。在这个意义上,噪音水平,我们定义的函数16] 在哪里 和是平均的在 。 平均在导数的关于 , 给的变化在 ,和的产品是两个提到的功能。我们建议估计范围内的集中在价值的是最低的。这种方式,估计的范围集中在一个趋于稳定区域(缩放区域) ,通过参数及其值是一致的 。
关联维数和关联熵可以决定使用粗粒度的估计(见(12)),(见(13分别)。找到一个范围的值来估计和 ,我们使用类似的方法,但从功能和 ,分别。的函数和可以计算类似吗但使用粗粒度的估计和 ,分别。
每个不变量的估计整个群信号呈现在图3。图3(一个)显示了一个箱线图噪声估计的正常(N),病理类型(PT),病理类型(PT),病理类型(PT),病理类型(PT)的声音。因为它可以观察到,更大的比正常细胞病理的声音。然而,它是不可能建立一个统计区别正常和病理类型和类型的声音。另一方面,我们可以区分正常和病理类型和类型的声音。是很重要的说,贴上TP组被选中,因为他们有一个噪声电平值吗 。注意,使用这个阈值,我们可以单独的类型从类型的声音。
(一)
(b)
(c)
箱线图的相关维度呈现在图3 (b)。有一个增加的从正常到病态的声音。正常声音,中位数 ;病理类型的声音, ;型的声音, ;和类型的声音, 。从这些结果,我们可以建立声音系统有一个较低的维度,即使在病理学的存在。TP组没有出现在这个阴谋,因为根据定义,它的维度是无限的。关于熵的关系,如图3 (c)有一个小的增加从正常到病态的声音。然而,它是不可能找到一个统计区别正常,病理类型 ,和病理类型的声音。中值关联熵估计正常的声音 为病理类型,声音是 为病理类型,声音是 和病理类型声音是 。
4所示。讨论
记住使用记录被在一个受控的环境中,我们可以将噪声水平与添加剂的强度随机组件与动态产生声音的共存。有一种倾向增加它的值从正常声音病态的。这可以被视为一个增长的力量造成的随机组件的病理变化。此外,在病态的声音,增加它的值随着的声音类型。
类型的定义声音由Sprecher et al。2)指出,这些信号的特点是纯随机振荡;因此,他们的尺寸是无限的10]。在实践中,它是不可能衡量无限相关维度的价值因为它是有界的嵌入维度用来计算积分的关系。相反,无限维度相关性推断如果没有一个比例政权的粗粒度的估计量 。在以前的研究中,这是通过目视检查,这始终是一个主观判断2,19]。
一个有趣的方面的粗粒度的估计量是,在类型信号分析,它总是提出了一种扩展范围的估计 ,虽然和没有扩展区域。这些结果让我们认为噪音水平可以作为一个客观衡量区分类型和类型的声音。
这里提出的阈值( )是利用声音信号,不存在比例政权和 。这个阈值,我们可以单独的类型和类型的声音。然而,我们知道这个阈值选择是基于观察从这个数据库。这个发现必须验证与更广泛的研究涉及大量的记录和嗓音保健专业人员。
我们估计相关尺寸的一致性与其他研究[6,19- - - - - -21]。在[23),蔡等人进行了相似模拟在凯Elemetrics数据库。他们报道的平均值 正常声音和病态的维度值增加。此外,他们获得了降低信噪比(这是根据计算24与声音的类型),在最低的类型的声音。然而,他们没有分析类型的声音。另一项研究由张和江进行了凯Elemetrics数据库报道意味着相关尺寸 正常的声音和 为一组声音震颤(25]。据我们所知,所有研究进行正常和病理的声音用Grassberger Procaccia相关性积分估计和 。这种方法的缺点,其估计对噪声敏感的存在,需要大值收敛,不给出一个估计的噪声水平10,13]。然而,其他变体,如高斯相关积分尚未使用。
关于熵的关系,我们的研究结果表明,病理类型和类型声音稍微比普通的更大的价值。此外,这三种类型的声音了值接近于零,这表明近周期性动态。型声音,的值是最棒的,这意味着更多的不规则和不可预测的动态。这些值比有了燕et al。26]。他们报道的一个估计正常(平均值 )和食管发声(平均值 )科目。在[27),Calawerts等人的最大李雅普诺夫指数计算类型 ,类型 ,和类型声音使用凯Elemetrics数据库。他们的研究结果表明增加价值的最大李雅普诺夫指数随着类型的声音。我们这项研究结果一致因为我们获得相关熵的估计不仅是大病态的声音比正常细胞也随声音的类型。
5。结论
在本文中,我们研究了正常和病理的声音通过维度的相关性,相关熵和噪音水平。这些不变量估计使用基于粗粒度的自动算法估计来自U-correlation积分。结果表明,声音的生产动力系统有一个较低的维度。的价值更大的比正常细胞病理的声音。此外,它的价值随着声音的类型也会增加。关于熵的关系,其价值很低为正常和类型和类型病态的声音。虽然仍需要更广泛的研究,这一发现表明,系统动力学有谐波振荡行为。另一方面,病理类型声音出现更高的值 ,意味着一个更复杂的行为反映在不规则的动态。噪声可以理解为一个随机扰动固有的生产系统的声音。我们的结果表明,更大的比正常细胞病理的声音。此外,它增加随着声音的类型,是最高的类型的声音。这意味着随机分量的存在是病态的声音更强。基于这些结果,在这项工作中,我们提出了一个定量的标准,可以用来区分类型和类型的声音。我们意识到的样本类型的限制和类型的声音。从这个意义上说,这些初步结果将与更广泛的验证研究涉及大量的记录和嗓音保健专业人员。
的利益冲突
作者宣称没有利益冲突。
确认
这项工作得到了国家科学技术研究委员会(国家)的阿根廷,恩特国立大学(味道),IBB,赠款pid - 6136(味道)和pio - 14620140100014 - co (CITER-CONICET)。作者要感谢克里斯蒂娜Jackson-Menaldi教授,博士,和朱莉安娜Codino,硕士CCC-SLP,富有成效的讨论。