文摘

非线性相关尺寸等措施,相关熵和噪声水平是本文中使用描述正常和病理的声音。这些不变量估计通过自动化算法基于最近提议U-correlation积分。我们的结果表明,该语音动态维度较低。相关尺寸更大的价值比正常细胞病理的声音。此外,它的价值随着声音的类型也会增加。相关性低熵值获得正常和病理类型1和类型2的声音表明他们的动力学几乎是周期性的。对于噪声水平,声音信号的上下文中,它可以被视为一个添加剂随机扰动内在的力量生产系统的声音。我们的估计表明,病态的噪音更大比正常的声音。此外,它增加随着声音的类型,是最高的类型 的声音。从这些结果,我们可以得出这样的结论:声音生产动力系统更复杂的病理变化。此外,固有的随机扰动的存在加强了随着声音的类型。最后,根据我们的研究结果,我们建议噪音水平可以用来定量区分类型 和类型 的声音。

1。介绍

人类的声音是最重要的通讯手段之一。由于口头沟通,寻求帮助等活动在我们的日常生活显然是微不足道的。因此,一个声音障碍可以限制我们的能力来弥补我们最基本的需求,对我们的生活质量产生负面影响。出于这个原因,它是非常重要的,不仅增加我们的知识的声音生产但也描述其动力学机制在正常和病理条件。

在文献中,有几个方法来评估可以发现人类的声音。然而,它们的可靠性取决于研究声音的性质。因此,Titze提出了一个定性分类为声音信号(1]。Titze提出的改进方案,将信号划分为三种类型:类型 信号几乎是周期性的声音信号,类型 有很强的调制信号或次谐波,类型 信号的特点是一个非常不规则,甚至混乱的行为。Sprecher等人提出了修改方案。他们重新定义了类型 声音是确定性的混沌信号,添加第四个类型,特点是主导random-like行为(2]。

1显示了时间序列的状态空间重建,和每种类型的光谱图的声音。正常的声音(第一列)的特点是准周期的时间表示和平稳状态空间重构吸引子。此外,从它的光谱图,可以很容易地观察到一个基本频率及其谐波。病理类型 声音(第二列)显示一系列更多的不规则的时间比正常的声音。注意,尽管他们的流动相似,病理类型 吸引子并不是那么顺利。此外,两色也类似,人们仍然可以区分基频及其谐波。然而,模糊了高频率的谐波噪声内容。在病理类型 声音(第三列),可以观察到一个不太常规时间序列,与病理类型 的声音。卷被其吸引子一直在减少,这是很难区分一个平滑的形状。在它的光谱图,一个可以找到次谐波频率。病理类型 声音(第四列)的特点是一个不规则的时间序列。状态空间重建类似于高斯白噪声之一。其光谱图显示了基本频率但其谐波迅速模糊。最后,病理类型 声音(第五纵队)有一个不规则的时间序列表示和常规状态空间重建,喜欢的类型 的声音。在其光谱图,一个人可以找到一个基频谐波。

这些表示区分某些声音非常有用,例如,正常和病理类型之间的关系 的声音。然而,很难区分正常和病理类型 之间的语音或类型 和类型 的声音。的重要性,这种分类是基于传统微扰措施像抖动和微光给可靠的结果,如果他们被应用到类型 和类型 信号。相反,应该使用非线性动力学的概念来描述类型 的声音,而应用于类型时,他们是不可靠的 信号。而且,直到现在,类型的分类 声音所做的主观视觉检查(2]。

在过去的三十年中,非线性行为的强有力的证据收集声音的生产机制(3- - - - - -6),导致科学界发展概念和方法基于非线性动力学与混沌理论。存在一组广泛的出版物中,这些概念被用来描述健康和病态的声音。维度的相关性 和熵的关系 两个量是用来描述一个动力系统的复杂性。前者可以被认为是一个估计的数量变量参与动力学(自由度)[7]。后者措施的速率随时间动态的信息丢失。更复杂的系统通常通过高维特征和熵值(8]。

相关积分是用来估计的数量 (9]。它已广泛应用于生物医学领域,因为它提出了由Grassberger和早期Procaccia 19 年代(9]。

据我们所知,到目前为止,这种相关性积分被用于所有估计的研究 从语音信号。然而,众所周知,Grassberger Procaccia方法并不是强大的噪音,和它需要特殊条件收敛10]。更健壮的变异的相关性提出了积分,如高斯积分(GCI)[相关核11)和U-correlation积分(12]。

本文的目的是描述的动力学正常和病理的声音通过维度的相关性,相关熵和噪音水平 此外,我们寻求统计分析这些不变量的四种类型的声音。新奇,我们获得这些不变量使用U-correlation积分通过自动化算法(12使我们避免主观判断。最后,我们提出一种新的定量的方法来区分类型 和类型 的声音。

2。材料和方法

相关维度和相关熵的不变量,描述自然测量动力系统(13]。这些不变量可以很容易地计算从间接获得的相关积分时间的措施之一,系统的变量(9]。观察平稳时间序列的长度 , ,重建的 维延迟向量 必须形成。积分的关系 ,在它的一般形式,被定义为距离的概率 两个随机选择的 维延迟向量 小于一个值 (13]: 在哪里 是内核函数和 的概率密度函数(pdf)对延迟向量之间的距离。在本文中,我们使用了欧氏距离。

Grassberger和Procaccia相关积分 使用作为一个内核函数 ,在那里 是亥维赛阶跃函数9]。另一方面,提出的GCI Diks et al ., ,采用 (11]。的主要优势的GCI Grassberger Procaccia相关积分是前者允许我们模型相似律上加性噪声的影响。

为时间序列的方差 加性高斯白噪声的方差 ,比例原则是(11,14,15] 在哪里

重要的是说所有时间序列用于这项工作被新统一的标准偏差。从这个意义上说, 重新调节后的噪音水平;也就是说, 清洁时间序列和对应 意味着纯粹的随机过程。信噪比(信噪比)可以计算的

在实际应用程序中,非常重要的是能够量化 ,在时间序列的噪声水平。这是因为它允许我们正确的估计 此外,结论由不变量的解释计算的高水平的噪音应采取谨慎。出于这个原因,估计的噪声水平也必须报道,让读者意识到估计的局限性。另一方面,当数据在控制条件下,像数据库中的声音分析,高噪音水平可以被视为主导基础添加剂随机过程的一项指标。

GCI的主要缺点是,它需要高的值 获得的收敛估计 (10,15]。这是因为interpoint距离变化的pdf嵌入维数,而GCI的内核不(见(1))。因此,收敛快的 是慢了下来12]。最后声明,也适用于Grassberger Procaccia相关积分。作为一个解决方案,我们最近提出了U-correlation积分(UCI) [12]: 在哪里 是上面的不完整的伽马函数, γ函数, 的pdf平方interpoint距离。有两个重要的方面值得提到这种相关性积分。首先,请注意,UCI的内核函数,给出的 有一个参数 用于将信息嵌入维度。换句话说,这个内核函数能够根据变化 第二,我们现在使用的平方interpoint距离,也就是说, ,以减少计算成本。

UCI的标度律是(12] 在哪里 是归一化常数和 是高斯超几何函数。UCI与U-correlation近似求和 在这篇文章中,计算如下:首先,我们获得每一对之间的距离平方 维延迟向量 ,在那里 ,然后 在哪里 。的评价函数 要求数值积分计算昂贵。相反,我们通过样条插值函数的执行评估 ,在那里 为每个值

一旦相关求和计算,我们估计 , , 使用粗粒度的估计。这些都是显式表达式 , , 的函数 (13]。这些函数是非常有用的,因为他们允许我们估计不变量和视觉确认扩展机制。在[16),我们提出了三个粗粒度功能: , , 基于UCI。作为一个优势,他们可以从两个U-correlation以自动化的方式计算积分。此外,我们提出了一个自动算法来估计 , , 从这些粗粒度的估计(16]。

2.1。基于UCI的粗粒度的估计

在这里,我们在这项研究中使用的粗粒度的估计。可以找到更详细的描述(12,16]。

我们定义噪声电平的功能(12] 在哪里

这个函数的对数导数的区别是两个U-correlation积分: ,这是UCI与距离平方计算 来自 维延迟向量和一个内核参数 , 最后一个是对之间的距离对获得的相关积分 维延迟向量和一个内核参数

我们所示(12), 是一个函数,减少单调 规模与价值成正比 从这个噪音功能,我们可以定义噪声级粗粒度的估计量(12]

的粗粒度的估计 可以解读为16] 分别。

的计算 需要评估 和两个相关的积分: 另一方面, 取决于相关积分 , ,对数导数 ,和粗粒度的估计量

2.2。数据库

本研究使用马萨诸塞州的眼睛和耳朵医务室(MEEI)语音障碍数据库、分布式凯Elemetrics(17]。我们选择的一个子集 记录( 正常的, 病理)持续发声的元音/ /(18]。每个记录是downsampled kHz和受试者的描述性统计数据表1。从这组的声音,我们排除在外 因为它们含有少于记录 采样点,共有结束 记录进行分析。

为每一个记录,一个为中心的窗口 数据点被选择和规范化的零均值和统一的标准偏差。然后,U-correlation金额计算 , , 。此外,最近的 时间邻居每个延迟向量丢弃的7]。最后,算法1是应用。我们必须澄清的范围值嵌入维度选择考虑的研究6,19- - - - - -21),一个低维的系统建议( 病态的声音)。另一方面,嵌入延迟被选为平均滞后(对所有的声音)的第一个最小互信息函数发生(7,10]。

(1)计算 用情商。8)
(2)计算 用情商。9在步骤()和uci获得1)。
(3)计算 情商。11)和获取功能 估计 在一个范围内
为中心的价值 在哪里 是最低的。
(4)使用 , 计算 (Eq。12))和获得
函数 估计 范围内的 为中心的价值 在哪里
是最低的。
(5)获得 (Eq。13)使用 , 计算函数
估计 范围内的 为中心的价值 在哪里
最小值。

在初步研究中,病理记录分为Titze方案基于视觉观察的时间序列及其谱图。分类结果 类型 记录和 类型 记录。其余的 声音,拆卸,因为这些技术不能区分类型 和类型 的声音。以下类型的定义 声音由Sprecher等人在2),我们计算了粗粒度的估计 对于这些 的声音。然后,我们组合在一起的声音,显示缩放政权(有限相关维度和熵)类型 和那些没有类型

3所示。结果

第一个结果可以观察到的模拟图2。它显示了粗粒度的估计 , , 正常的声音(数字2(一),2(f)2(k)),病理类型 声音(数据2(b),2(g)2(左)),病理类型 声音(数据2(c),2(h)和2(m)),病理类型 声音(数据2(d),2(我),2(n))和病理类型 声音(数据2(e),2(j)2(o))。

重要的是观察,所有粗粒度的估计目前的扩展区域,除了维度和的相关性 熵的类型 的声音。这突出了这些估计量的适用性分析正常和病理类型 ,类型 ,和类型 )的声音。

它可以观察到在第一行的图2,病态的噪音水平更大的声音比正常的声音,在病理情况下,它增加以及类型。这意味着,对正常和病理的声音,有一个潜在的随机组件及其水平提高病理学的存在。

估计量的行为 提出了图的第二行吗2。可以看到,这个估计量显示的值 为正常声音略大的病理类型的值 和类型 的声音。然而,很难说是否有差异分析正常和病理的声音。然而,这些结果表明,生产系统的维数相对较低的声音。

关于估计量 ,它可以观察到从第三排图2,声音分析,估计量的收敛值接近于零。这表明存在很强的谐波分量。此外,存在一个小的增加 从正常的声音熵病理类型 从后者的声音和病理类型 的声音。这反映了越来越多的不规则程度常与复杂性的增加。

的类型 的声音,它可以观察到在第四列图2噪音水平粗粒度的估计值收敛于一个更高的价值比对应的类型 的声音。然而,它仍然是有可能的观察一个比例在这两个范围 此外,这些估计收敛于更高的值的类型 的声音。另一方面,类型 声音(第五列图2),是不可能找到一个比例范围在维度或熵的估计量。预计这种行为,因为根据定义,这些类型的声音具有无限价值的维度和熵。

正如我们前面所提到的,这种非线性技术不应该使用类型 的声音。注意,从曲线的 (数据2(j)和2(o)、职责),它是不容易的决定是否有一个缩放范围。从这个意义上说,一个未经训练的人可能错误地确定它的存在,导致误导估计。

另一方面,可以找到扩展范围 (图2(e)),它收敛于一个非常高的噪声电平值 (信噪比 dB)。这表明,动力学主要是由底层的随机组件。提到这种行为是很重要的在所有的声音是一致的,没有扩展区域 (类型 声音)。基于这些结果,我们建议的价值很高 可能是一个定量的指标类型 的声音。

为了找到一个噪声电平值,使我们能够区分类型 和类型 声音,我们选择通过目视检查所有的声音,估计没有显示了一个扩展的区域 然后,对于每一个信号,我们估计噪声电平值 并选择最小的值( )作为一个阈值。

3.1。自动估计的不变量

为了获得可靠的估计 , , ,有必要验证扩展行为的存在在粗粒度的估计。一旦发现,我们必须选择一个范围的 值的估计不变量。这个选择是至关重要的,因为在实际应用中,粗粒度估计强烈不同规模的函数。为了避免主观判断,我们提出了一个算法(参见算法1)自动估计 , , 基于粗粒度的估计 , , ,分别为(16]。

该算法选择缩放范围这些不变量应该估计基于未来标准:(i)的粗粒度的估计必须常数范围规模价值观和(2)不变的价值应该收敛随着嵌入维数的增加。

该算法首先近似U-correlation积分 为不同的 值( )使用(8)。请注意, 必须计算 因为不完整的形状参数γ和伽马函数必须大于零。接下来,对数导数 必须计算为了获得吗 (见(9))。观察到的相关性积分 等于相关积分 评估在 。在这篇文章中,得到了对数衍生品使用小波变换方法(22]。这产生一个光滑的版本的衍生品允许我们更好地估计不变量。

噪音水平必须从一系列的计算 粗粒度的估计量 几乎是常数和它的变化 值是最小的。在这个意义上,噪音水平,我们定义的函数16] 在哪里 是平均的 平均在 导数的 关于 , 给的变化 , 的产品是两个提到的功能。我们建议估计 范围内的 集中在 价值的 是最低的。这种方式, 估计的范围 集中在一个趋于稳定区域(缩放区域) ,通过参数及其值是一致的

关联维数和关联熵可以决定使用粗粒度的估计 (见(12)), (见(13分别)。找到一个范围的 值来估计 ,我们使用类似的方法,但从功能 ,分别。的函数 可以计算类似吗 但使用粗粒度的估计 ,分别。

每个不变量的估计整个群信号呈现在图3。图3(一个)显示了一个箱线图噪声估计的正常(N),病理类型 (PT ),病理类型 (PT ),病理类型 (PT ),病理类型 (PT )的声音。因为它可以观察到, 更大的比正常细胞病理的声音。然而,它是不可能建立一个统计区别正常和病理类型 和类型 的声音。另一方面,我们可以区分正常和病理类型 和类型 的声音。是很重要的说,贴上TP组 被选中,因为他们有一个噪声电平值吗 。注意,使用这个阈值,我们可以单独的类型 从类型 的声音。

箱线图的相关维度呈现在图3 (b)。有一个增加的 从正常到病态的声音。正常声音,中位数 ;病理类型 的声音, ;型 的声音, ;和类型 的声音, 。从这些结果,我们可以建立声音系统有一个较低的维度,即使在病理学的存在。TP组 没有出现在这个阴谋,因为根据定义,它的维度是无限的。关于熵的关系,如图3 (c)有一个小的增加 从正常到病态的声音。然而,它是不可能找到一个统计区别正常,病理类型 ,和病理类型 的声音。中值关联熵估计正常的声音 为病理类型, 声音是 为病理类型, 声音是 和病理类型 声音是

4所示。讨论

记住使用记录被在一个受控的环境中,我们可以将噪声水平与添加剂的强度随机组件与动态产生声音的共存。有一种倾向 增加它的值从正常声音病态的。这可以被视为一个增长的力量造成的随机组件的病理变化。此外,在病态的声音, 增加它的值随着的声音类型。

类型的定义 声音由Sprecher et al。2)指出,这些信号的特点是纯随机振荡;因此,他们的尺寸是无限的10]。在实践中,它是不可能衡量无限相关维度的价值因为它是有界的嵌入维度用来计算积分的关系。相反,无限维度相关性推断如果没有一个比例政权的粗粒度的估计量 在以前的研究中,这是通过目视检查,这始终是一个主观判断2,19]。

一个有趣的方面的粗粒度的估计量 是,在类型 信号分析,它总是提出了一种扩展范围的估计 ,虽然 没有扩展区域。这些结果让我们认为噪音水平可以作为一个客观衡量区分类型 和类型 的声音。

这里提出的阈值( )是利用声音信号,不存在比例政权 这个阈值,我们可以单独的类型 和类型 的声音。然而,我们知道这个阈值选择是基于观察从这个数据库。这个发现必须验证与更广泛的研究涉及大量的记录和嗓音保健专业人员。

我们估计相关尺寸的一致性与其他研究[6,19- - - - - -21]。在[23),蔡等人进行了相似模拟在凯Elemetrics数据库。他们报道的平均值 正常声音和病态的维度值增加。此外,他们获得了降低信噪比(这是根据计算24与声音的类型),在最低的类型 的声音。然而,他们没有分析类型 的声音。另一项研究由张和江进行了凯Elemetrics数据库报道意味着相关尺寸 正常的声音和 为一组声音震颤(25]。据我们所知,所有研究进行正常和病理的声音用Grassberger Procaccia相关性积分估计 这种方法的缺点,其估计对噪声敏感的存在,需要大 值收敛,不给出一个估计的噪声水平10,13]。然而,其他变体,如高斯相关积分尚未使用。

关于熵的关系,我们的研究结果表明,病理类型 和类型 声音稍微比普通的更大的价值。此外,这三种类型的声音了 值接近于零,这表明近周期性动态。型 声音,的值 是最棒的,这意味着更多的不规则和不可预测的动态。这些值比有了燕et al。26]。他们报道的一个估计 正常(平均值 )和食管发声(平均值 )科目。在[27),Calawerts等人的最大李雅普诺夫指数计算类型 ,类型 ,和类型 声音使用凯Elemetrics数据库。他们的研究结果表明增加价值的最大李雅普诺夫指数随着类型的声音。我们这项研究结果一致因为我们获得相关熵的估计不仅是大病态的声音比正常细胞也随声音的类型。

5。结论

在本文中,我们研究了正常和病理的声音通过维度的相关性,相关熵和噪音水平。这些不变量估计使用基于粗粒度的自动算法估计来自U-correlation积分。结果表明,声音的生产动力系统有一个较低的维度。的价值 更大的比正常细胞病理的声音。此外,它的价值随着声音的类型也会增加。关于熵的关系,其价值很低为正常和类型 和类型 病态的声音。虽然仍需要更广泛的研究,这一发现表明,系统动力学有谐波振荡行为。另一方面,病理类型 声音出现更高的值 ,意味着一个更复杂的行为反映在不规则的动态。噪声可以理解为一个随机扰动固有的生产系统的声音。我们的结果表明, 更大的比正常细胞病理的声音。此外,它增加随着声音的类型,是最高的类型 的声音。这意味着随机分量的存在是病态的声音更强。基于这些结果,在这项工作中,我们提出了一个定量的标准,可以用来区分类型 和类型 的声音。我们意识到的样本类型的限制 和类型 的声音。从这个意义上说,这些初步结果将与更广泛的验证研究涉及大量的记录和嗓音保健专业人员。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作得到了国家科学技术研究委员会(国家)的阿根廷,恩特国立大学(味道),IBB,赠款pid - 6136(味道)和pio - 14620140100014 - co (CITER-CONICET)。作者要感谢克里斯蒂娜Jackson-Menaldi教授,博士,和朱莉安娜Codino,硕士CCC-SLP,富有成效的讨论。