NP 神经可塑性 1687 - 5443 2090 - 5904 Hindawi 10.1155 / 2017/7416727 7416727 研究文章 时间包络信号在不同频率的相对重量为汉语句子识别区域 http://orcid.org/0000 - 0001 - 5268 - 9645 1 太阳 渊源 1 http://orcid.org/0000 - 0002 - 9886 - 9585 Yanmei 1 Yujun 1 Shankai 1 Genglin 耳鼻咽喉头颈外科 上海交通大学附属第六人民医院 600号 山路 徐汇区 上海200233 中国 sjtu.edu.cn 2017年 19 01 2017年 2017年 08年 09年 2016年 04 01 2017年 19 01 2017年 2017年 版权©2017杨郭et al。 这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。

声颞信封(E)提示包含语音信息是分布在整个频谱。调查E的相对重量信号在不同频率区域汉语句子识别、E信息提取30连续的乐队在80 - 7562赫兹的范围使用希尔伯特分解,然后分配给五个频率区域。识别评分得到声学E线索从1或2随机区域从40听力正常的听众。而识别评分范围从8.2%到16.3%从只有一个地区E信息可用时,分数范围从57.9%到87.7%,当E两个频率区域的信息,表明颞E线索之间的协同效应在不同频率区域。接下来,从5 E信息频率的相对贡献区域感知句子使用最小二乘方法计算。结果表明,对于普通话,音调语言,颞E信号的频率区域1(80 - 502赫兹)和区域3(1022 - 1913赫兹)句子的智能识别效应要高于其他地区,特别是80 - 502赫兹的区域,包含基本频率( F 0 )信息。

上海市临床医学教育Commission-Gaofeng给予支持 20152526 中国国家自然科学基金 81300820 中国国家自然科学基金 81530029
1。介绍

语言交流在日常生活中是一个不可或缺的过程;它通过耳蜗传播到大脑,然后就明白了。耳蜗是通常被称为一系列重叠的听觉过滤器正常的语音频率范围划分为狭窄的乐队,与中心频率对应的底膜上的特定位置( 1]。随着高频声波引起的最大位移基地附近的基膜,基膜接近顶点最强振动响应低频的声音。窄频带内的语音信号是一个复合信号组成的两种不同的信息:慢变振幅,称为颞信封(E),和快速变化与利率接近频带的中心频率,称为颞精细结构(TFS) [ 2- - - - - - 4]。声E线索可以提供足够的信息近乎完美语音识别在一个安静的环境,而助教需要一个嘈杂的背景和音高和音调识别( 3, 5, 6]。

演讲的冗余特性,基于光谱和时间信号,保证了情报的言论甚至暂时和幽灵似地退化条件下。在这种情况下,听众可能使用不同的策略来理解,如时间( 7, 8)和光谱集成( 9- - - - - - 11]。了解不同的光谱区域的相对重要性,多年的努力已经取得了。

通过改变光谱的位置“洞”的音质表示有序的耳蜗,香农et al。 12)表明,一个洞顶端地区更有害的言语知觉使用时间E信息比基底上的一个洞或中部地区。Ardoint和Lorenzi 3采用高通和低通方法表明颞E信息在1 - 2 kHz频率地区传达重要的语音提示,而协同效应( 13没有考虑频率区域。

考虑到各地的协同效应的频率区域,Apoux和培根 14]孔和相关方法用于调查时间的相对权重E光谱区域的信息。然而,他们总是发现时间E信号中频率最高的地区(> 3.5 kHz)在一个嘈杂的环境更重要。随后,另一个识别任务bandpass-filtered演讲进行评估的能力在不同的频率区域使用时间E英语( 15]。辅音字母的识别评分测定只有1频率区域或2脱节或2相邻区域。性能随着region-center频率的增加不断增加的加工单区域和双区域在一个安静的环境,显示E线索在更高的频率区域(1.8 - -7.3 kHz)大多数辅音识别( 15]。

如上所述,大多数报道的研究探索英语的特点,没有语调语言,而有限的注意力都集中在普通话,色调被许多人使用的语言。罗等。 16, 17]显示,周期性波动信号(50 - 500 Hz)频率最高的地区(3043 - 6000赫兹)贡献了最普通话声调识别,而元音识别没有明显受到周期性波动信号的可用性的影响。汉语句子的认可,然而,对使用时间E线索的能力在不同的频率区域和结合颞E不同频率区域。有声调的语言,相同的音素与不同的音调有不同的意思。例如,音节/马/可以根据当中有不同的含义 F 0 轮廓。此外,讲普通话的听众更多的依赖 F 0 差异歧视泰国词汇音调比法语听众( 18]。它已经建立了基本频率的变化( F 0 )发挥重要作用在音调识别( 19, 20.),这反过来有助于汉语句子识别( 17, 21]。

Fogerty [ 22]表明,声学TFS信号的中频地区(528 - 1941赫兹)重量最英语识别而低频(80 - 528赫兹)和高频(1941 - 6400赫兹)地区更重要( 22]。然而,从我们先前的研究结果表明,声TFS线索在低频区域贡献更多的普通话比英语句子识别。普通话的声TFS在低频区域的相对重量(~ 0.4)略低于的中频区域(~ 0.5) 10]。

考虑这些TFS重量分布的明显差异在英语和汉语之间的贡献 F 0 音识别,可能时间E的频率加权函数汉语不同于英语。本研究的目的是调查时间的相对权重E汉语句子识别不同频率区域在一个安静的环境。

2。材料和方法 2.1。参与者

总共40听力正常的听众(20男性,女性20)招募了在这个研究。他们的年龄从21到28日不等(平均= 24.9)年。所有受试者以普通话为母语,没有报道耳病的历史或听力困难。所有受试者招募了来自上海交通大学的毕业生和测试在上海交通大学附属第六人民医院。在所有参与者,听力阈值≤25 dB听力水平(HL),双边在八度间隔从0.25到8 kHz。纯音听力阈值与助教记录- 61听力计(Grason-Stadler,麦迪逊,WI)使用标准的听力测定的过程( 23]。无标题前有任何接触句子材料。

本研究经伦理委员会批准的上海交通大学附属第六人民医院。签署同意书是获得所有的参与者在测试之前,他们每小时的基础上补偿他们的参与。

2.2。信号处理

中文版本的听证会上噪声测试(MHINT),耳朵研究所提供的房子,作为原始材料,由男性演讲者数字化记录( 24]。MHINT材料由12个列表,每一个由20个句子。每个句子包含10个关键字,有240个关键词在一个列表中。

句子被过滤到30相邻频段使用零相位,三阶巴特沃斯滤波器(36 dB / 10月斜坡上),从80到7562赫兹。每个乐队是一个等效矩形带宽 ( E R B N ) 为听力正常的听众,模拟正常的听觉系统的频率选择性[ 25]。从每个乐队使用希尔伯特E信息提取分解和使用三阶巴特沃斯滤波器低通滤波器在64赫兹。然后E用于调节白噪声的振幅。envelope-modulated噪声是bandpass-filtered使用相同的滤波器参数,调制噪声的乐队后总结跨频段产生声波的频率区域E提示如下:1 - 8,卖地,14 - 18、19日~ 24日和25 - 30总结形成频率区域1 - 5,分别(表 1)。

截止频率的提取时间包络信息。

频率区域 乐队 低频率(赫兹) 上频率(赫兹)
1 1 80年 115年
2 115年 154年
3 154年 198年
4 198年 246年
5 246年 300年
6 300年 360年
7 360年 427年
8 427年 502年

2 9 502年 585年
10 585年 677年
11 677年 780年
12 780年 894年
13 894年 1022年

3 14 1022年 1164年
15 1164年 1322年
16 1322年 1499年
17 1499年 1695年
18 1695年 1913年

4 19 1913年 2157年
20. 2157年 2428年
21 2428年 2729年
22 2729年 3066年
23 3066年 3440年
24 3440年 3856年

5 25 3856年 4321年
26 4321年 4837年
27 4837年 5413年
28 5413年 6054年
29日 6054年 6767年
30. 6767年 7562年

调查的作用频率地区句子识别、声从1 E信息频率区域(5)条件,2相邻频率区域(4个条件),2不相邻频率区域(6条件),所有频率区域条件(1)提出了主题。防止可能的使用信息的过渡乐队( 4, 26),频率区域包含句子E信息结合互补的戴面具的人,是一个包含噪声的频率区域speech-to-noise比(信噪比)+ 16分贝。与句子的频率区域的准备E线索,白噪声是过滤到30相邻频带,总结产生噪声的频率区域。例如,“地区1”的条件意味着句子E的刺激呈现给听众包括信息从其他频率区域1和噪声频率区域(区域2 - 5)。类似的“1 + 2”是指组成的刺激声E频率区域1和2的信息和噪声的频率区域(地区3 - 5)。E的“地区”刺激包括来自所有五个频率区域(区域1 - 5)与不添加噪音。

中有12个列表MHINT材料,有16个实验条件进行测试。同样的列表是不习惯在两个不同的测试条件对一个主题,以避免任何学习效果。因此,16个测试条件被分成两组。组1 5 1频率条件区域完成,1 4 2相邻频率区域条件,条件与完整的频率区域。组2完成4条件与2相邻频率区域和6条件2不相邻频率区域。因此,每组有10个条件,和4实验条件与相邻频率地区2组是相同的。因此,每组有10个列表MHINT材料。

2.3。程序

40参与者被随机和同样分为组1和2,每个组成10男性和女性。参与者被称作单独测试,sound-attenuated亭。刺激了双耳参与者通过森海塞尔HD 205 II circumaural耳机为每个主题在最舒适的水平,通常在65 dBSPL。每个关键字在一个句子得分是正确的或不正确的,和表演表示为不同条件下正确单词的百分比。

大约30分钟的练习前提供正式的测试。实践刺激由40 MHINT材料的句子(两个列表),首次提出了“全地区”条件下处理,然后以同样的方式作为实验刺激。在实践提供了反馈。让参与者熟悉处理过的刺激,他们可以多次重复一个句子,因为他们希望在移动到下一个句子,直到他们到达了一个高原性能。

在正式的测试中,参与者被允许听句子,因为他们希望。所有10个条件,提出了对应于10 MHINT材料列表,在一个随机的顺序在受试者避免顺序效应。参与者被要求尽可能准确地重复句子和被鼓励去想如果不确定的单词一个句子中去。在测试期间没有给出任何反馈。需要随时都可以休息。测试的总时间为每个侦听器~ 2 h。

3所示。结果 3.1。Percent-Correct分数句子识别使用时间在条件E

平均percent-correct句子识别评分与声从一个频率E地区获得组1图所示 1。分数范围从~ 8.2% ~ 16.3%,与该地区5状况得分最高,该地区2得分最低。事实上,听众无法理解句子的意义在这样不利的条件。然而,句子的可懂度使用时间E接近完美当所有五个地区提出了同时侦听器(图 2)。数据转换为合理化反正弦单元(劳)统计分析的目的 27]。单向重复测量方差分析结果(方差分析)是用于不同条件下的频率区域,显示出显著的主要条件对句子识别的影响( F ( 4,76 ) = 21.781 , p < 0.001 )。事后分析(图基的测试)显示,任意两个之间的成绩差距显著条件( p < 0.05 ),除了成绩获得该地区3和地区4条件。

平均得分percent-correct句子识别使用声时间包络函数组1的条件。标准误差表示错误。

平均得分percent-correct句子识别使用声时间包络函数的条件状况组2和组1的一个完整的频率区域。标准误差表示错误。

与两个相邻区域的条件都是一样的在这两个学科组,我们比较这些条件的性能在两组第一个(表 2)。独立样本 t 测试表明,percent-correct得分差异获得同等条件的两组没有显著的(所有 p > 0.05 )。因此,从这两组数据被组合计算相对权重的五频率区域。

比较percent-correct分数的条件有两个相邻频率地区两组。

条件 大量的组1 许多组2 t 以及
区域1 + 2 89.6 ± 5.4 (%) 87.7 ± 4.3 (%) p = 0 219年
区域2 + 3 74.0 ± 5.0 (%) 77.2 ± 6.4 (%) p = 0 091年
区域3 + 4 79.2 ± 6.7 (%) 79.9 ± 7.9 (%) p = 0 764年
区域4 + 5 68.8 ± 9.2 (%) 69.7 ± 7.7 (%) p = 0 746年

如图 2和两个频率区域在所有情况下,分数> 55%,和该地区分数最高的1 + 2条件,~ 87.7%,而地区2 + 5分数最低的,~ 57.9%。一般来说,条件的智商得分两个频率区域倾向于减少两个区域之间的距离增加。结果受到单向重复测量方差分析,显示相当重要作用的条件( F ( 9171年 ) = 56.094 , p < 0.001 )。事后分析(图基的测试)表明,该地区的性能使用时间E 1 + 2条件明显优于表现在所有其他情况下,有两个频率区域,和该地区的性能使用时间E 1 + 3,区域1 + 4,和区域3 + 4的条件下比在其他条件下,有两个频率区域。如果一个频率区域加上另一个频率区域,从获得的分数条件结合频率区域1会高于从条件获得与其他地区相结合。例如,如果频率区域2结合另一个频率区域,区域1 + 2的得分状况得分明显高于其他组合的频率区域,如地区2 + 3,地区2 + 4,和地区2 + 5的条件。然而,分数的条件之间的差异并不显著地区1时1 + 4 + 3或者地区与地区3 + 4,当地区1 3 + 5 + 5与区域或地区4 + 5。

3.2。相对权重的五个频率区域

计算相对权重不同的频率区域的汉语句子识别使用声学颞E,描述的最小二乘方法使用卷et al . (2002)。首先,每个区域的强度是定义为一个二进制值是0或1取决于该地区了。然后每个区域的强度的线性组合应用于预测听众的反应,和每个地区的重量计算通过最小化平方预测误差的总和。五个地区的原始权重每个侦听器被求和转化为相对权重值和每个地区的重量被表示为原始的重量除以这个总和。因此,五个地区的权重之和等于1.0。如图 3区域1 - 5的平均权重分别为0.25,0.18,0.22,0.20,和0.15,分别。单向方差分析显示一个重要句子识别(主要地区对体重的影响 F ( 4,76 ) = 60.129 , p < 0.001 )。事后测试(测试图基)显示,任意两个频率之间的相对权重不同显著区域。颞E频率区域1和3贡献更多的句子的智能识别普通话比其他频率的信号区域。

不同频率的相对权重区域使用的汉语句子识别声学颞信封。标准误差表示错误。

4所示。讨论

通过系统地改变刺激呈现给听众,识别评分与使用不同的频率区域声E线索都被记录下来。频率加权函数得到使用最小二乘方法来评估时间E信号不同频率的相对贡献地区汉语句子知觉。而颞信封在不同频率的相对贡献地区英语认知彻底研究[ 13, 15, 28),这是第一个报告为中文句子讨论这个问题,有声调的语言。

从图可以看出 2情报性能非常好当所有频率区域的时间E线索提出了(完整的区域);实际上,所有听众得分。这个结果与之前的结果一致显示,信封信息单独是充分的语音清晰度(在一个安静的环境 3, 29日, 30.]。不过,这个句子识别正确的分数只有~ 10%时声E提示从一个频率区域单独呈现(图 1)。当声波E线索从任意两个频率区域了,性能比简单的和获得的成绩与声的线索两个相应的频率区域单独提出。这种协同效应已经观察到以前[ 11, 13, 31日]。沃伦et al。 11]发现区域集中在370和6000赫兹时综合但很少提供信息协同互动单独提出。希利和沃伦 31日)还表明,莫名其妙的个人演讲地区成为可以理解的结合时,这个效果是类似于CI时仿真结果显示性能改进渠道的数量从1增加到2。然而,希利和沃伦只侧重于对区域平等对数的分离频率在1500赫兹。在这篇文章中,我们记录了在各种条件下的性能,与所有潜在的组合之间的频率区域,开声E的相对重量信号在不同频率区域。

频率加权函数表示,五个导致句子识别不同频率区域。区域1(80 - 502赫兹)和3(1022 - 1913赫兹)比其他地区更重要。的重要性的中频范围(类似于本研究区域3)是与先前的研究一致。清晰度指数(AI) [ 32)建议1500 - 2000赫兹频率区域是最重要的,和卷等。 33)发现元音和辅音的识别是减少如果频率区域集中在1685 Hz移除。此外,意味着时间交叉频率包络演讲,一个迹象的频率区域提供最多的信息,估计是1421和1329赫兹,还安排了男性和女性分别为( 3]。这些结果表明,地区约1500赫兹频率对语音识别很重要。

然而,声学E在低频区域的相对重量(80 - 502赫兹)是最高的在目前的研究中,相对于研究Ardoint et al。 15),这表明,E信息从1.8 - -7.3 kHz频率地区比其他地区更重要对于英语的认可。对观察到的差异之间的研究,目前的研究中,我们建议四个可能的原因。首先,Ardoint等人使用vowel-consonant-vowel (VCV)刺激作为试验材料,而汉语句子在会话风格提出了这个实验。句子的上下文,也就是没有VCV刺激,可能在这种差异中发挥作用。第二,颞E Ardoint等人所使用的信息从每个2 -提取 E R B N 采用带,然后总结在刺激呈现给听众。更好的模型正常耳蜗的频率选择性,颞E信息摘要提取连续1 - 30日 E R B N 采用频带。第三,有明显的协同效应声E之间的信号不同的频率区域在这项研究中,尤其是当E线索从频率区域1结合其他频率区域。因此,频率区域的时间E提示1(80 - 502赫兹)最沉重的打击。相比之下,Ardoint等人建议两个频率区域的性能与E信息可以预测的表演时只有一个频率区域。虽然没有观察到明显的协同效应,E线索的句子识别评分从2频率区域往往会更高,如果区域4(1845 - 3726赫兹)被选为1的2频率区域( 15]。因此,实际上他们的结果表明E线索从高于1.8 kHz频率区域传播更多的信息。因此,应该会产生协同效应导致的高低频区域的重量普通话识别。

事实上,最重要的差异可能是语言的差异。有声调的语言,声调明显有助于普通话识别的识别,因为一个单音节词的音调是词法意义( 20., 21, 34]。人们普遍认为声调识别主要依赖的变化 F 0 ( 19, 20., 35]。郭et al。 36)表明,明确的 F 0 提示了声调识别最,听众可能一直分数> 90%正确。和时间编码 F 0 和振幅包络可能导致音识别或多或少缺乏明确 F 0 。研究也发现了一个振幅调制处理和普通话语调识别之间的显著相关性不明确 F 0 。同时,汉语声调识别已被证明与增强振幅之间的相似度并改善 F 0 轮廓( 17, 35, 37]。

考虑的重要作用 F 0 在语气上感知和音调识别汉语句子中识别的重要性,它似乎是合理的期望更高的体重为低频区域(区域1)汉语句子比没有语调感知英语的认可。同样,黄等。 38)发现频率体重广东话是不符合英语重要性,由于语言的差异。与英语相比,低频信息对粤语的认可,这是归因于自然色调的粤语。此外,三分之一倍频带(< 180 Hz),它包含 F 0 男性演讲者,重量超过三分之一的四个八度乐队180至450赫兹( 38]。此外,香港和曾庆红( 391)找到了一个共振峰之间的关系( F 1 )频率和四个普通话词汇音调。因此,部分 F 1 频率地区1也可能有助于音调识别。

每个频率区域的知识程度有助于汉语句子知觉可能允许我们修改程序策略的好处最大化利用人工耳蜗植入的电极映射最重量的频率区域。类似于“正常”加权函数对英语所描述的特纳et al。 28摘要),频率加权函数指示普通话感知“正常”模式。基于可比效应的“洞”听力正常的听众和耳蜗植入设备的性能( 12),高权重的知识频率区域1和3一些听力正常的听众可能具有临床意义与耳蜗植入和听力受损的听众,有了些眉目中国患者康复治疗的发展。语音信号的频率,权重高的地区,可能会获得然后传输到相应的人工耳蜗电极。和该地区的高体重1建议的潜力双峰听力( 40),好好利用语音信息在低频区域,帮助耳蜗离子注入机在汉语语音识别的表现也更好。

然而,我们只关注汉语句子在正常的听众的认可,和独特的频率加权函数对听力损失和耳蜗植入设备仍然未知。Mehr et al。 41]表明,不同地区的相对权重耳蜗植入用户不同于那些正常的听众。王与听力正常的听众相比,et al。 42)建议听众听力损失遭受缺乏使用谱包络信号的能力词汇音调识别由于减少频率选择性。特纳et al。 43)表明,听众听力障碍不能比较不同频率区域和集成颞模式有效正常的听众。使用相同的语言刺激和该地区分工特纳et al。 28),Apoux和培根 14]表明,严重降低频率分辨率导致体重增加的高频区域。此外,知觉的听力损失患者通常遭受减少频率选择性;他们的频率加权函数可能不同于那些拥有正常听力。因此,还需要进一步的研究来解决不同的频率区域的相对重要性在汉语听力障碍。

5。结论

时间频率加权函数E信息来评估不同的贡献获得不同频率的地区汉语句子识别。结果表明,频率区域1的时间E线索(80 - 502赫兹)和3(1022 - 1913赫兹)比其他地区更重要。与英语的识别相比,低频区域使用的参数定义条件贡献更多的汉语句子感觉由于普通话的自然色调。

相互竞争的利益

作者宣称没有利益冲突相关的出版。

确认

这项研究是由上海市教育Commission-Gaofeng临床医学给予支持(批准号20152526)和中国国家自然科学基金(批准号81300820)Yanmei风和中国国家自然科学基金(批准号81530029)Shankai阴。

史密斯 z . M。 Delgutte B。 奥克森那姆 a·J。 荒唐的声音透露听觉感知的二分法 自然 2002年 416年 6876年 87年 90年 10.1038 / 416087 2 - s2.0 - 0037034899 Lorenzi C。 吉尔伯特 G。 H。 加尼叶 年代。 摩尔 公元前J。 听力受损的言语知觉问题反映无法用世俗的精细结构 美国国家科学院院刊》上的美利坚合众国 2006年 103年 49 18866年 18869年 10.1073 / pnas.0607364103 2 - s2.0 - 33845495121 Ardoint M。 Lorenzi C。 低通和高通滤波的影响语音的可懂度基于时间精细结构或信封提示 听力的研究 2010年 260年 1 - 2 89年 95年 10.1016 / j.heares.2009.12.002 2 - s2.0 - 73849121417 B。 l l H。 G。 年代。 Y。 陡峭的高频听力损失对语音识别的影响使用时间低频区域的精细结构 听力的研究 2015年 326年 66年 74年 10.1016 / j.heares.2015.04.004 2 - s2.0 - 84928887734 摩尔 公元前J。 颞精细结构的角色处理音高知觉,掩蔽,言语知觉听力正常,听力受损的人 在耳鼻咽喉科杂志协会的研究 2008年 9 4 399年 406年 10.1007 / s10162 - 008 - 0143 - x 2 - s2.0 - 55949134720 年代。 l Mannell R。 时间的相对贡献信封和精细结构线索词汇音调识别在听力受损的听众 在耳鼻咽喉科杂志协会的研究 2011年 12 6 783年 794年 10.1007 / s10162 - 011 - 0285 - 0 2 - s2.0 - 84855689571 摩尔 公元前J。 时间集成和上下文影响听力 《语音学 2003年 31日 3 - 4 563年 574年 10.1016 / s0095 - 4470 (03) 00011 - 1 2 - s2.0 - 0344581050 Bashford j . A。 不懂 k·R。 沃伦 r·M。 增加语音的可懂度通过多个音素的修复 知觉和心理物理学 1992年 51 3 211年 217年 10.3758 / BF03212247 2 - s2.0 - 0026826028 沃伦 r·M。 Hainsworth k·R。 布鲁巴克 b S。 Bashford j . A。 Jr。 希利 e·W。 谱恢复的言论:可理解性是增加了插入噪声谱差异 知觉和心理物理学 1997年 59 2 275年 283年 10.3758 / bf03211895 2 - s2.0 - 0031068522 B。 H。 G。 l K。 Y。 年代。 声时间的重要性在不同的光谱精细结构线索地区汉语句子识别 耳朵和听力 2016年 37 1 e52 e56 10.1097 / aud.0000000000000216 2 - s2.0 - 84952777618 沃伦 r·M。 不懂 k·R。 Bashford j . A。 布鲁巴克 b S。 谱冗余:可理解性的句子通过窄谱缝 知觉和心理物理学 1995年 57 2 175年 182年 10.3758 / bf03206503 2 - s2.0 - 0029249228 香农 r . V。 加尔文 J·J。 三世 Baskent D。 在听证会上 JARO——《耳鼻喉科学研究协会 2002年 3 2 185年 199年 10.1007 / s101620020021 2 - s2.0 - 0036615286 沃伦 r·M。 Bashford j . A。 Jr。 楞次 p W。 清晰度1-octave矩形乐队生成语音频谱当听到分别和配对 美国声学学会杂志》上 2005年 118年 5 3261年 3266年 10.1121/1.2047228 2 - s2.0 - 27744573345 Apoux F。 培根 s P。 时间信息的相对重要性不同频率区域辅音识别在安静和噪音 美国声学学会杂志》上 2004年 116年 3 10.1121/1.1781329 2 - s2.0 - 4444228949 Ardoint M。 阿古斯 T。 年代。 Lorenzi C。 在不同的光谱区域temporal-envelope言语线索的重要性 美国声学学会杂志》上 2011年 130年 2 EL115 EL121 10.1121/1.3602462 2 - s2.0 - 80052449422 X。 Q.-J。 r。 贡献的周期性波动信号在个别频率频道中国元音和声调的感知 技术声学 2005年 24 4 254年 258年 2 - s2.0 - 29544443003 X。 Q.-J。 加强中国音调识别通过操纵振幅包络:对耳蜗植入设备的影响 美国声学学会杂志》上 2004年 116年 6 3659年 3667年 10.1121/1.1783352 2 - s2.0 - 4944250298 卡布瑞拉 l F.-M。 Gnansia D。 Bertoncini J。 Lorenzi C。 的角色spectro-temporal精细结构线索为法语和汉语的听众lexical-tone歧视 美国声学学会杂志》上 2014年 136年 2 877年 882年 10.1121/1.4887444 2 - s2.0 - 84905686474 惠伦 d . H。 Y。 普通话声调信息在振幅轮廓和简短的片段 Phonetica 1992年 49 1 25 47 10.1159 / 000261901 2 - s2.0 - 0026470422 l N。 色调语言和人工耳蜗 听觉假肢 2011年 341年 364年 Q.-J。 F.-G。 香农 r . V。 独唱 s D。 色调信封提示中文语音识别的重要性 美国声学学会杂志》上 1998年 104年 1 505年 510年 10.1121/1.423251 2 - s2.0 - 0031829651 Fogerty D。 感知加权个人和并发线索的句子可懂度:频率、信封和精细结构 美国声学学会杂志》上 2011年 129年 2 977年 988年 10.1121/1.3531954 2 - s2.0 - 79952122614 ANSI 美国国家标准规格听力计(ANSI s3.6 - 2004) 2004年 纽约,纽约,美国 美国国家标准协会 l . l . N。 独唱 s D。 年代。 N。 硕士。 开发汉语听力的噪音测试(MHINT) 耳朵和听力 2007年 28 2 70年代 74年代 10.1097 / aud.0b013e31803154d0 2 - s2.0 - 34247631164 格莱斯伯格 b R。 摩尔 公元前J。 从notched-noise数据推导听觉滤波器的形状 听力的研究 1990年 47 1 - 2 103年 138年 10.1016 / 0378 - 5955 (90)90170 - t 2 - s2.0 - 0025110885 沃伦 r·M。 Bashford j . A。 Jr。 楞次 p W。 可理解性的带通滤波的演讲:所需的斜坡陡度消除过渡带的贡献 美国声学学会杂志》上 2004年 115年 3 1292年 1295年 10.1121/1.1646404 2 - s2.0 - 1542347062 Studebaker g。 “合理化”的反正弦变换 语音与听力研究杂志》上 1985年 28 3 455年 462年 10.1044 / jshr.2803.455 2 - s2.0 - 0022118936 特纳 c·W。 Kwon b . J。 田中 C。 克纳普 J。 Hubbartt j·L。 多尔蒂 k。 频率加权函数估计的宽带语音相关法 美国声学学会杂志》上 1998年 104年 3,第1部分 1580年 1585年 10.1121/1.424370 2 - s2.0 - 0542373748 香农 r . V。 F.-G。 Kamath V。 Wygonski J。 Ekelid M。 语音识别主要时间线索 科学 1995年 270年 5234年 303年 304年 10.1126 / science.270.5234.303 2 - s2.0 - 0028823541 F.-G。 人工耳蜗的趋势 放大的趋势 2004年 8 1 1 34 10.1177 / 108471380400800102 2 - s2.0 - 3142617888 希利 e·W。 沃伦 r·M。 对比的作用时间振幅模式感知的演讲 美国声学学会杂志》上 2003年 113年 3 1676年 1688年 10.1121/1.1553464 2 - s2.0 - 0037336168 ANSI 美国国家标准清晰度指数的计算方法 1969年 纽约,纽约,美国 美国国家标准协会 K。 Loizou p C。 多尔曼 M。 Spahr T。 语音的可懂度与“黑洞” 美国声学学会杂志》上 2002年 112年 3 1102年 1111年 10.1121/1.1498855 2 - s2.0 - 0036713102 C.-G。 K。 F.-G。 普通话声调识别在人工耳蜗科目 听力的研究 2004年 197年 1 - 2 87年 95年 10.1016 / j.heares.2004.06.002 2 - s2.0 - 3142578213 Q。 F。 在中国的音识别的识别时间包络信号 亚太杂志》的演讲中,语言和听力 2013年 5 1 45 57 10.1179 / 136132800807547582 研究。 罗森 年代。 福克纳 一个。 用普通话色调对比声学线索:对耳蜗植入设备的影响 美国声学学会杂志》上 2008年 123年 5 2815年 2824年 10.1121/1.2896755 2 - s2.0 - 43549100661 X。 Q.-J。 C.-G。 K.-L。 语音识别和颞调幅讲普通话的耳蜗植入用户处理 耳朵和听力 2008年 29日 6 957年 970年 10.1097 / AUD.0b013e3181888f61 2 - s2.0 - 60849104831 l . l . N。 a·h·S。 e·W·W。 独唱 s D。 粤语语音清晰度指标的发展 美国声学学会杂志》上 2007年 121年 4 2350年 2361年 10.1121/1.2431338 2 - s2.0 - 34047252327 香港 y y。 F.-G。 时间和光谱信号用普通话声调识别 美国声学学会杂志》上 2006年 120年 5 2830年 2840年 10.1121/1.2346009 2 - s2.0 - 33750347978 X。 Y.-P。 彭译葶。 r . Y。 贡献的双峰听力词汇语气标准化在讲普通话的耳蜗植入用户 听力的研究 2014年 312年 1 8 10.1016 / j.heares.2014.02.005 2 - s2.0 - 84895762527 较多 m·A。 特纳 c·W。 帕金森 一个。 频道在人工耳蜗语音识别用户的权重 美国声学学会杂志》上 2001年 109年 1 359年 366年 10.1121/1.1322021 2 - s2.0 - 0035174768 年代。 Mannell R。 Newall P。 D。 光谱信号的贡献普通话词汇音调识别在听力正常和听力受损的普通话扬声器 耳朵和听力 2011年 32 1 97年 103年 10.1097 / AUD.0b013e3181ec5c28 2 - s2.0 - 78651396175 特纳 c·W。 S.-L。 年代。 限制光谱分辨率的演讲听众感音神经性听力损失 杂志》的演讲中,语言,和听力的研究 1999年 42 4 773年 784年 10.1044 / jslhr.4204.773 2 - s2.0 - 0032766615