1。介绍
语言交流在日常生活中是一个不可或缺的过程;它通过耳蜗传播到大脑,然后就明白了。耳蜗是通常被称为一系列重叠的听觉过滤器正常的语音频率范围划分为狭窄的乐队,与中心频率对应的底膜上的特定位置(
1 ]。随着高频声波引起的最大位移基地附近的基膜,基膜接近顶点最强振动响应低频的声音。窄频带内的语音信号是一个复合信号组成的两种不同的信息:慢变振幅,称为颞信封(E),和快速变化与利率接近频带的中心频率,称为颞精细结构(TFS) [
2 - - - - - -
4 ]。声E线索可以提供足够的信息近乎完美语音识别在一个安静的环境,而助教需要一个嘈杂的背景和音高和音调识别(
3 ,
5 ,
6 ]。
演讲的冗余特性,基于光谱和时间信号,保证了情报的言论甚至暂时和幽灵似地退化条件下。在这种情况下,听众可能使用不同的策略来理解,如时间(
7 ,
8 )和光谱集成(
9 - - - - - -
11 ]。了解不同的光谱区域的相对重要性,多年的努力已经取得了。
通过改变光谱的位置“洞”的音质表示有序的耳蜗,香农et al。
12 )表明,一个洞顶端地区更有害的言语知觉使用时间E信息比基底上的一个洞或中部地区。Ardoint和Lorenzi
3 采用高通和低通方法表明颞E信息在1 - 2 kHz频率地区传达重要的语音提示,而协同效应(
13 没有考虑频率区域。
考虑到各地的协同效应的频率区域,Apoux和培根
14 ]孔和相关方法用于调查时间的相对权重E光谱区域的信息。然而,他们总是发现时间E信号中频率最高的地区(> 3.5 kHz)在一个嘈杂的环境更重要。随后,另一个识别任务bandpass-filtered演讲进行评估的能力在不同的频率区域使用时间E英语(
15 ]。辅音字母的识别评分测定只有1频率区域或2脱节或2相邻区域。性能随着region-center频率的增加不断增加的加工单区域和双区域在一个安静的环境,显示E线索在更高的频率区域(1.8 - -7.3 kHz)大多数辅音识别(
15 ]。
如上所述,大多数报道的研究探索英语的特点,没有语调语言,而有限的注意力都集中在普通话,色调被许多人使用的语言。罗等。
16 ,
17 ]显示,周期性波动信号(50 - 500 Hz)频率最高的地区(3043 - 6000赫兹)贡献了最普通话声调识别,而元音识别没有明显受到周期性波动信号的可用性的影响。汉语句子的认可,然而,对使用时间E线索的能力在不同的频率区域和结合颞E不同频率区域。有声调的语言,相同的音素与不同的音调有不同的意思。例如,音节/马/可以根据当中有不同的含义
F
0
轮廓。此外,讲普通话的听众更多的依赖
F
0
差异歧视泰国词汇音调比法语听众(
18 ]。它已经建立了基本频率的变化(
F
0
)发挥重要作用在音调识别(
19 ,
20. ),这反过来有助于汉语句子识别(
17 ,
21 ]。
Fogerty [
22 ]表明,声学TFS信号的中频地区(528 - 1941赫兹)重量最英语识别而低频(80 - 528赫兹)和高频(1941 - 6400赫兹)地区更重要(
22 ]。然而,从我们先前的研究结果表明,声TFS线索在低频区域贡献更多的普通话比英语句子识别。普通话的声TFS在低频区域的相对重量(~ 0.4)略低于的中频区域(~ 0.5)
10 ]。
考虑这些TFS重量分布的明显差异在英语和汉语之间的贡献
F
0
音识别,可能时间E的频率加权函数汉语不同于英语。本研究的目的是调查时间的相对权重E汉语句子识别不同频率区域在一个安静的环境。
2。材料和方法
2.1。参与者
总共40听力正常的听众(20男性,女性20)招募了在这个研究。他们的年龄从21到28日不等(平均= 24.9)年。所有受试者以普通话为母语,没有报道耳病的历史或听力困难。所有受试者招募了来自上海交通大学的毕业生和测试在上海交通大学附属第六人民医院。在所有参与者,听力阈值≤25 dB听力水平(HL),双边在八度间隔从0.25到8 kHz。纯音听力阈值与助教记录- 61听力计(Grason-Stadler,麦迪逊,WI)使用标准的听力测定的过程(
23 ]。无标题前有任何接触句子材料。
本研究经伦理委员会批准的上海交通大学附属第六人民医院。签署同意书是获得所有的参与者在测试之前,他们每小时的基础上补偿他们的参与。
2.2。信号处理
中文版本的听证会上噪声测试(MHINT),耳朵研究所提供的房子,作为原始材料,由男性演讲者数字化记录(
24 ]。MHINT材料由12个列表,每一个由20个句子。每个句子包含10个关键字,有240个关键词在一个列表中。
句子被过滤到30相邻频段使用零相位,三阶巴特沃斯滤波器(36 dB / 10月斜坡上),从80到7562赫兹。每个乐队是一个等效矩形带宽
(
E
R
B
N
)
为听力正常的听众,模拟正常的听觉系统的频率选择性[
25 ]。从每个乐队使用希尔伯特E信息提取分解和使用三阶巴特沃斯滤波器低通滤波器在64赫兹。然后E用于调节白噪声的振幅。envelope-modulated噪声是bandpass-filtered使用相同的滤波器参数,调制噪声的乐队后总结跨频段产生声波的频率区域E提示如下:1 - 8,卖地,14 - 18、19日~ 24日和25 - 30总结形成频率区域1 - 5,分别(表
1 )。
表1
截止频率的提取时间包络信息。
频率区域
乐队
低频率(赫兹)
上频率(赫兹)
1
1
80年
115年
2
115年
154年
3
154年
198年
4
198年
246年
5
246年
300年
6
300年
360年
7
360年
427年
8
427年
502年
2
9
502年
585年
10
585年
677年
11
677年
780年
12
780年
894年
13
894年
1022年
3
14
1022年
1164年
15
1164年
1322年
16
1322年
1499年
17
1499年
1695年
18
1695年
1913年
4
19
1913年
2157年
20.
2157年
2428年
21
2428年
2729年
22
2729年
3066年
23
3066年
3440年
24
3440年
3856年
5
25
3856年
4321年
26
4321年
4837年
27
4837年
5413年
28
5413年
6054年
29日
6054年
6767年
30.
6767年
7562年
调查的作用频率地区句子识别、声从1 E信息频率区域(5)条件,2相邻频率区域(4个条件),2不相邻频率区域(6条件),所有频率区域条件(1)提出了主题。防止可能的使用信息的过渡乐队(
4 ,
26 ),频率区域包含句子E信息结合互补的戴面具的人,是一个包含噪声的频率区域speech-to-noise比(信噪比)+ 16分贝。与句子的频率区域的准备E线索,白噪声是过滤到30相邻频带,总结产生噪声的频率区域。例如,“地区1”的条件意味着句子E的刺激呈现给听众包括信息从其他频率区域1和噪声频率区域(区域2 - 5)。类似的“1 + 2”是指组成的刺激声E频率区域1和2的信息和噪声的频率区域(地区3 - 5)。E的“地区”刺激包括来自所有五个频率区域(区域1 - 5)与不添加噪音。
中有12个列表MHINT材料,有16个实验条件进行测试。同样的列表是不习惯在两个不同的测试条件对一个主题,以避免任何学习效果。因此,16个测试条件被分成两组。组1 5 1频率条件区域完成,1 4 2相邻频率区域条件,条件与完整的频率区域。组2完成4条件与2相邻频率区域和6条件2不相邻频率区域。因此,每组有10个条件,和4实验条件与相邻频率地区2组是相同的。因此,每组有10个列表MHINT材料。
2.3。程序
40参与者被随机和同样分为组1和2,每个组成10男性和女性。参与者被称作单独测试,sound-attenuated亭。刺激了双耳参与者通过森海塞尔HD 205 II circumaural耳机为每个主题在最舒适的水平,通常在65 dBSPL。每个关键字在一个句子得分是正确的或不正确的,和表演表示为不同条件下正确单词的百分比。
大约30分钟的练习前提供正式的测试。实践刺激由40 MHINT材料的句子(两个列表),首次提出了“全地区”条件下处理,然后以同样的方式作为实验刺激。在实践提供了反馈。让参与者熟悉处理过的刺激,他们可以多次重复一个句子,因为他们希望在移动到下一个句子,直到他们到达了一个高原性能。
在正式的测试中,参与者被允许听句子,因为他们希望。所有10个条件,提出了对应于10 MHINT材料列表,在一个随机的顺序在受试者避免顺序效应。参与者被要求尽可能准确地重复句子和被鼓励去想如果不确定的单词一个句子中去。在测试期间没有给出任何反馈。需要随时都可以休息。测试的总时间为每个侦听器~ 2 h。
3所示。结果
3.1。Percent-Correct分数句子识别使用时间在条件E
平均percent-correct句子识别评分与声从一个频率E地区获得组1图所示
1 。分数范围从~ 8.2% ~ 16.3%,与该地区5状况得分最高,该地区2得分最低。事实上,听众无法理解句子的意义在这样不利的条件。然而,句子的可懂度使用时间E接近完美当所有五个地区提出了同时侦听器(图
2 )。数据转换为合理化反正弦单元(劳)统计分析的目的
27 ]。单向重复测量方差分析结果(方差分析)是用于不同条件下的频率区域,显示出显著的主要条件对句子识别的影响(
F
(
4,76
)
=
21.781
,
p
<
0.001
)。事后分析(图基的测试)显示,任意两个之间的成绩差距显著条件(
p
<
0.05
),除了成绩获得该地区3和地区4条件。
图1
平均得分percent-correct句子识别使用声时间包络函数组1的条件。标准误差表示错误。
图2
平均得分percent-correct句子识别使用声时间包络函数的条件状况组2和组1的一个完整的频率区域。标准误差表示错误。
与两个相邻区域的条件都是一样的在这两个学科组,我们比较这些条件的性能在两组第一个(表
2 )。独立样本
t
测试表明,percent-correct得分差异获得同等条件的两组没有显著的(所有
p
>
0.05
)。因此,从这两组数据被组合计算相对权重的五频率区域。
表2
比较percent-correct分数的条件有两个相邻频率地区两组。
条件
大量的组1
许多组2
t
以及
区域1 + 2
89.6
±
5.4
(%)
87.7
±
4.3
(%)
p
=
0
。
219年
区域2 + 3
74.0
±
5.0
(%)
77.2
±
6.4
(%)
p
=
0
。
091年
区域3 + 4
79.2
±
6.7
(%)
79.9
±
7.9
(%)
p
=
0
。
764年
区域4 + 5
68.8
±
9.2
(%)
69.7
±
7.7
(%)
p
=
0
。
746年
如图
2 和两个频率区域在所有情况下,分数> 55%,和该地区分数最高的1 + 2条件,~ 87.7%,而地区2 + 5分数最低的,~ 57.9%。一般来说,条件的智商得分两个频率区域倾向于减少两个区域之间的距离增加。结果受到单向重复测量方差分析,显示相当重要作用的条件(
F
(
9171年
)
=
56.094
,
p
<
0.001
)。事后分析(图基的测试)表明,该地区的性能使用时间E 1 + 2条件明显优于表现在所有其他情况下,有两个频率区域,和该地区的性能使用时间E 1 + 3,区域1 + 4,和区域3 + 4的条件下比在其他条件下,有两个频率区域。如果一个频率区域加上另一个频率区域,从获得的分数条件结合频率区域1会高于从条件获得与其他地区相结合。例如,如果频率区域2结合另一个频率区域,区域1 + 2的得分状况得分明显高于其他组合的频率区域,如地区2 + 3,地区2 + 4,和地区2 + 5的条件。然而,分数的条件之间的差异并不显著地区1时1 + 4 + 3或者地区与地区3 + 4,当地区1 3 + 5 + 5与区域或地区4 + 5。
3.2。相对权重的五个频率区域
计算相对权重不同的频率区域的汉语句子识别使用声学颞E,描述的最小二乘方法使用卷et al . (2002)。首先,每个区域的强度是定义为一个二进制值是0或1取决于该地区了。然后每个区域的强度的线性组合应用于预测听众的反应,和每个地区的重量计算通过最小化平方预测误差的总和。五个地区的原始权重每个侦听器被求和转化为相对权重值和每个地区的重量被表示为原始的重量除以这个总和。因此,五个地区的权重之和等于1.0。如图
3 区域1 - 5的平均权重分别为0.25,0.18,0.22,0.20,和0.15,分别。单向方差分析显示一个重要句子识别(主要地区对体重的影响
F
(
4,76
)
=
60.129
,
p
<
0.001
)。事后测试(测试图基)显示,任意两个频率之间的相对权重不同显著区域。颞E频率区域1和3贡献更多的句子的智能识别普通话比其他频率的信号区域。
图3
不同频率的相对权重区域使用的汉语句子识别声学颞信封。标准误差表示错误。
4所示。讨论
通过系统地改变刺激呈现给听众,识别评分与使用不同的频率区域声E线索都被记录下来。频率加权函数得到使用最小二乘方法来评估时间E信号不同频率的相对贡献地区汉语句子知觉。而颞信封在不同频率的相对贡献地区英语认知彻底研究[
13 ,
15 ,
28 ),这是第一个报告为中文句子讨论这个问题,有声调的语言。
从图可以看出
2 情报性能非常好当所有频率区域的时间E线索提出了(完整的区域);实际上,所有听众得分。这个结果与之前的结果一致显示,信封信息单独是充分的语音清晰度(在一个安静的环境
3 ,
29日 ,
30. ]。不过,这个句子识别正确的分数只有~ 10%时声E提示从一个频率区域单独呈现(图
1 )。当声波E线索从任意两个频率区域了,性能比简单的和获得的成绩与声的线索两个相应的频率区域单独提出。这种协同效应已经观察到以前[
11 ,
13 ,
31日 ]。沃伦et al。
11 ]发现区域集中在370和6000赫兹时综合但很少提供信息协同互动单独提出。希利和沃伦
31日 )还表明,莫名其妙的个人演讲地区成为可以理解的结合时,这个效果是类似于CI时仿真结果显示性能改进渠道的数量从1增加到2。然而,希利和沃伦只侧重于对区域平等对数的分离频率在1500赫兹。在这篇文章中,我们记录了在各种条件下的性能,与所有潜在的组合之间的频率区域,开声E的相对重量信号在不同频率区域。
频率加权函数表示,五个导致句子识别不同频率区域。区域1(80 - 502赫兹)和3(1022 - 1913赫兹)比其他地区更重要。的重要性的中频范围(类似于本研究区域3)是与先前的研究一致。清晰度指数(AI) [
32 )建议1500 - 2000赫兹频率区域是最重要的,和卷等。
33 )发现元音和辅音的识别是减少如果频率区域集中在1685 Hz移除。此外,意味着时间交叉频率包络演讲,一个迹象的频率区域提供最多的信息,估计是1421和1329赫兹,还安排了男性和女性分别为(
3 ]。这些结果表明,地区约1500赫兹频率对语音识别很重要。
然而,声学E在低频区域的相对重量(80 - 502赫兹)是最高的在目前的研究中,相对于研究Ardoint et al。
15 ),这表明,E信息从1.8 - -7.3 kHz频率地区比其他地区更重要对于英语的认可。对观察到的差异之间的研究,目前的研究中,我们建议四个可能的原因。首先,Ardoint等人使用vowel-consonant-vowel (VCV)刺激作为试验材料,而汉语句子在会话风格提出了这个实验。句子的上下文,也就是没有VCV刺激,可能在这种差异中发挥作用。第二,颞E Ardoint等人所使用的信息从每个2 -提取
E
R
B
N
采用带,然后总结在刺激呈现给听众。更好的模型正常耳蜗的频率选择性,颞E信息摘要提取连续1 - 30日
E
R
B
N
采用频带。第三,有明显的协同效应声E之间的信号不同的频率区域在这项研究中,尤其是当E线索从频率区域1结合其他频率区域。因此,频率区域的时间E提示1(80 - 502赫兹)最沉重的打击。相比之下,Ardoint等人建议两个频率区域的性能与E信息可以预测的表演时只有一个频率区域。虽然没有观察到明显的协同效应,E线索的句子识别评分从2频率区域往往会更高,如果区域4(1845 - 3726赫兹)被选为1的2频率区域(
15 ]。因此,实际上他们的结果表明E线索从高于1.8 kHz频率区域传播更多的信息。因此,应该会产生协同效应导致的高低频区域的重量普通话识别。
事实上,最重要的差异可能是语言的差异。有声调的语言,声调明显有助于普通话识别的识别,因为一个单音节词的音调是词法意义(
20. ,
21 ,
34 ]。人们普遍认为声调识别主要依赖的变化
F
0
(
19 ,
20. ,
35 ]。郭et al。
36 )表明,明确的
F
0
提示了声调识别最,听众可能一直分数> 90%正确。和时间编码
F
0
和振幅包络可能导致音识别或多或少缺乏明确
F
0
。研究也发现了一个振幅调制处理和普通话语调识别之间的显著相关性不明确
F
0
。同时,汉语声调识别已被证明与增强振幅之间的相似度并改善
F
0
轮廓(
17 ,
35 ,
37 ]。
考虑的重要作用
F
0
在语气上感知和音调识别汉语句子中识别的重要性,它似乎是合理的期望更高的体重为低频区域(区域1)汉语句子比没有语调感知英语的认可。同样,黄等。
38 )发现频率体重广东话是不符合英语重要性,由于语言的差异。与英语相比,低频信息对粤语的认可,这是归因于自然色调的粤语。此外,三分之一倍频带(< 180 Hz),它包含
F
0
男性演讲者,重量超过三分之一的四个八度乐队180至450赫兹(
38 ]。此外,香港和曾庆红(
39 1)找到了一个共振峰之间的关系(
F
1
)频率和四个普通话词汇音调。因此,部分
F
1
频率地区1也可能有助于音调识别。
每个频率区域的知识程度有助于汉语句子知觉可能允许我们修改程序策略的好处最大化利用人工耳蜗植入的电极映射最重量的频率区域。类似于“正常”加权函数对英语所描述的特纳et al。
28 摘要),频率加权函数指示普通话感知“正常”模式。基于可比效应的“洞”听力正常的听众和耳蜗植入设备的性能(
12 ),高权重的知识频率区域1和3一些听力正常的听众可能具有临床意义与耳蜗植入和听力受损的听众,有了些眉目中国患者康复治疗的发展。语音信号的频率,权重高的地区,可能会获得然后传输到相应的人工耳蜗电极。和该地区的高体重1建议的潜力双峰听力(
40 ),好好利用语音信息在低频区域,帮助耳蜗离子注入机在汉语语音识别的表现也更好。
然而,我们只关注汉语句子在正常的听众的认可,和独特的频率加权函数对听力损失和耳蜗植入设备仍然未知。Mehr et al。
41 ]表明,不同地区的相对权重耳蜗植入用户不同于那些正常的听众。王与听力正常的听众相比,et al。
42 )建议听众听力损失遭受缺乏使用谱包络信号的能力词汇音调识别由于减少频率选择性。特纳et al。
43 )表明,听众听力障碍不能比较不同频率区域和集成颞模式有效正常的听众。使用相同的语言刺激和该地区分工特纳et al。
28 ),Apoux和培根
14 ]表明,严重降低频率分辨率导致体重增加的高频区域。此外,知觉的听力损失患者通常遭受减少频率选择性;他们的频率加权函数可能不同于那些拥有正常听力。因此,还需要进一步的研究来解决不同的频率区域的相对重要性在汉语听力障碍。