研究文章|开放获取
Jussi雷默,Vesa Valimaki, ”数字增强现实音频耳机”,电气和计算机工程杂志》上, 卷。2012年, 文章的ID457374年, 13 页面, 2012年。 https://doi.org/10.1155/2012/457374
数字增强现实音频耳机
文摘
现实增强音频(ARA)结合虚拟声源的声环境用户。ARA系统可以实现一个包含双耳麦克风的耳机。理想情况下,ARA耳机应该是听觉上透明的,也就是说,它不应该导致音响改造周围的声音。ARA混合器的实际实现低延迟耳机生殖系统需要额外的均衡补偿衰减和修改耳共振引起的耳机。本文提出了数字IIR滤波器实现所需的均衡和评估一个实时ARA原型系统。测量结果表明,数字ARA原型系统的吞吐量延迟可以小于1.4毫秒,在实践中这是足够小。当直接和加工相结合的人耳的声音,一个梳状滤波效应带来和出现频率响应等级。梳状滤波器的效果在讲话和音乐信号,研究了在听力测试中,发现20分贝衰减时听不清。插入ARA耳机有一个足够的约1 kHz以上频率衰减。该数字ARA系统允许几个身临其境的音频应用程序,如虚拟导游音频和音频电话会议。
1。介绍
增强现实的概念被定义为一个实时现实世界和虚拟世界的结合(1]。最直观的实现增强现实是一个视觉透明显示,显示了现实世界与虚拟内容扩展。相同的概念用于增强现实音频(ARA),日常环境和虚拟声音相结合。为了做到这一点,特别设计的ARA硬件是必要的。静态ARA环境使用扬声器阵列可以实现,然而,ARA的真正效用实现与流动性。ARA的移动版本可以实现与集成到一个双耳的立体声耳机麦克风耳机或骨传导耳机,把耳道开放(1,2]。
只有ARA耳机在本文的范围。ARA耳机,麦克风的目的应该继电器周围声音的耳机,也就是说,耳机应该是听觉上透明,没有区别真正的周围的声音听着没有耳机。周围的声音的复制,经历了ARA耳机被称为pseudoacoustic环境(1]。
双耳麦克风的耳机应该尽可能接近耳道入口为了保持声音的空间信息(3]。因此,耳机是由一对有源噪声取消耳机,入耳式耳机类型和由集成双耳麦克风。或者,可以构建ARA耳机通过安装一对小驻极体麦克风耳机。当麦克风放置耳道的入口附近,周围声音的修改,由于用户的上半身,头,外耳保存相当准确。然而,ARA耳机本身创造了改变pseudoacoustic表示真实的环境,主要是由于耳机音响和外耳声学的变化当耳机插入耳道。因此,耳机需要额外的均衡提供听觉上透明的繁殖的环境听起来。
图1显示了一个完整的ARA系统的框图(1]。左边第一个块是用于创建虚拟声音,可以嵌入到pseudoacoustic表示。此外,它可以利用位置和方向信息保持虚拟音频对象用户移动时,他/她的头。在创建一个实际的一个重要组成部分ARA系统是ARA搅拌机、路线和混合系统中涉及到的所有信号。此外,ARA混合器的均衡需要创建一个听觉上透明的耳机(4]。耳机是类似于常见的入耳式耳机,这是现在广泛使用的便携式媒体播放器和智能手机。预处理块可以用来发送用户的双耳麦克风信号到一个遥远的用户进行交流沟通的目的。ARA混合器和耳机的用户佩戴设备系统。
即使ARA耳机将提供完美的音质和听到的经验,它仍然需要有用的应用程序为了真正受益的用户(5]。最有前途的应用包括完整的音频带宽(20 Hz-20千赫)双耳语音和音频会议与用户(遥远的受试者严厉批评6,7]。此外,ARA技术使基于位置的信息服务,如虚拟导游和音频备忘录(1]。
先前ARA混合器的原型是由模拟电子,以避免延迟(8]。这是很重要的,因为通过和周围环境声音泄漏的部分耳机进入耳道,如果pseudoacoustic表示延迟ARA混合器,它导致一个梳齿形滤波器效应当添加到泄漏的声音。然而,有一个伟大的兴趣代替笨重且昂贵的模拟和数字信号处理(DSP)组件。数字实现会带来许多好处相比,模拟实现。好处包括可编程性,这将使一个方便使用的均衡曲线;易用性设计;精度。不利的一面是,介绍数字实现比一个模拟实现延迟,导致感知信号的梳状滤波效应。然而,数字实现的ARA混合器可以实现使用一个低延迟DSP由于明显的衰减能力的入耳式耳机,可以大大降低梳齿形滤波器的效果。
本文研究的目的是否ARA均衡器可以使用DSP实现之间是否延迟pseudoacoustic表示和耳机过度恶化感知声音的泄漏。的数字实现ARA均衡器可以带来很多增强模拟实现相比,但前提是音质依然足够好。
本文组织如下。部分2描述了ARA技术的原则。部分3专注于数字滤波器和延迟特性。部分4介绍了群时延估计的一个被动的机制。部分5专注于数字ARA均衡器的实现。部分6介绍了一个案例研究的数字ARA混合器,和部分7总结了纸。
2。ARA技术
ARA硬件已经专门为这个目的设计并建造的(4]。它由ARA的耳机和ARA混合器。ARA耳机的基础是它必须能够准确地再现周围的声环境。为了做到这一点,除了耳机有两个外部麦克风耳机驱动程序。繁殖pseudoacoustic环境的质量必须足够足够让用户不断穿ARA耳机长时间不间断。
然而,由于耳机音响,pseudoacoustic表示不是一个精确复制周围的声音。因此,需要一个均衡器纠正pseudoacoustic表示。最初,均衡是设计成模拟为了尽可能低延迟(4]。此外,ARA混合器用于虚拟声音对象嵌入到用户的良好环境,以及所有的额外的设备连接到ARA系统。
2.1。耳机音质
在正常听力张开耳朵,修改入射声波的侦听器的身体,头,外耳。与传统麦克风声音被记录时通过耳机,远离身体和回放的修改造成的侦听器丢失的身体。然而,当麦克风放置双耳耳道入口附近,大多数的这些修改保存。
相比主要区别在使用入耳式耳机听张开耳朵的耳机完全挡住耳朵运河。开放耳充当一个四分之一波长谐振器,也就是说,像一个管一端开放和另一端封闭的耳膜。开放耳道的第一个四分之一波长共振发生在大约2 - 4 kHz。当一个入耳式耳机块耳道时,它就变成了半波谐振器。封闭耳不仅创建一个新的半波共振,但它也取消了四分之一波长共振由开放耳道,人们习惯于听到。第一个半波共振发生在大约5 - 10 kHz,根据耳道的长度和耳机的配件。
这些共振行为时,需要考虑设计式耳机。耳机设计的基本思想是使耳机听起来自然,也就是说,就像人会张开耳朵听。耳机需要取消不自然的半波谐振和创建缺失的四分之一波长共振为了听起来自然。
2.1.1。ARA耳机的泄漏
根据类型的耳机,不同数量的环境声音传播到耳道泄漏,通过耳机。在这项研究中,我们专注于耳内的泄漏类型ARA中使用耳机耳机。在某些情况下耳机漏下是可以的,例如,当一个人需要听到周围环境的声音。然而,在ARA耳机泄漏的情况下,特别是控制泄漏,这可以恶化pseudoacoustic经验(10]。泄漏颜色耳膜的声音信号事件,因为到达耳膜的声音信号的总和pseudoacoustic耳机声音复制的传感器和周围环境的声音泄露。泄漏造成的影响是最著名的在中低频率(下图1 kHz)。
如果泄漏路径是已知的,它可以补偿他们,例如,的帮助下ARA混合器的均衡。问题是,不同的耳机有不同类型的泄漏甚至入耳式耳机,类型最可控泄漏行为,每次放入耳朵的耳机,配件略有不同,因此,泄漏路径和水平也不同。泄漏也发生在两个方向;从周围的环境到耳道,从耳道周围的环境。后一种情况是很重要的,因为压力室的原则。
2.1.2。压力室原则
当听喇叭声压波辐射到整个房间周围的听众。使用耳机时,尤其是式耳机的体积空间的波是在非常小的体积相比一个房间。入耳式耳机之间的空腔和耳朵鼓大约是1厘米3。这样一个小腔很容易产生高声压水平。在中低频率,波长相比很大耳机司机,耳道内的压力与体积相位移传感器膜及其振幅成正比(11]。因此,压力室原理提高中低频率。
原则上,达到压力室的效果,耳机应该紧密配合,这样就不会有泄漏,但实际上小泄漏并不影响(11]。图2显示了一个入耳式耳机的频率响应测量声波测井和耳道模拟器与严格拟合和宽松的。可以看到,当耳机适合松散到耳道模拟器,低频水平降低。
2.1.3。耳机衰减
图3显示了三种不同的隔离曲线测量三种不同类型的耳机。可以看到,入耳式耳机是有利的,因为他们被动地有效隔离外部环境噪声。此外,隔离是高频率的依赖。此外,一个好的拟合的入耳式耳机是非常重要的,因为耳机垫和皮肤之间的泄漏,发生急剧恶化被动隔离。
2.2。均衡器
为了找到一个合适的平衡曲线,打开耳朵情况和pseudoacoustic情况测量使用的模拟原型ARA混合器(4]。图4显示测量结果,黑色曲线描绘了开放的耳朵和灰色的曲线描绘了pseudoacoustic案件,也就是说,如果声音经历了ARA耳机和混合器。可以看到,pseudoacoustic表示有提高在低频率(由于压力室原则),四分之一波长共振已经消失了,出现了半波谐振(由于封闭耳)。因此,均衡需要由一个高通滤波器,降低了低音增强,恢复四分之一波长谐振峰值过滤器,陷波滤波器,取消了半波共振。均衡器呈现在图的框图5。
当前模拟ARA均衡器使用一个通用的均衡曲线的平均四人的个人均衡曲线(见图6)。高通滤波器的截止频率可调从6到720 Hz,滤波器有一个中心频率峰值700至3200赫兹,和陷波滤波器的中心频率可以调整1800至8500赫兹(4]。
2.3。可能的应用
ARA技术创新应用提供了实现的平台。这些应用场景简要提出了在这一节中。ARA应用程序可以被归类在许多方面,包括通信或信息服务,人与人之间,或machine-to-human通讯(7]。例如,双耳电话和电话会议是人与人之间的通信服务,而虚拟音频导游machine-to-human信息服务。
2.3.1。双耳电话
正常的电话和手机传送monosound和限制他们的带宽300 Hz - 3400赫兹。有一些免提设置有两个耳塞,但他们只是复制monosignal每个耳机,因此它不是真正的双耳电话。双耳电话意味着两个ear-microphone信号来自用户相互传播。这不能用标准的电话网络和GSM网络,因此我们需要另一种解决方案,如VoIP (IP语音)。VoIP使用IP数据包携带双耳语音信号在网络上(互联网)。与VoIP没有必要限制频率带宽可以转移整个声音周围围绕着一个用户到另一个用户,也就是说,远端侦听器听到相同的pseudoacoustic繁殖近端用户。
ARA的不便在双耳电话耳机是当用户会谈,坐落在其他用户的声音头和在某些情况下也可以太大声的声音。这是可以避免的,如果检测到用户的自己的声音,然后批评在远端用户HTRFs的帮助下。这将创建一个更自然的感觉谈话,因为远端用户出现在听众面前(7]。
2.3.2。音频电话会议
音频电话会议类似于双耳电话除了通常比两个更大数量的参与者。现在电话会议是常见的,因为全球化的企业中,这常常使面对面的会议几乎是不可能的。传统的音频电话会议举行的帮助下电话和免提。这里的一个问题是缺乏远程呈现,因为所有复制参与者通过电话或扬声器。与ARA耳机音频电话会议将被带到一个新的程度。很容易形成讨论组,包括远程和本地参与者。远程参与者可以批评在用户(见图7)和混合用户相同的声学环境。这种方式很容易把参与者和区分谁是说话。
有很多方法可以利用ARA技术在不同类型的音频电话会议。一个场景是一个传统的会议安排和一个团队成员的城镇,但想参与。如果他/她有ARA耳机和至少一个出席会议的人有一个ARA耳机,外地团队成员可以参与会议几乎(见图8)。因为ARA技术,外地员工可以听到相同的声音的人穿着ARA在会议室听耳机。一个缺点是,如果没有扬声器系统只在会议室的人穿ARA耳机可以听到其他团队成员。
另一个麻烦,类似于双耳电话,影厅内用户的自己的声音被本地化远端用户的头,声音比其他参与者的声音响在会议室。这可以避免使用相同的原则与双耳电话:语音活动检测和电火花冲激过滤(7]。
2.3.3。虚拟音频导游
一个虚拟音频导游ARA应用程序是一个有趣的想法。它可以取代导游,给用户自由去探索一个城市本身没有预定的路线和时间表。ARA的想法是耳机有定位功能,例如,GPS,或许一个头部跟踪。因此,应用程序知道用户在哪里,他们正在寻找的方式。然后用户可以走动的城市ARA耳机并自动听到有趣的地方他们访问的信息。此外,虚拟音频导游可以有一个GPS导航应用程序引导用户从一个地方到另一个,以及包含所有类型的信息,如餐厅、公共交通,和音乐会5]。
3所示。数字滤波器
而模拟过滤器使用模拟电子元器件,如电阻,电容,来执行所需的过滤,数字滤波器使用一台电脑或一个信号处理器执行数值计算(离散)采样信号。使用数字滤波器时,必须先模拟声音信号采样和量化的,也就是说,声音的音频信号转换为数字。抽样一个连续时间信号转换成离散时间信号,量化级连续级值映射到离散值。采样和量化执行使用模拟-数字转换器(ADC)。此外,过滤后的数字信号必须转换回模拟信号的数模转换器(DAC)中描述的人物9。
数字滤波器模拟滤波器相比有很多优势,如以下。(我)数字滤波器是可编程的,也就是说,数字滤波器可以很容易地改变了硬件而不影响。(2)与数字滤波器可以创建更精确和严格的过滤器,而不是模拟技术。(3)与数字滤波器来实现自适应滤波器(很简单12]。
然而,数字滤波器比模拟滤波器创建更多的延迟。事实上,模拟滤波器几乎无关紧要的延迟,也就是说,当电信号的间隔传播通过滤波器电路。
3.1。延迟
延迟的定义是刺激与反应之间的运行时间(13]。与数字滤波器这意味着输入和输出之间的时间。延迟的主要来源在数字系统过滤器,广告和DA转换器(见图9)。过滤器通常有频率依赖延迟,可以与一群延迟。
3.1.1。AD / DA转换器
连续信号(电压)转换成一个序列的数字(数字信号)模拟-数字转换(广告)。相反的过程,即当一个数字信号转换回模拟领域,被称为数模转换(DA)转换。一个模数转换器第一数字转换模拟信号,然后在电压。是很重要的做这个订单的量化或否则它会导致严重错误(14]。转换器的分辨率意味着模数转换器可产生离散振幅值的数量通常是表达的碎片。其他重要属性的广告和DA转换器的速度和准确性。
AD转换器有两种类型的延迟:周期延迟和延迟时间。周期延迟定义之间的完整的数据周期的起始输入信号转换和相应的输出数据的可用性。延迟时间之间的延迟时间的信号采集开始完全定居的时间可以从转换器(读取数据15]。
转换速度(换句话说,延迟)不同模数转换器的类型。Flash广告转换器被认为是最快的广告类型转换器。一个flash模数转换器的基本思想是将输入电压与一组参考电压,最近的价值在哪里选择采样值。在flash转换器转换发生在一个单一的周期(16]。然而,flash广告转换器相对昂贵和他们的典型的分辨率大约是8 - 12位。分辨率低,因为每增加一位分辨率双打的电路。然而,直接增加分辨率可以通过叠加两flash转换器。延迟flash广告和DA转换器可以,例如,10μ年代和5μ年代,分别。
常见的声卡,比如Edirol fa - 101火线音频接口或一个内部声卡的一台笔记本电脑,通常不使用非常快的广告或DA转换器。没有特别需要更快的转换器,因为他们大多是用于音乐听,几毫秒延迟不是一个问题。例如,一个简单的测量表明,Edirol音频接口的总延迟21女士和MacBook笔记本电脑的内部声卡8.6毫秒的延迟。DA转换器的测量延迟包括延迟的延迟(输出)和AD转换器(输入)。
3.1.2。数字滤波器的相位和群延迟
实相的反应一个过滤器(即。,the angle of the frequency response) gives the phase shift in radians that each input sinusoid component will undergo [17]。两种延迟响应可以从相位响应,即相位延迟和群延迟。而弧度的相位响应给出了相移相位延迟说明了每个输入正弦分量的时间延迟秒。相位延迟定义如下:
而相位延迟给每个正弦组件的延时,延时的群延迟给正弦信号的振幅包络线,也就是说,一组窄带的正弦的延迟组件。群延迟定义如下:
线性相位响应的相位延迟和群延迟是相同的,(17]。然而,如果相位非线性响应,相位和群延迟是不同的。此外,相位延迟可以被认为是负斜率的直线通过0和安装所需的点相位响应和群延迟可以被认为是消极的局部梯度相位响应。
4所示。群时延的一个被动的机制
环境噪声衰减时取得的入耳式耳机阻塞耳道。耳机的被动衰减行为作为一个低通滤波器(18]。图10曲线显示了孤立的ARA耳机测量头和躯干模拟器。下面的图显示出一个大约13-dB衰减机械截止频率和超过20 dB更高频率的衰减。
正如前面提到的增强现实的感知声音音频系统的总和的pseudoacoustic表示周围的声音和通过耳机的声音泄露。泄露的声音传播通过被动机制,也就是说,机械的低通滤波器,虽然这样做是受到额外的群延迟约0.8 - 2女士在机械截止频率以下(18]。机械群延迟可能允许额外的电子系统中的延迟,造成数字滤波器和AD / DA转换器,ARA混频器的性能没有下降。
进行测量评估造成的延迟被动使用两个麦克风声音传播。第一个麦克风放置在耳机,而第二个麦克风放置在耳道。一个正弦扫描是通过外部声源和两个麦克风的脉冲响应测量。内部和外部麦克风之间的互相关计算,而耳机是安装第一个紧密,然后非常松散到耳朵。获得的拖延是大约0.21女士紧密安装情况和0.06女士松散安装耳机,不孤立周围的声音。因此,延迟增加大约0.15女士由于机械响应的耳机。
5。数字滤波器设计
主要有两种类型的数字滤波器,即FIR(有限脉冲响应)和IIR无限脉冲响应滤波器。冷杉过滤器有一个前馈结构和它产生一个有限脉冲响应。FIR滤波器相比,IIR滤波器具有反馈结构,导致无限脉冲响应。FIR滤波器本质上是稳定的,然而,IIR滤波器。FIR滤波器的缺点是,他们需要更多的计算能力比IIR滤波器。此外,FIR滤波器引入更多的延迟信号,因为他们通常有较长的延迟。
biquad滤波器是一种IIR滤波器类型可用于创建许多种类的滤波器响应。biquad滤波器的传递函数包括两个二次函数: 在系数和确定滤波器的响应。图11显示的直接形式我实现biquad过滤器。我结构的直接形式是一个简单的方法来实现IIR滤波器。然而,它需要单位延迟,当过滤器订单。也有其他的可能性实现biquad过滤器,例如,只需要转置直接形成II单位延迟的阶滤波器。
5.1。数字均衡器设计
一种选择是使用脉冲响应测量的模拟ARA均衡器和创建一个数字滤波器只需使用脉冲响应的滤波器系数的值。这种技术产生45阶数字滤波器具有相同的大小反应与原始模拟均衡器。
然而,一个更优雅的方式来实现数字ARA均衡器设计三个独立的IIR滤波器,也就是说,一个一阶高通滤波器(低音控制),一个biquad峰值过滤器(用于创建四分之一波长共振),和一个biquad陷波滤波器(取消半波谐振)如图5。参数IIR滤波器结构提供了良好的适应性,使有用的特性,比如个人为不同用户均衡。
图12显示了这三个参数IIR滤波器的频率响应,以及这些过滤器的频率响应相结合,设计的数字实现基于模拟ARA混合器ARA均衡器。最顶层subfigure演示了一个一阶巴特沃斯高通滤波器截止频率为400赫兹。中上subfigure说明了biquad峰值滤波器中心频率为2250赫兹,−3 dB 870赫兹的带宽和增益为9.6 dB。底部中间subfigure显示了biquad陷波滤波器中心频率为6650赫兹,−3 dB带宽是2300 Hz,削减10.5 dB。subfigure底部显示的频率响应数字ARA均衡器,即前面提到的三个过滤器结合反应。
(一)
(b)
(c)
(d)
图13显示过滤器的群延迟呈现在图12。最顶层subfigure显示一阶巴特沃斯滤波器的群时延,中上subfigure显示峰值滤波器的群时延,中间和底部subfigure显示了陷波滤波器的群时延,和底部subfigure显示了组合滤波器的群时延。
(一)
(b)
(c)
(d)
我们可以看到在图13高通滤波器(上面subfigure)占据了群时延在低频段,而陷波滤波器带来一个额外的0.02毫秒的延迟。峰滤波器的群时延略有负面(−0.06 ms)在低频率。因此,总群延迟较低频率(20 - 1000 Hz)大约是0.35 - -0.02 ms。此外,在更高的频率,高通滤波器的群时延是接近于零,峰值筛选主导。峰值滤波器的群时延大约0.24 ms围绕其中心频率。
6。案例研究
一种DSP评估板,ADAU1761模拟设备(19),提供了一个完整的DSP的开发环境。它包括开发软件和董事会本身,有适当的输入和输出,以及所有其他所需的硬件实现。评估板是一种低功耗立体声音频编解码器集成数字音频处理,支持立体声48 kHz记录和回放。立体adc和dac支持样本率从8 kHz到96千赫。评估板使用SigmaDSP核心功能28-bit处理(56位双精度)。在这项研究中使用的采样率为44100 Hz。
在本节中,ARA系统原型实现基于DSP评估板的模拟设备的描述和测量的延迟特性。梳状滤波效应引起的泄漏处理和声音的结合分析了用户的耳朵。此外,听力考试,进行研究梳状滤波效应,可听到的描述。
6.1。增强现实音频均衡器的实现
DSP编程完成了SigmaStudio图形开发工具。SigmaStudio的扩展库执行音频处理算法,如过滤、动态处理,和混合。因此,它提供了一种简便的方法来实现DSP代码通过一个图形用户界面。
数字版本的均衡器过滤器,在前一节中所讨论的,用Matlab实现了匹配的数字滤波器与模拟的。表中给出的滤波器系数1根据所示biquad IIR滤波器的传递函数(3)。
|
||||||||||||||||||||||||||||||||||||
图14显示了SigmaStudio数字ARA均衡器的实现。从左边开始,第一块是输入块。然后有三个一般过滤块,即高通滤波、峰值,分别和切口。IIR滤波器系数,见表1块,设置相应的过滤器。此外,有一个音量控制微调均衡器最后左边和右边的输出。
图15显示了测量频率响应的数字均衡器(左通道)。测量是由DSP板的输入和输出连接到一个Edirol fa - 101音频接口,通过均衡器(打一个正弦扫描20.]。比较图15图的底部12显示了一个亲密的信件。
6.2。测量
进行了一系列的实验室测量,以评估的适用性ADAU1761 DSP板作为数字ARA均衡器。DSP板的延迟测量为了找出DSP板是否有足够快的广告和DA转换器实时应用程序。此外,造成的延迟数字均衡器的实现是估计。
6.2.1。群时延的DSP板
测量设置包括一个莫土语UltraLite mk3音频接口(21)和FuzzMeasure软件(22]。一个正弦扫描第一次打了莫土语音频接口(输出直接连接到输入),之后通过莫土语的音频接口和DSP板。此外,DSP板有两种配置:一个输入直接连接到输出,和其他的ARA均衡器实现在使用。图16这些测量显示了计算群延迟,莫土语的恒定延迟删除音频接口。因此,测量组内发生的延误表示延迟DSP板。红色曲线描绘了DSP板的情况下,输入直接连接到输出,和蓝色曲线描述的情况有一个实现输入和输出之间的ARA均衡器(见图14)。
我们可以看到在图16,未经群时延均衡器(红色曲线)大约是常数,约0.95 ms。这个结果代表了延迟主要是由广告和DA转换器。结果0.95女士相当好,这可能允许使用ADAU1761 DSP板的实时ARA均衡器。可以预期,均衡器的实现稍微增加了系统的群延迟。众所周知,群时延增加的阻带高通滤波器(< 1 kHz),以及在均衡器峰值(1.5 kHz-4千赫)。诺在群时延均衡器通常会降低,因为在中心频率相位斜率为正的切口(5 kHz-9千赫)。测量表明,提高均衡器的群延迟小于0.4毫秒以下1 kHz和小于0.2毫秒以上1 kHz,如图16。蓝色曲线在图16类似于下面图的一部分吗13,如预期。
6.3。梳状滤波效应
当一个信号被添加到信号的延迟版本本身,它会导致一个梳状滤波效应。ARA的情况下系统的延时pseudoacoustic表示应该是非常小的,因为通过ARA耳机的声音泄露,声音已经通过均衡器(pseudoacoustic表示)总结耳膜。因此,如果推迟pseudoacoustic表示,它可能导致梳状滤波效应。
ARA的梳状滤波效应系统不同于一般的扬声器及其反射情况下,由于泄漏的声音和pseudoacoustic信号可以单独控制,也就是说,当pseudoacoustic信号水平的增加,泄漏的声音是相同的。此外,目标是繁殖环境声音尽可能不变的,这基本上意味着泄露的声音的综合水平和pseudoacoustic环境声听起来应该是一样的。最坏的情况下的梳状滤波效应发生在泄露的声音和pseudoacoustic声音有相同数量的能量。这发生在当耳机衰减是6 dB。
数据的结果13和16表明,实现数字ARA的群时延均衡器低于1.4 ms。数据17和18说明理论梳状滤波效应可能发生的延误1和3女士,女士。subfigure图17说明了粉红噪声的频谱(红色曲线)和粉红噪声的频谱被添加到延迟的版本本身,1毫秒的延迟(黑色曲线)。此外,信号水平是相同的与信号(噪声和延迟噪声)。然而,现实中并非如此。耳机被动隔离外部声音,因此,nondelayed噪音很严重衰减。
(一)
(b)
(一)
(b)
第一等级由梳状滤波效应出现在490赫兹的频率时,延迟1毫秒。图10表明,被动衰减的ARA耳机在500 Hz大约15分贝。因此,subfigure图底部17说明了信号一样subfigure顶部,除了nondelayed噪音衰减前15分贝求和。nondelayed噪音的想法是说明了泄露的声音,经历了被动隔离噪音的耳机和延迟说明了数字均衡器pseudoacoustic表示推迟了。因此,顶部subfigure代表最坏的情况下,两个信号具有相同的能量,也就是说,耳机衰减为6 dB和底部subfigure说明了情况的实际被动衰减ARA耳机。
图18是类似于图17女士,除了延迟是3而不是1毫秒。因此,创建第一个缺口在170赫兹的频率的隔离耳机然后代替15分贝(参见图13分贝10)。从这两个数据可以看到,当噪声衰减的被动隔离ARA耳机在第一个级距频率、梳状滤波效应急剧减少(见底部subfigures)。此外,被动隔离是第一等级以上频率更大的频率,因此,上面的梳状滤波这些频率的影响实际上是微弱甚至比见subfigures底部。
此外,数据19和20.显示冷杉梳状滤波器的频率响应对应的数据17和18。冷杉梳状滤波器的传递函数 在哪里是直接的获得声音(在这种情况下,泄露的声音),是样品的延迟。例如,在图19数字的值和,而底部的数字值(−15分贝),44.1 kHz的采样频率。
(一)
(b)
(一)
(b)
从数据可以看出19和20.耳机的被动衰减时,考虑,梳子过滤效果大大降低。事实上,最深的减毒梳状滤波效应造成的等级是4 dB当延迟1女士和女士5 dB当延迟3。注意,被动的增加衰减越来越频繁的耳机不考虑在这些例子。因此,对高频率梳状滤波效应实际上减少。
6.4。听力考试
前一节的结果暗示梳状滤波效应不应是一个不可逾越的问题由于衰减ARA耳机。众所周知,窄深级出现在频率响应几乎听不清(23]。然而,在频率响应峰值导致着色。因此,一个正式的听力测试是为了进行主观评价的可听到梳子过滤效果。
听力测试进行隔音听阿尔托大学的展位。使用两个不同的测试信号,即男性英语演讲和器乐样本(诺拉·Jones-Don开始不知道为什么)。样品的长度是大约4秒,他们只打一次。加权的声压级(SPL) 60 dB的语音样本和64分贝的音乐样本。7与听力正常参加听力考试科目。一双高质量的森海塞尔参考类HD 650耳机使用。测试用例由样本对,其中包括一个参考样本(原样),修改后的样品。参考样品总是先回放,从听众问的问题是:“是第二个样本的音质与第一次样品一样好吗?”。以随机的顺序呈现不同的测试用例。
修改后的样品是由添加延迟和衰减版本的示例样本本身,导致了梳状滤波效应。使用延迟1、3和5 ms,而衰减是6日14日和20 dB,即九个不同的测试用例/测试信号。此外,一双参考样品是包含在测试中,听众比较参考信号本身。所有听众评估每个样本对两次,除了参考样品,包括三次。参考样本对包括为了确保听众可以正确评估样本。决定每个侦听器应该得到至少两个参考样品对正确的三个为了被认为是一个有效的听众。所有七个听众达到这一标准。
图21听力考试的结果,黑色的条说明了语音样本和白色的条说明了音乐样本。可以看到,语言和音乐信号的结果是大大不同的,延迟没有尽可能多的影响衰减,这是符合布鲁纳等人的结果。24]。因此,可以分为三组的结果基于衰减。20分贝衰减时,几乎没有人可以听到语音样本对之间的任何差异,只有少数的听众听到不同的音乐样本对。衰减时减少到14 dB,听众开始听音色差异和设置为6 dB,衰减时,最坏的情况,所有的侦听器检测到声音质量的退化。
然而,在实际的ARA情况下这样一个简单的对比真正的环境声音和pseudoacoustic表示是极为罕见。ARA的想法是戴上耳机长时间不间断,这允许用户适应小音色差异ARA耳机了。
7所示。结论
本文讨论和评估的数字实现低延迟ARA混合器,它使用IIR调压过滤器。在双耳耳机和麦克风是必需的。ARA系统结合了虚拟或传播声音与周围的声音,耳朵被麦克风,并发挥他们的用户使用耳机。系统可以使用在各种身临其境的增强现实应用程序中,如在双耳语音和音频电话会议。
有人认为本文对实现ARA系统式耳机是有利的,因为它们提供了一个高衰减的声音围绕着用户。此外,耳机的机械阻尼相当于一个低通滤波器,它引入了一个额外的传播延迟。这个额外的延迟ARA系统中非常有用,因为它允许延迟处理的麦克风声音播放之前用户的耳朵。
ARA耳机必须包括一个均衡滤波器,补偿衰减和变化造成的耳音响耳机。三个级联实现ARA IIR滤波器提出了均衡:一阶高通滤波器,二阶顶峰滤波器和二阶陷波滤波器。滤波器系数这些过滤器。造成的整体吞吐量延迟(延迟)三个过滤器大约是0.4毫秒。
ARA系统实时测试使用DSP评估板。这个原型系统进行测量表明,广告和DA转换器和其他电子产品的DSP板带来的总延迟约0.95 ms。当该数字均衡滤波器处理链中插入,延迟是保持低于1.4 ms Hz-1 100 kHz的频率范围和1 kHz以上频率低于1.2 ms。
进行听力考试学习的可听到梳状滤波效应,引起的泄漏直接通过耳机声音结合处理声音总是延迟。发现造成的颜色梳状滤波听不清在语音信号测试延迟20分贝衰减时,但可以在一些声音在一个音乐信号延迟值。预计的颜色不太令人不安的在实际情况下,当用户只听到的组合处理对自然声音和泄露的声音但直接比较是不寻常的。
未来的工作包括一个均衡滤波器的设计减少造成的颜色组合的泄露和声音处理用户的耳朵。
承认
作者要感谢博士Miikka Tikander宝贵意见和朱利安·帕克先生为他的帮助校对。
引用
- a . Harma j . Jakka m . Tikander et al .,“现实增强音频为移动和可穿戴设备。”音频工程协会杂志》上,52卷,不。6,618 - 639年,2004页。视图:谷歌学术搜索
- r·w·林德曼、h·诺玛和p·g . De Barros”听到增强现实的实证研究:利用骨传导交付予音频”学报IEEE虚拟现实(VR ' 08)美国内华达州,页35-42,雷诺,2008年3月。视图:出版商的网站|谷歌学术搜索
- d . Brungart a . Kordik c . o和b·辛普森“麦克风位置对定位精度的影响与电子传递耳塞,”IEEE学报》研讨会上的应用信号处理音频和声学(WASPAA ' 03)2003年10月,新帕,纽约,美国。视图:谷歌学术搜索
- 诉Riikonen、m . Tikander和m . Karjalainen“现实增强音频混合器和均衡器,”学报AES 124公约阿姆斯特丹,荷兰,2008年5月。视图:谷歌学术搜索
- m . Tikander“可用性问题与现实增强音频耳机听自然的声音,“音频工程协会杂志》上卷,57号6,430 - 441年,2009页。视图:谷歌学术搜索
- a . Harma j . Jakka m . Tikander et al .,“可穿戴的增强现实的技术和应用音频,”学报AES 114公约2003年3月,阿姆斯特丹,荷兰,。视图:谷歌学术搜索
- t . Lokki h . Nironen s Vesa l . Savioja a . Harma和m . Karjalainen“可穿戴的应用场景和移动增强现实音频”学报AES 116公约柏林,德国,2004年5月。视图:谷歌学术搜索
- m . Tikander m . Karjalainen诉Riikonen,“现实增强音频耳机,”学报》第11届国际会议上数字音频效果(DAFx ' 08)埃斯波,芬兰,2008年9月。视图:谷歌学术搜索
- j·雷默和诉Valimaki信号处理框架虚拟耳机听力测试在一个嘈杂的环境中,”学报AES 132公约2012年4月,布达佩斯,匈牙利,。视图:谷歌学术搜索
- m . Tikander”建模的衰减loosely-fit插入耳机音频增强现实,”AES 30日学报》国际会议,旅馆,芬兰,2007年3月。视图:谷歌学术搜索
- c . a . Poldy“耳机”扬声器和耳机手册,j . Borwick Ed,页585 - 692,焦出版社,纽约,纽约,美国第3版,1994年版。视图:谷歌学术搜索
- p . Titchener”,自适应滤波器audio-an与应用实例,概述”美国AES 93公约1992年10月,旧金山,加州,美国。视图:谷歌学术搜索
- d·韦塞尔和m·莱特”问题和前景亲密音乐控制电脑,”电脑音乐杂志,26卷,不。时间为3页。月11日至22日,2002年。视图:出版商的网站|谷歌学术搜索
- m .故事,“音频模拟-数字转换器”,音频工程协会杂志》上,52卷,不。3、145 - 158年,2004页。视图:谷歌学术搜索
- b·贝克“Analogue-to-digital转换:基本的ADC延迟,”EE次印度,2009年。视图:谷歌学术搜索
- m·柯恩“高速数据转换”,Burr-Brown,1991年。视图:谷歌学术搜索
- j·o·史密斯,介绍数字滤波器与音频应用程序,W3K出版,2007年。
- b . Rafaely“有源噪声减少headset-an概述,”《噪声控制工程国际会议和展览2001年8月,海牙,荷兰,。视图:谷歌学术搜索
- ADAU1761数据表转速C,2010年模拟装置。
- 答:淀粉”,同时测量的脉冲响应和变形swept-sine技术,”学报AES 108公约2000年2月,巴黎,法国,。视图:谷歌学术搜索
- UltraLite-mk3混合用户指南,2010年莫土语。
- FuzzMeasure Pro 3.2用户指南,2010年SuperMegaUltraGroovy。
- r . Buecklein“违规行为,可听到的频率响应”音频工程协会杂志》上卷,29号3、126 - 131年,1981页。视图:谷歌学术搜索
- 美国布鲁纳,周宏儒。Maempel,而温齐尔,“梳齿形滤波器可听到的扭曲”学报AES 122公约维也纳,奥地利,2007年5月。视图:谷歌学术搜索
版权
版权©2012 Jussi雷默和Vesa Valimaki。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。