文摘

小光圈麦克风阵列为便携式设备提供许多优势和助听器设备。本文提出了一种基于子空间的定位方法对声学源使用小光圈数组。分析了阵列孔径对定位的影响通过使用阵列响应(阵列流形)。除了阵列孔径,声波的频率源和信号的方差电力模拟演示如何优化定位性能,这是由引入频率误差的方法。5毫米阵列孔径的方法是通过模拟和实验验证与MEMS麦克风阵列。不同类型的声音源可以局部精度最高的6度甚至在风噪声和其他噪声的存在。此外,该方法与其他方法相比,减少了计算复杂度。

1。介绍

基于麦克风阵列的声源定位是广泛应用于许多应用程序场景。然而,一个大阵列孔径可能大大限制其应用。近年来,由于微机电系统(MEMS)技术的发展,小孔径阵列显示其潜在优势为便携式应用程序。麦克风阵列的助听器(1,视频会议2),和机器人听觉(3,4)通常用于小型办公室或桌面应用程序和与此同时需要高机动设备在车辆定位(5和射击定位6在战场上。因此,小孔径阵列得到了高度的关注。

一般来说,使用麦克风阵列声源定位是通过从不同的麦克风接收到的信号差异。两个方面的差异是振幅变化和相位差。

振幅变化的方面,关于阵列孔径,相关的解决球面波模型和平面波模型的信号7,8]。大中型光圈下,声源距离的球面波模型应用于高性能的麦克风阵列到达方向(DOA)估计(9,10]。然而,平面波模型可以应用于小孔径阵列为了简化,而不是限制DOA估计的准确性。

相位差的方面形式的本质定位使用空间信息(11]。声源定位方法通常可以分为三类基于计算复杂度:基于时间延迟的方法(12- - - - - -14),基于子空间的方法和参数方法(15- - - - - -17]。到达时差(辐射源脉冲)基于时间延迟的方法获得的相位差异的麦克风(18];很容易计算出目标辐射源如果延迟小于采样周期。在[19,20.),提出了几种基于自适应过滤时间延迟方法比较议长本地化使用小孔阵列的性能。然而,当阵列孔径很小,基于时间延迟的方法往往具有较高的采样率,加剧硬件系统的负担(21)和定位估计的准确性取决于系统的采样率。该方法在本文中是独立的采样率,只要Nyquist-Shannon抽样法是满意。参数方法,高计算成本(10),因此不适合实时处理,而基于子空间的方法,如多重信号分类(音乐)22音乐(),根23),和ESPRIT算法(24)计算精度高的吸引力。基于子空间的方法,研究人员专注于声学源或新的聚焦矩阵的模型宽带信号。然而,对小孔径阵列,积极影响基于子空间的方法应该被应用到提高DOA估计的准确性和减少处理的复杂性。参数对定位性能应该研究应用场景的准确性和通用性的目的。

本文提出了一种基于低复杂度的子空间方法对小孔径麦克风阵列采用紧凑的平面模型。阵列孔径、频率和源讨论作为参数的方差与定位性能。小光圈下,该方法降低了计算复杂度,以及实现高精度一般场景。

本文的其余部分组织如下。节2,阐述了该方法。节3,定位性能和计算复杂度比较与其他代表声音源定位方法。理论上该方法的性能评价与模拟声学参数的信号。实验与MEMS麦克风阵列节中给出4和结论提出了部分5

2。基于子空间的定位方法使用小光圈数组

我们首先建立在本文中使用的符号。(1)粗体文本表示向量。(2)的上标 表示矩阵的复共轭。(3) 频域表示, (4) 接收到的信号功率作为频率的函数(25]。(5) 麦克风的数量在数组中。(6) 是声音来源的数量。(7) 表示信号带宽。(8) 是数组的光圈。

2.1。音乐的算法

音乐算法是一个著名的基于子空间的方法。一般来说,声音来源的DOA估计可以通过使用飞机模型在小孔径阵列(8,9]。

信号 在每个传感器是由收到 在哪里 信号源, 是高斯白噪声, 是描述的阵列流形的区别同一信号在不同的传感器获得的时间延迟造成的空间多样性。协方差矩阵是由 在哪里 矩阵的特征向量。特征向量可以分割成两个子空间,信号子空间和噪声子空间,我们有 在哪里 是一个 矩阵的列 噪声特征向量。

阵列流形(即。的列 )和噪声特征向量 相互正交的(22]。两个子空间之间的距离由音乐谱定义如下: 在哪里 展品峰值附近的真正的DOA。

2.2。建议使用小孔径阵列定位法

音乐的算法是基于阵列流形和噪声特征向量 是互相正交。宽带声源关注音乐算法的阵列流形的变化随着频率的变化,因此要么单独计算所有频率(非相干信号方法,ISM)或找到一个聚焦矩阵和变换频率的一个(相干信号方法(CSM))。然而,这两种方法将极大地增加了计算负担,因此,他们不适合某些便携式实时应用程序,而电力供应是有限的。

阵列流形的变化随着频率的变化,而阵列孔径的减小将使阵列流形的变化小。换句话说,频率色散引起的误差下降阵列孔径变得越来越小。下面的近似误差的阵列流形派生的阵列孔径和其他参数。在这篇文章中, 被认为是固定的吗 而不是从 ,形成了我们的方法的主要误差源。阵列流形的变化随着频率的变化,而阵列孔径的减小将使阵列流形的变化小。换句话说,频率色散引起的误差下降阵列孔径变得越来越小。下面的近似误差的阵列流形派生的阵列孔径和其他参数。

根据(3),然后 参考点是第一个传感器在图1;然后 通过应用误差传递函数的变量 (26,27),然后 的方差 表示为 在哪里 接收到的信号功率作为频率的函数(25]。

对阵列孔径的定义 ,任何两个传感器之间的最大距离,因此

请注意,(13)允许误差引起的阵列流形假设(10)与阵列孔径有关 。因此当阵列孔径足够小,阵列流形的变化引起的频率变化可以忽略不计,允许我们简化定位法。对(11),作为阵列流形的基础,DOA估计的精度有关 。作为 不同的平面上,阵列流形也变化。寻求 找到噪声特征向量正交阵列流形向量与我们的方法的性能。商的第一部分和第二部分(11)被定义为错误比率(ER)。第一部分表示误差固定的假设 ,第二部分代表的表现方法。当 越小,该方法将会更加有效。

因此,

它可以从(14),相对较小 和更大的 , 将会减少,这使得估计更准确。

因此,该方法主要集中在两个方面:一是简化不同频率的阵列流形单一频率 高,另一个是选择有用的乐队声信号根据先验知识的来源,从而提高准确性。对于一个给定的数组 麦克风,整体定位法是现在提出了一个循序渐进的格式。

步骤1。收集 小孔径阵列数据的快照 传感器。

步骤2。副带宽声学源和环境限制加工带宽相对更高的带宽 ;计算信号的傅里叶变换不同的麦克风

步骤3。构建 协方差矩阵根据 使用(4)。

步骤4。估计 最小方差的声学源谱如下: 如果 不给,

第5步。计算 从(3),

步骤6。分离源位置pseudospectrum的最大值 中定义的(7)。

3所示。分析和仿真

3.1。理论分析阵列孔径和其他因素

传统上,声如车辆,音乐,和人类说话被视为宽带资源。声波定位的方法包括ISM和CSM。其中,SSA、RSS和TCT代表方法。TCT有最好的表现。TCT的基本思想是集中。然而,这将大大提高计算。不是重点,我们选择一个合适的近似 没有关注的一些性能的本地化成本计算的复杂性。

3.1.1。聚焦频率的选择

关于简单的均匀分布, 一个合理的近似 (28,29日]。关于其他分布的近似, 是近似误差。当 ,误差最小30.,31日]: 根据(17), 在没有先验知识 , 将是一个妥协的选择。

3.1.2。其他因素的讨论

本文算法的本质是,当阵列的孔径很小,声信号带宽有限可能被视为窄带信号或近似的窄带信号。然而,并没有显式定义阵列信号的窄带信号。下面列出的三个表达式显示一些窄带阵列信号的特点是被广泛接受的32]:(我) ;(2) ;(3)如果一个信号的带宽是第二个免费信号的噪声协方差矩阵的特征值大于噪声电平信号加噪声协方差矩阵,然后,可能不会被描述为窄带信号(25]。

第一个表达式是窄带信号的基本理解。第二个表达式描述了阵列信号的窄带信号。第三个定义是更为复杂。窄带信号的定义是一个函数的带宽,AOA,信噪比、阵列增益,和维度的数组。

3定义得出的结论是一致的部分2.2,较小的光圈 ,更高的信号频率 ,和较小的带宽 信号是窄的。在这种情况下,定位误差引起的频率误差更小,这样我们的方法更有效。为本地化改进性能,我们可以使用一个带通滤波器的信号并利用信号的相对较高的区间;毕竟,当阵列孔径很小,声源定位的误差可以控制。

3.2。模拟

与其他方法相比在这部分执行。和DOA的误差引起的频率与孔径误差 、信号频率 方差,和信号功率 也将模拟。

3.2.1之上。与其他算法比较

比较我们的方法与TCT (CSM) [30.RSS (CSM) [],30.RSS (CSM) [],33],SSA (ISM) [34),和RMSE语音方法和计算复杂性。

考虑一个源影响着数组从108.5度。均匀圆阵列的孔径是1/3和1/6的中心频率的波长。的带宽信号中心频率的20%。RMSE被定义为 根据500年蒙特卡洛实验。在图2TCT和RSS的RMSE方法小。我们的方法几乎相同的性能SSA方法和性能比语音方法小得多。当信噪比大于10 dB,所有基于子空间方法的RMSE几乎是相同的。比较数据2(一个)2 (b),当数组的孔径越小,性能更接近的方法。

计算复杂度比较表1。1024年快照的信号,采样率为8192 Hz,源是108.5度,和数组是一个均匀圆阵列半径为0.02米。执行所有的方法在Matlab环境2008个人电脑(双核心、2.9 GHz-frequency处理器、2 GB内存)。时间流逝如表所示1

如表所示1计算显示,一个数量级小于其他TCT, RSS和SSA。该算法也适用于ADSP21375处理器,75 MHz时钟,1024信号的快照,采样率为8192 Hz。DSP系统可以工作的DOA声学与DOA源实时误差小于6度。每1024个快照的计算过程不超过0.05秒。

方法的性能并不比ISM和CSM在小光圈。然而,计算复杂度远低于ISM和CSM。

3.2.2。光圈

节中讨论2.2频率误差将导致多方面的错误。然而,与阵列孔径的减小,误差会更小。我们关注的频率误差定义为之间的区别 在仿真方法和使用 中定义的步骤4

模拟信号是宽带信号带宽从200到1000赫兹。真正的DOA是108.5度。数组是一个均匀圆阵列。表2显示了错误频率边界被定义为频率误差估计DOA的区别和真正的DOA是首次超过10度。

如表所示2当阵列孔径小于0.05米,错误频率边界将大于2000赫兹。这意味着如果我们限制输入信号在一定带宽的模拟或数字意味着,DOA误差引起的频率误差可以控制。在这种情况下,没有必要信号的先验知识,可以拓宽我们的方法的使用。图3显示了频率误差之间的关系( 设在)、阵列孔径( 设在)和DOA错误( 设在)。在相同的光圈,DOA误差随着频率误差增加。在同一频率误差、DOA误差减少死亡的孔径大小。

3.2.3。信号的频率

节中我们得出结论2.2随着信号频率的增加,DOA误差引起的频率误差将会减少。仿真完成如下。阵列孔径是0.02米;信号的带宽是400赫兹。信号的频率带宽的中心。图4显示了频率误差之间的关系( 设在),信号频率( 设在)和DOA错误( 设在)。在同一频率误差、DOA误差与信号频率的增加减少。该算法用于DOA估计通过选择频率误差从0到1000 Hz走2赫兹。DOA的RMSE图所示5。RMSE减少随着信号频率的增加。

3.2.4。信号的频率的方差

提出了在部分2.2,因为 是减少,误差引起的频率误差降低。两个信号 生成,如图是谁的权力6(一)。数组是均匀圆阵列;真正的DOA的信号是108.5度。显然,信号的方差1大于信号2。

如图6 (b)的DOA估计 比这更准确的 在同一频率误差,支持我们的推导。

3.3。小孔径阵列的负面影响

我们的方法是基于小阵列孔径可以降低歧管误差引起的频率误差。然而,一些负面影响的小孔径应该提到。

3.3.1。高放大电路的一致性

在真正的麦克风阵列系统中,放大电路的差异不可避免,将导致振幅误差和相位差异不同的数组元素,这将影响到阵列流形。

基于Nyquist-Shannon抽样定理 和空间采样定理表示如下(35]: 在哪里 的最小距离是两个数组元素和吗 的最短波长信号。就像在时域,更高的空间采样率意味着更多的信息保存,但它会花费更多留在了系统设计。 将会导致一个混叠效应被Nyquist-Shannon抽样定理。当数组大小不是有限的, 总是选择阵列孔径。这是因为随着易行的孔径大小的增加,放大电路引入的相位差的宽容是增加。

在图的DOA错误7是由于1度的相位差放大电路引入的。信号的带宽是400赫兹;乐队的中心是500赫兹。数组是一个均匀圆阵列。图7表明,阵列孔径尺寸的增加,DOA错误减少。

换句话说,为了达到高精度、小孔径阵列必须高度一致的放大电路。

3.3.2。低分辨率

另一个问题引起的空间采样率高(小阵列孔径)决议,至于多个信号,它是更难分离密集信号。当数组大小不是有限的, 总是选为阵列孔径达到更高的分辨率。然而,该算法仍然适用于单一的信号。

8(一个)显示了两个信号的音乐光谱从50度和60度,通过使用一个和4个元素均匀线性阵列。 是信号的波长。每两个元素之间的距离 , , 。图8 (b)显示了一个信号的音乐光谱从60度,通过使用一个统一的线性阵列与4种元素。

尽管小孔径的分辨率低于大光圈,我们的方法仍然是能够区分多个信号。它适用于单一的信号。

4所示。实验与MEMS麦克风阵列

几个实验是由真正的麦克风阵列在这一节中。MEMS麦克风是选为传感器,确保阵列孔径足够小。MEMS麦克风下面的包装尺寸是3.35×2.5×0.88毫米。

4.1。验证的方法使用不同的数组

本地化的数组是正确设计后,提出了六个数组来验证该算法具有不同的形状。表3和图9列出所有。

一个转盘设计测试DOA的变化。这是由步进电机驱动由单片机控制恒定转速的25.71度/ s。声学源是一个著名的中国民歌茉莉花(Molihua)扮演的钢琴。阵列系统的采样率为8192 Hz,乐队仅限于200 - 2000赫兹,和 是800赫兹。实验是在一个安静的房间和源进行固定数组0度到2米的距离。

如图10,当转盘的速度是恒定的,估计DOA随时间线性变化。斜率意味着转盘的速度。拦截是偏离真正的DOA转盘开始旋转时,和偏差可以用来正确估计DOA。遵循线性相关系数描述结果法律意义1 100%。标准偏差是指DOA错误。如表所示4相比,之间的结果数组1号,2号,3号,4号,5号,错误和拦截与减少阵列孔径增加。这是因为不一致的放大电路。就像前面提到的3.3.1放大电路的一致性,对小孔径阵列尤为重要。

在比较数组1号、4号和2号,5号,大量的传感器导致更好的DOA估计,因为前者获得更多的信息。然而,数组6号不能本地化,因为为了最小化一个等边三角形的光圈,音孔被安排作为一个等边三角形,但MEMS麦克风阵列不等边三角形。MEMS麦克风的位置,声音可能不是精确的声音入口,数组不等边三角形的形状,从而导致阵列流形的不确定性和无效的DOA估计。然而,数字3的结果表明,我们的方法可以工作在非常小的孔径为5毫米。

4.2。验证的方法使用不同的声音来源

应用该方法的定位移动车辆使用0.04麦克风阵列(数组1号)将在这一部分阐述了。实验进行了一个水泥路上与风小雨后水平从0到2在2012年11月,在中国浙江省,在一个岛上。 是汽车的垂直距离从数组中,然后呢 汽车的速度。车辆的速度可以认为是均匀的。汽车运行时从左到右(图11);然后

四种典型的类型的车辆用于本地化:电动自行车,三轮车,一辆汽车和一辆卡车。他们的信号(A)在图上所示12和信号功率谱振幅在序列(B)所示。一个非线性的适应函数方程进行DOA (23)。估计DOAs的四个汽车(C)在图中所示12

考虑道路的宽度,司机开车在右边, 是3 m驾驶车辆时从左向右; 是5米从另一侧驾驶车辆时。DOA的不同车辆的结果如表所示5

代表声源距离的相对速度。剩余均方DOA估计误差,这是一个非线性的DOA的标准。相关系数是一个参数来描述数据如何(23100%)与1意义。DOA的不同车辆的结果如表所示5

根据我们的初始参数分析部分3.2,声定位的性能估计与信号频率和信噪比的声信号。四种类型的车辆由不同组合的信号频率和信噪比。频率谱的四个工具(B)在图上所示12(一个),12 (b),12 (c),12 (d)和车辆的速度相关36]。排序的车辆由光谱频率降序排列,顺序如下:汽车,卡车,电动自行车和三轮车。排序的车辆信噪比的降序排列,顺序如下:卡车,三轮车,车,电动自行车。车辆的频率谱有显著影响定位估计的性能。最高的频谱和第三最高的信噪比,汽车显示最佳的定位性能,紧随其后的是卡车,排名第二高的频率和信噪比最高。考虑到这一事实的频率谱电动自行车和三轮车几乎是相同的,尽管他们在信噪比是不同的,表演几乎是一样的。

在应用程序场景考虑在本部分中,该方法已经应用于200多个实验为20多个类型的车辆。的最大DOA估计误差不大于6°。结果显示在这一节和计算复杂度与其他方法进行比较3.3一方面,该方法很好定位精度;另一方面,该方法适用于实时处理可移植的应用程序。

5。结论

在本文中,一个声音源定位方法提出了使用小光圈数组。该方法可用于实时处理系统,如车辆定位和视频会议由于低计算复杂度。该算法是小光圈、阵列响应遵循一个平面波传播模型和放大电路的一致性是非常重要的,这是普通数组的讨论往往被忽视。DOA估计的准确性可以改善利用源相对更高的乐队和封闭一定频带的信号。仿真和实验表明,该方法可以有效地定位不同声来源和较低的计算复杂性与现有的方法相比。

利益冲突

作者宣称没有利益冲突有关的出版。

确认

作者要感谢副主编和匿名评论者的宝贵的意见和建议来改善。这项工作已经由基金支持9140 c18020211zk34。