研究文章

基于多尺度自适应方法扩张卷积网络双耳语音源定位

表3

定位精度(%)的不同的方法在噪声和混响的场景。

RT60/ DRR - - - - - - 0.1 s /−1.44 dB 0.3 s /−2.02 dB 0.5 s /−2.58 dB
噪声和信噪比 Avg。 - / - 白色/ 15分贝 - / - 白色/ 15分贝 - / - 白色/ 15分贝

延时(8] 28.87 43.24 24.46 33.42 24.19 23.84 24.05
款(19] 67.69 92.14 78.11 74.94 53.51 63.81 43.65
常规的美国有线电视新闻网 61.40 85.26 79.73 58.23 52.16 49.40 43.65
Dilation-2 CNN 57.69 77.15 75.41 56.02 50.14 43.74 43.65
Dilation-5 CNN 84.03 94.59 89.46 92.14 75.95 86.62 65.41
级联DCNN 73.16 91.15 77.84 84.52 56.62 79.25 49.59
我们的 78.86 93.12 87.97 83.78 71.08 76.50 60.68
我们的 83.48 94.59 89.05 90.66 77.70 85.08 63.81