国际数字多媒体广播杂志/2020/文章/标签1

研究文章

基于卷积神经网络的弱音调偏移语音识别

表1

网络的结构和参数。

不。 内核大小/神经元数 的进步 输入通道 参数

1 卷积1 (5,5) (1,1) 1 1664
2 卷积2 (5,5) (1,1) 64 102464
3. 池1 (2, 2) (2, 2) 64 - - - - - -
4 脑回的3 (5,5) (1,1) 64 102464
5 脑回的4 (5,5) (1,1) 64 102464
6 池2 (2, 2) (2, 2) 64 - - - - - -
7 卷积5 (5,5) (1,1) 64 102464
8 卷积6 (5,5) (1,1) 64 102464
9 池3 (2, 2) (2, 2) 64 - - - - - -
10 2496 - - - - - - - - - - - - - - - - - -
11 完全连接 4096 - - - - - - - - - - - - 1.02 107∗
12 Softmax 1 - - - - - - - - - - - - 4096∗

1 具体取决于类的数量。

年度文章奖:由主编评选的2020年杰出研究贡献。阅读获奖文章