研究文章

多任务学习藏语语音识别与当地的关注

表6

方言ID识别three-task模型的精度(%)。

体系结构 模型 Lhasa-U-Tsang Changdu-Kham 安多田园

DialectID模型 97.88 92.24 97.9

与方言WaveNet-CTC ID和议长ID D-S-S1 98.01 98.8 99.41
D-S-S2 99.73 96.42 99.61
S-D-S 99.25 95.23 99.03

(5)-WaveNet-CTC关注 S-D-S One hundred. 76.19 91.27
D-S-S1 One hundred. 90.47 94.18
D-S-S2 One hundred. 82.14 93.02

WaveNet-Attention (5) ctc S-D-S One hundred. 89.28 93.79
D-S-S1 One hundred. 85.71 93.79
D-S-S2 One hundred. 95.23 94.18

WaveNet-Attention (7) ctc S-D-S 0 85.71 91.66
D-S-S1 0 89.98 93.88
D-S-S2 0 89.28 95.34

WaveNet-Attention ctc (10) S-D-S 0 85.71 95.54
D-S-S1 0 94.04 93.99
D-S-S2 0 0 0