研究文章

多任务学习藏语语音识别与当地的关注

表4

演讲者ID识别两个任务模型的精度(%)。

体系结构 模型 Lhasa-U-Tsang Changdu-Kham 安多田园

SpeakerID模型 67.75 93.13 95.31
WaveNet-CTC议长ID S-S1 68.32 92.85 97.48
S-S2 71.15 95.23 96.12

(5)-WaveNet-CTC关注 S-S1 0 0 0
S-S2 60.64 77.38 85.85

WaveNet-Attention (5) ctc S-S1 70.35 92.85 97.48
S-S2 69.40 One hundred. 96.70