复杂性

研究文章

多任务学习藏语语音识别与当地的关注

表4

演讲者ID识别两个任务模型的精度(%)。


体系结构	模型	Lhasa-U-Tsang	Changdu-Kham	安多田园

SpeakerID模型		67.75	93.13	95.31
WaveNet-CTC议长ID	S-S1	68.32	92.85	97.48
WaveNet-CTC议长ID	S-S2	71.15	95.23	96.12

(5)-WaveNet-CTC关注	S-S1	0	0	0
(5)-WaveNet-CTC关注	S-S2	60.64	77.38	85.85

WaveNet-Attention (5) ctc	S-S1	70.35	92.85	97.48
WaveNet-Attention (5) ctc	S-S2	69.40	One hundred.	96.70