研究文章

使用形态学数据为塞尔维亚大词汇量语音识别语言建模

表7

列出一些最频繁的单词错误的类型,以#出现(3-gram LM)。

替换没有POS 替换与POS 插入没有POS 插入与POS 删除没有POS 删除与POS

我⟶我(88) 我⟶我(79) 我(271) 我(242) 我(769) 我(742)
我⟶我(61) 我⟶我(50) 我(260) 我(235) 我(713) 我(669)
工业区⟶我(48) 工业区⟶我(39) u (112) u (88) u (332) u (302)
reko⟶rekao (42) koji⟶koju (36) 达(87) 达(85) 达(215) 达(204)
koji⟶koju (40) reko⟶rekao (32) (69) (54) (129) (130)
koja⟶巨济(39) sa⟶年代(29) na (54) na (37) 在(121) 在(114)
koju⟶巨济(37) se⟶su (28) 阿宝(31) (25) na (99) na (82)
sa⟶s (33) 我⟶oni (27) o (28) se (24) (76) (75)
nači⟶znači (31) koji⟶巨济(25) ne (25) o (22) 晶澳(75) 晶澳(63)
se⟶su (31) nači⟶znači (25) se (25) pa (19) od (63) se (60)
我⟶巨济(30) koja⟶巨济(24) (23) od (17) ne (62) od (56)
你⟶(28) mi⟶我(23) - - - - - - - - - - - - se (61) mi (54)
- - - - - - - - - - - - (11) ne (14) - - - - - - - - - - - -
kada⟶科安达(22) kada⟶科安达(19) kaže (10) (11) joj (29) 山姆(29)
国际海事组织⟶imao (19) 国际海事组织⟶imao (18) 巨济(10) kaže (10) 山姆(28) koji (25)
bilo⟶bila (19) bila⟶bilo (18) koji (10) 蛋(9) koji (25) joj (23)