研究文章
使用形态学数据为塞尔维亚大词汇量语音识别语言建模
表7
列出一些最频繁的单词错误的类型,以#出现(3-gram LM)。
|
| 替换没有POS |
替换与POS |
插入没有POS |
插入与POS |
删除没有POS |
删除与POS |
|
| 我⟶我(88) |
我⟶我(79) |
我(271) |
我(242) |
我(769) |
我(742) |
| 我⟶我(61) |
我⟶我(50) |
我(260) |
我(235) |
我(713) |
我(669) |
| 工业区⟶我(48) |
工业区⟶我(39) |
u (112) |
u (88) |
u (332) |
u (302) |
| reko⟶rekao (42) |
koji⟶koju (36) |
达(87) |
达(85) |
达(215) |
达(204) |
| koji⟶koju (40) |
reko⟶rekao (32) |
(69) |
(54) |
(129) |
(130) |
| koja⟶巨济(39) |
sa⟶年代(29) |
na (54) |
na (37) |
在(121) |
在(114) |
| koju⟶巨济(37) |
se⟶su (28) |
阿宝(31) |
(25) |
na (99) |
na (82) |
| sa⟶s (33) |
我⟶oni (27) |
o (28) |
se (24) |
(76) |
(75) |
| nači⟶znači (31) |
koji⟶巨济(25) |
ne (25) |
o (22) |
晶澳(75) |
晶澳(63) |
| se⟶su (31) |
nači⟶znači (25) |
se (25) |
pa (19) |
od (63) |
se (60) |
| 我⟶巨济(30) |
koja⟶巨济(24) |
(23) |
od (17) |
ne (62) |
od (56) |
| 你⟶(28) |
mi⟶我(23) |
- - - - - - |
- - - - - - |
se (61) |
mi (54) |
| - - - - - - |
- - - - - - |
(11) |
ne (14) |
- - - - - - |
- - - - - - |
| kada⟶科安达(22) |
kada⟶科安达(19) |
kaže (10) |
(11) |
joj (29) |
山姆(29) |
| 国际海事组织⟶imao (19) |
国际海事组织⟶imao (18) |
巨济(10) |
kaže (10) |
山姆(28) |
koji (25) |
| bilo⟶bila (19) |
bila⟶bilo (18) |
koji (10) |
蛋(9) |
koji (25) |
joj (23) |
|
|