研究文章

使用形态学数据为塞尔维亚大词汇量语音识别语言建模

表3

文本数据库概述。

主体部分 #的句子 #字 #字符

新闻 737 k 17米 94米
文学 303 k 3.9米 18米
科学 23 k 503 k 3米
行政 15 k 378 k 2米
Popular-scientific 18 k 357 k 2米
会话 38 k 128 k 530 k
音标 251 k 3.2米 15米

1.4米 26米 135米
“开发” 20 k 470 k 2.6米