研究文章

实时预测冠状病毒大流行使用机器学习和大数据流系统

表4

LR模型的性能。

特征提取方法 矩阵的大小 测试性能 交叉验证性能
精度 精度 回忆 F1-score 精度 精度 回忆 F1-score

Unigram 1000年 80.82 81.22 80.82 80.38 84.54±0.4 85.53±0.48 84.54±0.4 84.16±0.43
3000年 82.94 83.01 82.94 82.61 89.22±0.4 89.36±0.42 89.22±0.4 89.08±0.41
三元 1000年 80.8 81.33 80.8 80.33 83.98±0.31 85.11±0.35 83.98±0.31 83.56±0.32
3000年 82.32 82.84 82.32 81.84 88.52±0.38 88.86±0.43 88.52±0.38 88.31±0.39
1000年 80.56 81.08 80.56 80.09 83.92±0.32 85.04±0.39 83.92±0.32 83.5±0.33
3000年 82.32 82.84 82.32 81.84 88.52±0.38 88.86±0.43 88.52±0.38 88.31±0.39
Four-gram 1000年 80.32 80.87 80.32 79.85 83.47±0.31 84.69±0.33 83.47±0.31 83.05±0.33
3000年 82.32 82.35 82.32 82.01 88.36±0.43 88.55±0.46 88.36±0.43 88.18±0.44