研究文章
生物医学文本分类基于整体造型修剪和优化的主题
表9
的macro-averaged F-measure结果通过传统算法和该diversity-based合奏修剪(LDA(基于k = 50)表示)。
|
| 分类算法 |
oh5 |
oh10 |
oh15 |
ohscal |
ohsumed |
|
| 注 |
0.76 |
0.68 |
0.72 |
0.61 |
0.30 |
| 支持向量机 |
0.78 |
0.81 |
0.86 |
0.73 |
0.35 |
| 装袋+注 |
0.77 |
0.70 |
0.72 |
0.61 |
0.30 |
| 装袋+支持向量机 |
0.85 |
0.78 |
0.81 |
0.73 |
0.37 |
| 演算法+注 |
0.74 |
0.69 |
0.72 |
0.61 |
0.31 |
| 演算法+支持向量机 |
0.85 |
0.78 |
0.80 |
0.74 |
0.36 |
| RandomSubspace +注 |
0.76 |
0.68 |
0.70 |
0.59 |
0.29 |
| RandomSubspace +支持向量机 |
0.79 |
0.71 |
0.73 |
0.69 |
0.33 |
| 叠加 |
0.84 |
0.80 |
0.81 |
0.72 |
0.38 |
| ESM |
0.80 |
0.81 |
0.81 |
0.74 |
0.39 |
| 东德(BES) |
0.81 |
0.82 |
0.83 |
0.75 |
0.41 |
| LibD3C |
0.84 |
0.85 |
0.86 |
0.76 |
0.42 |
| 清洁发展机制 |
0.86 |
0.86 |
0.87 |
0.78 |
0.45 |
| 部(遗传聚类) |
0.82 |
0.84 |
0.86 |
0.76 |
0.45 |
| DEP (PSO聚类 |
0.82 |
0.83 |
0.85 |
0.75 |
0.47 |
| 部(萤火虫集群) |
0.87 |
0.88 |
0.88 |
0.79 |
0.49 |
| 部(杜鹃集群) |
0.86 |
0.85 |
0.88 |
0.78 |
0.47 |
| 部(蝙蝠集群) |
0.85 |
0.86 |
0.84 |
0.74 |
0.45 |
|
|
|
注:朴素贝叶斯算法,支持向量机:支持向量机,ESM:系综选择从模型库,喜神贝斯:装袋合奏选择,LibD3C:混合合奏修剪基于k - means和动态选择,清洁发展机制:基于多样性的措施相结合,整体修剪和DEP:提出diversity-based合奏修剪。
|