研究文章

生物医学文本分类基于整体造型修剪和优化的主题

表8

的macro-averaged F-measure结果与不同LDA-based配置。

朴素贝叶斯(NB) 支持向量机(SVM)

配置 oh5 oh10 oh15 ohscal Ohsu-med oh5 oh10 oh15 ohscal Ohsu-med

LDA (k = 50) 0.75 0.68 0.71 0.61 0.30 0.77 0.80 0.85 0.73 0.36
LDA (k = 100) 0.72 0.65 0.69 0.62 0.31 0.79 0.80 0.85 0.75 0.40
LDA (k = 150) 0.70 0.67 0.67 0.61 0.31 0.77 0.81 0.86 0.76 0.43
LDA (k = 200) 0.67 0.65 0.65 0.61 0.29 0.78 0.80 0.86 0.76 0.44
GA-LDA (BIC) 0.76 0.69 0.76 0.74 0.37 0.79 0.70 0.77 0.76 0.37
PSO-LDA (BIC) 0.76 0.70 0.78 0.75 0.37 0.79 0.74 0.77 0.78 0.38
FA-LDA (BIC) 0.76 0.73 0.79 0.75 0.37 0.80 0.76 0.78 0.79 0.39
CSA-LDA (BIC) 0.77 0.73 0.80 0.75 0.37 0.80 0.78 0.80 0.79 0.40
BA-LDA (BIC) 0.80 0.74 0.81 0.75 0.38 0.81 0.78 0.81 0.80 0.41
GA-LDA (CH) 0.80 0.74 0.82 0.77 0.38 0.81 0.79 0.82 0.81 0.41
PSO-LDA (CH) 0.81 0.74 0.82 0.77 0.39 0.82 0.79 0.82 0.81 0.41
FA-LDA (CH) 0.82 0.74 0.82 0.77 0.39 0.83 0.80 0.82 0.82 0.41
CSA-LDA (CH) 0.82 0.75 0.83 0.78 0.40 0.83 0.80 0.82 0.82 0.41
BA-LDA (CH) 0.82 0.75 0.83 0.79 0.41 0.84 0.81 0.83 0.82 0.41
GA-LDA (DB) 0.85 0.78 0.86 0.81 0.42 0.86 0.83 0.88 0.85 0.45
PSO-LDA (DB) 0.85 0.82 0.87 0.82 0.44 0.86 0.83 0.88 0.87 0.45
FA-LDA (DB) 0.87 0.82 0.87 0.83 0.46 0.87 0.84 0.89 0.87 0.46
CSA-LDA (DB) 0.87 0.83 0.88 0.84 0.47 0.88 0.84 0.89 0.88 0.49
BA-LDA (DB) 0.88 0.83 0.89 0.86 0.49 0.90 0.84 0.90 0.88 0.52
GA-LDA (SI) 0.82 0.75 0.84 0.79 0.41 0.84 0.81 0.84 0.82 0.42
PSO-LDA (SI) 0.83 0.75 0.84 0.79 0.41 0.84 0.81 0.85 0.83 0.43
FA-LDA (SI) 0.84 0.76 0.85 0.80 0.41 0.85 0.81 0.85 0.83 0.43
CSA-LDA (SI) 0.85 0.77 0.85 0.80 0.41 0.85 0.82 0.86 0.84 0.43
BA-LDA (SI) 0.85 0.78 0.85 0.81 0.42 0.85 0.83 0.87 0.85 0.44

LDA:潜在狄利克雷分配,GA-LDA:基于遗传算法的LDA, PSO-LDA:基于粒子群优化的LDA, FA-LDA:萤火虫算法LDA, CSA-LDA:布谷鸟搜索算法LDA BA-LDA:蝙蝠算法LDA, BIC:贝叶斯信息准则,CH: Calinski-Harabasz指数,DB: Davies-Bouldin指数和SI:轮廓指数。