TY -的AU -唐,丹丹盟——张,人非盟-徐Jiabo盟——张Xueliang AU -杨,方非盟-李,随着非盟-冯,李盟——王,凯盟——郑Yujian PY - 2018 DA - 2018/12/10 TI -数据挖掘技术的应用,在艾滋病高危人群的监测报告数据从2009年到2015年在乌鲁木齐SP - 9193248六世- 2018 AB -
客观的.乌鲁木齐是新疆乃至全国艾滋病感染的重点地区之一。艾滋病流行病正从高危群体向一般人口蔓延,情况仍然非常严重。本研究的目的是使用四种数据挖掘算法建立HIV感染的识别模型,并比较它们的预测性能。
方法.2009 - 2015年乌鲁木齐市注射吸毒者(IDU)、男男性行为者(MSM)、女性性工作者(FSW)三组高危人群哨点监测数据包括人口学特征、性行为、血清学检测结果。然后我们使用
年龄,
婚姻状况,
教育水平,将其他变量作为输入变量,是否感染HIV作为输出变量,对这三个数据集建立四个预测模型。我们还使用混淆矩阵、准确性、敏感性、特异性、精密度、召回率和受试者工作特征曲线(ROC)下面积(AUC)来评价分类性能,并分析预测变量的重要性。
结果.最后的实验结果表明,随机森林算法获得了最好的诊断结果,对MSM数据集的诊断准确率为94.4821%,对FSW数据集的诊断准确率为97.5136%,对IDU数据集的诊断准确率为94.6375%。其次是k近邻算法,在MSM数据集上诊断准确率为91.5258%,在FSW数据集上诊断准确率为96.3083%,在IDU数据集上诊断准确率为90.8287%,其次是支持向量机(94.0182%,98.0369%,91.3571%)。4种算法中决策树算法的诊断准确率最低,在MSM数据集上诊断准确率为79.1761%,在FSW数据集上诊断准确率为87.0283%,在IDU上诊断准确率为74.3879%。
结论.数据挖掘技术作为一种辅助疾病筛查和诊断的新方法,可以帮助医务人员从大量信息中快速筛查和诊断艾滋病。SN - 1076-2787 UR - https://doi.org/10.1155/2018/9193248 DO - 10.1155/2018/9193248 JF -复杂度PB - Hindawi KW - ER -