TY -的A2 -卡里尔,艾哈迈德Mostafa盟——奥木兰·f·Nahla AU - Abd-el Ghany,莎拉f . AU -萨利赫,海格盟——Nabil Ayman PY - 2021 DA - 2021/01/28 TI -乳腺癌识别使用机器学习解决方案从病人的推流火花SP - 6653508六世- 2021 AB - Twitter与流数据集成技术和机器学习添加新的医疗保健价值。本文提出了一种基于流媒体实时系统预测乳腺癌病人的健康来自Twitter的数据。该系统由两个主要组件:开发离线构建模型和在线预测管道。第一组件,我们做了一个特性之间的相关性来确定之间的关系的功能特性和减少乳腺癌的威斯康辛州的诊断数据集。两种特征选择算法是递归特性消除和单变量特征选择算法应用到功能后相关选择的基本特性。四个决策树、逻辑回归、支持向量机、和随机森林分类器已用于特征相关性和特征选择。同时,hyperparameter调优和交叉验证与机器学习应用优化模型和提高准确性。Apache火花,Apache卡夫卡,Twitter流API用于开发第二个组件。最好的模型精度最高的从第一个组件获得预测乳腺癌从twitter的实时流媒体。结果表明,最好的模型是随机森林分类器实现最好的准确性。 SN - 1076-2787 UR - https://doi.org/10.1155/2021/6653508 DO - 10.1155/2021/6653508 JF - Complexity PB - Hindawi KW - ER -