研究文章

一个有效的预测糖尿病疾病基于深层神经网络系统

表2

Hyperparameters毫升分类优化。

模型 参数 描述 默认值 Hyperparameters优化过程
考虑组合 最优值

LR C 逆正则化的力量。 1.0 np。logspace (−5、5、10) 46.42
解算器 算法在优化问题中使用。 “lbfgs” [" lbfgs”、“liblinear”) “lbfgs”

支持向量机 γ 内核系数”rbf”、“聚”和“乙状结肠。” “规模” (0.1、1、5、10) 5
C 正则化参数。 1.0 [0.1,1、10、100、1000) 1000年
学位 度的多项式核函数“保利”(忽略所有其他内核)。 3 (1 - 6) 6
内核 指定内核类型使用的算法。 “rbf” “线性”、“聚”、“rbf”,“乙状结肠”) “聚”

XGBoost learning_rate 步长收缩用来防止过度拟合。 0.3 (0.1,0.01,0.05) 0.1
n_estimators 树木的数量。 One hundred. (100,1000) 1000年
max_depth 树的最大深度。 6 (3、4、5) 5
min_child_weight 孩子所需的最小重量的总和。 1 [0、5、10] 0
colsample_bytree 特性的子样品比当构建每棵树。 1 (0.1,0.8,1.0) 1
子样品 训练实例的子样品比率。 1 (0.2,0.7,1.0) 0.7
γ 所需的最小损失减少。 0 (0、0.25、1.0) 0
reg_lambda L2正则化项权重。 1 (0、1.0、10.0) 0
reg_lambda L1正则化项权重。 1 (0、7.0、10.0) 0

DT max_depth 树的最大深度。 没有一个 (9、11、13、15) 15
max_features 特征的数量考虑当寻找最好的分裂。 没有一个 (“汽车”,“√”) “汽车”
min_samples_leaf 最小数量的样品需要在一个叶子节点。 1 (1、3、5、7、9) 1
min_samples_split 分裂所需的最小数量的样品内部节点。 2 (2、4、6) 2
标准 函数来衡量分割的质量。 “基尼” (“基尼”,“熵”) “熵”
分束器 使用的策略选择每个节点的分裂。 “最佳” (“最好”,“随机”) “最佳”

射频 n_estimators 在森林中树木的数量。 One hundred. (10、30、50、70、90、100] 50
max_features 特征的数量考虑当寻找最好的分裂。 “汽车” (“汽车”,“√”) “汽车”
标准 函数来衡量分割的质量。 “基尼” (“基尼”,“熵”) “熵”
max_depth 树的最大深度。 没有一个 (5、10、15) 15
min_samples_split 分裂所需的最小数量的样品内部节点。 2 (2、4、6) 6
min_samples_leaf 最小数量的样品需要在一个叶子节点。 1 (1、2、3) 1
引导 引导样品是否使用在构建树。 真正的 (真的,假的)