研究文章
一个有效的预测糖尿病疾病基于深层神经网络系统
|
| 模型 |
参数 |
描述 |
默认值 |
Hyperparameters优化过程 |
| 考虑组合 |
最优值 |
|
| LR |
C |
逆正则化的力量。 |
1.0 |
np。logspace (−5、5、10) |
46.42 |
| 解算器 |
算法在优化问题中使用。 |
“lbfgs” |
[" lbfgs”、“liblinear”) |
“lbfgs” |
|
| 支持向量机 |
γ |
内核系数”rbf”、“聚”和“乙状结肠。” |
“规模” |
(0.1、1、5、10) |
5 |
| C |
正则化参数。 |
1.0 |
[0.1,1、10、100、1000) |
1000年 |
| 学位 |
度的多项式核函数“保利”(忽略所有其他内核)。 |
3 |
(1 - 6) |
6 |
| 内核 |
指定内核类型使用的算法。 |
“rbf” |
“线性”、“聚”、“rbf”,“乙状结肠”) |
“聚” |
|
| XGBoost |
learning_rate |
步长收缩用来防止过度拟合。 |
0.3 |
(0.1,0.01,0.05) |
0.1 |
| n_estimators |
树木的数量。 |
One hundred. |
(100,1000) |
1000年 |
| max_depth |
树的最大深度。 |
6 |
(3、4、5) |
5 |
| min_child_weight |
孩子所需的最小重量的总和。 |
1 |
[0、5、10] |
0 |
| colsample_bytree |
特性的子样品比当构建每棵树。 |
1 |
(0.1,0.8,1.0) |
1 |
| 子样品 |
训练实例的子样品比率。 |
1 |
(0.2,0.7,1.0) |
0.7 |
| γ |
所需的最小损失减少。 |
0 |
(0、0.25、1.0) |
0 |
| reg_lambda |
L2正则化项权重。 |
1 |
(0、1.0、10.0) |
0 |
| reg_lambda |
L1正则化项权重。 |
1 |
(0、7.0、10.0) |
0 |
|
| DT |
max_depth |
树的最大深度。 |
没有一个 |
(9、11、13、15) |
15 |
| max_features |
特征的数量考虑当寻找最好的分裂。 |
没有一个 |
(“汽车”,“√”) |
“汽车” |
| min_samples_leaf |
最小数量的样品需要在一个叶子节点。 |
1 |
(1、3、5、7、9) |
1 |
| min_samples_split |
分裂所需的最小数量的样品内部节点。 |
2 |
(2、4、6) |
2 |
| 标准 |
函数来衡量分割的质量。 |
“基尼” |
(“基尼”,“熵”) |
“熵” |
| 分束器 |
使用的策略选择每个节点的分裂。 |
“最佳” |
(“最好”,“随机”) |
“最佳” |
|
| 射频 |
n_estimators |
在森林中树木的数量。 |
One hundred. |
(10、30、50、70、90、100] |
50 |
| max_features |
特征的数量考虑当寻找最好的分裂。 |
“汽车” |
(“汽车”,“√”) |
“汽车” |
| 标准 |
函数来衡量分割的质量。 |
“基尼” |
(“基尼”,“熵”) |
“熵” |
| max_depth |
树的最大深度。 |
没有一个 |
(5、10、15) |
15 |
| min_samples_split |
分裂所需的最小数量的样品内部节点。 |
2 |
(2、4、6) |
6 |
| min_samples_leaf |
最小数量的样品需要在一个叶子节点。 |
1 |
(1、2、3) |
1 |
| 引导 |
引导样品是否使用在构建树。 |
真正的 |
(真的,假的) |
假 |
|
|