复杂性

研究文章

一个有效的预测糖尿病疾病基于深层神经网络系统

表2

Hyperparameters毫升分类优化。


模型	参数	描述	默认值	Hyperparameters优化过程
模型	参数	描述	默认值	考虑组合	最优值

LR	C	逆正则化的力量。	1.0	np。logspace (−5、5、10)	46.42
LR	解算器	算法在优化问题中使用。	“lbfgs”	[" lbfgs”、“liblinear”)	“lbfgs”

支持向量机	γ	内核系数”rbf”、“聚”和“乙状结肠。”	“规模”	(0.1、1、5、10)	5
	C	正则化参数。	1.0	[0.1,1、10、100、1000)	1000年
	学位	度的多项式核函数“保利”(忽略所有其他内核)。	3	(1 - 6)	6
	内核	指定内核类型使用的算法。	“rbf”	“线性”、“聚”、“rbf”,“乙状结肠”)	“聚”

XGBoost	learning_rate	步长收缩用来防止过度拟合。	0.3	(0.1,0.01,0.05)	0.1
	n_estimators	树木的数量。	One hundred.	(100,1000)	1000年
	max_depth	树的最大深度。	6	(3、4、5)	5
	min_child_weight	孩子所需的最小重量的总和。	1	[0、5、10]	0
	colsample_bytree	特性的子样品比当构建每棵树。	1	(0.1,0.8,1.0)	1
	子样品	训练实例的子样品比率。	1	(0.2,0.7,1.0)	0.7
	γ	所需的最小损失减少。	0	(0、0.25、1.0)	0
	reg_lambda	L2正则化项权重。	1	(0、1.0、10.0)	0
	reg_lambda	L1正则化项权重。	1	(0、7.0、10.0)	0

DT	max_depth	树的最大深度。	没有一个	(9、11、13、15)	15
	max_features	特征的数量考虑当寻找最好的分裂。	没有一个	(“汽车”,“√”)	“汽车”
	min_samples_leaf	最小数量的样品需要在一个叶子节点。	1	(1、3、5、7、9)	1
	min_samples_split	分裂所需的最小数量的样品内部节点。	2	(2、4、6)	2
	标准	函数来衡量分割的质量。	“基尼”	(“基尼”,“熵”)	“熵”
	分束器	使用的策略选择每个节点的分裂。	“最佳”	(“最好”,“随机”)	“最佳”

射频	n_estimators	在森林中树木的数量。	One hundred.	(10、30、50、70、90、100]	50
	max_features	特征的数量考虑当寻找最好的分裂。	“汽车”	(“汽车”,“√”)	“汽车”
	标准	函数来衡量分割的质量。	“基尼”	(“基尼”,“熵”)	“熵”
	max_depth	树的最大深度。	没有一个	(5、10、15)	15
	min_samples_split	分裂所需的最小数量的样品内部节点。	2	(2、4、6)	6
	min_samples_leaf	最小数量的样品需要在一个叶子节点。	1	(1、2、3)	1
	引导	引导样品是否使用在构建树。	真正的	(真的,假的)	假