|
输入D={(x1y1),(x2y2),…(xNyN),}与x表示训练数据我x = (我,1,x我2x、…我,p) |
| (1) |
输出分类测试数据 |
| (2) |
假设 |
| (3) |
拉:学习自动机 |
| (4) |
DTr= {DT1DT2,DT…R}表示基础的学习者 |
| (5) |
α我/ /选择DT: LA行动r |
| (6) |
一个:奖励参数 |
| (7) |
b:惩罚参数 |
| (8) |
池:所有的学习者训练基地 |
| (9) |
算法 |
| (10) |
为r = 1 r做 |
| (11) |
创建一个数据集Dt通过抽样(N / R)项目,随机的替代D |
| (12) |
火车DTr使用Dt,增加了池 |
| (13) |
结束/ / |
| (14) |
为每一个测试样本 |
| (15) |
{ |
| (16) |
拉=新拉/ /创建一个从LA LA对象类 |
| (17) |
而((拉收敛到一个操作)或(拉超过了预定义的迭代数量)) |
| (18) |
{ |
| (19) |
选择一个随机的操作和执行,由拉,让它去α我 |
| (20) |
如果(α我预计新测试样本正确)然后/ /更新选择的概率向量 |
| (21) |
/ /选中的奖励α我 |
| (22) |
其他的 |
| (23) |
/ /惩罚所选α我 |
| (24) |
}/ /而结束 |
| (25) |
}/ /结束 |
| (26) |
返回DTr |
| (27) |
分类测试数据的预测DTr |
| (28) |
结束。/ /算法 |
|