|
输入:用户配置文件(PU);所有会话窗口属于用户(
)。 |
|
输出:预期的用户标签(陆) |
| (1) |
过程查询协会(PU、
) |
| (2) |
为
做 |
| (3) |
|
| (4) |
|
| (5) |
为
做 |
| (6) |
为
做 |
| (7) |
|
| (8) |
|
| (9) |
返回
|
| (1) |
首先,用户配置文件(PU)特征向量是获得用于训练目的。特征向量的用户配置文件(
)方程所示(4)。从uClassify(获得的特征向量是http://www.uclassify.com)服务,机器学习的web服务,它提供了很多不同的用于文本分类的分类器。我们选择了“主题”分类器,每个短语或查询的分数在10个主要课程包括体育,社会,科学,娱乐,家庭,健康,游戏,电脑,商业,和艺术。 |
| (2) |
在第二步中,分类模型P模型是使用和监督的机器学习算法。测试数据的响应不同的分类技术,10从树分类算法选择,基于规则的,懒惰的学习者,metaheuristic,贝叶斯的家庭。 |
| (3) |
在分类模型(P模型),第三步是获得特征向量所示的方程(5)的查询会话窗口年代赢得从uClassify测试数据。 |
| (4) |
在最后一步中,每个查询的提供预期的标签的分类模型。陆的标签显示是否属于UoI传入的查询。 |
|