研究文章

PIR QuPiD攻击:基于机器学习隐私量化机制协议中与健康有关的网络搜索

算法1

将传入的查询用户使用之前的概要文件。
输入:用户配置文件(PU);所有会话窗口属于用户( )。
输出:预期的用户标签(陆)
(1) 过程查询协会(PU、 )
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9) 返回
(1) 首先,用户配置文件(PU)特征向量是获得用于训练目的。特征向量的用户配置文件( )方程所示(4)。从uClassify(获得的特征向量是http://www.uclassify.com)服务,机器学习的web服务,它提供了很多不同的用于文本分类的分类器。我们选择了“主题”分类器,每个短语或查询的分数在10个主要课程包括体育,社会,科学,娱乐,家庭,健康,游戏,电脑,商业,和艺术。
(2) 在第二步中,分类模型P模型是使用 和监督的机器学习算法。测试数据的响应不同的分类技术,10从树分类算法选择,基于规则的,懒惰的学习者,metaheuristic,贝叶斯的家庭。
(3) 在分类模型(P模型),第三步是获得特征向量 所示的方程(5)的查询会话窗口年代赢得从uClassify测试数据。
(4) 在最后一步中,每个查询的 提供预期的标签的分类模型。陆的标签显示是否属于UoI传入的查询。