利用多作用来改善医疗协同过滤的个性化的排名

文摘

如今,向用户提供高质量的推荐服务是一个重要的组件在web应用程序,包括购物,交朋友,和医疗。这可以被认为是一个问题估计用户的偏好利用显式反馈(数值评级),或与隐式协作排名的问题反馈(例如,购买、视图和点击)。对解决这个问题以前作品包括点态回归方法和成对的排名方法。新兴医疗网站和在线医疗数据库实施医疗服务推荐的新挑战。在本文中,我们开发一个模型,MBPR(医疗贝叶斯个性化排名在多个用户的行为),基于简单的观察,用户倾向于分配更高的排名同时喜欢在一些医疗服务用户的其他操作。在真实数据集的实验结果表明,MBPR达到更准确的推荐比一些先进的方法,显示了其通用性和可伸缩性通过实验数据集从一个移动购物应用程序。

1。介绍

与人民生活水平的不断提高,医疗已经吸引了越来越多的关注,成为一个热点研究课题。稀缺的现象和跨地区的医疗资源分布不平衡,中国变成了一个严重的社会问题。在目前的情况下,很难以选择合适的医院和医生的人。病人获得医疗信息的主要渠道包括从其他人们通过口头建议,广告在报纸或电视、和在过去的十年中,经常使用互联网搜索引擎(百度、谷歌等)。不幸的是,这些方法不能确保信息质量、精度和可靠性的熟人的推荐。考虑到民生的重要性和严肃性,人们总是认为综合医院医疗需求,导致产能过剩的现象在AAA级综合医院和社区卫生服务机构的能力。它形成一种趋势,人们更喜欢盛誉医院,因此加剧了医疗资源的不平衡。的病人,没有专业知识和相关医疗经验,他们花更多的不必要的时间和精力在这个场景中。考虑到昂贵的医疗费用,可能作出错误的判断和放弃治疗。

因此,它是一个至关重要的问题帮助病人参加一个适当的水平的医疗资源。随着新兴医疗数据库和网站提供大量的信息,推荐个性化的医疗服务可以设计基于web挖掘方法。MedHelp(http://www.medhelp.org/)是一个在线健康社区,提供跟踪工具疼痛、体重,和其他慢性疾病。患者将接受指导、激励和同行和专家的支持。CureTogether(http://curetogether.com/)是一个网站,人们匿名谈论敏感症状,比较健康数据,以更好地分析他们的健康状况,并获得更多的治疗决策和新的研究发现基于patient-contributed数据。人们可以从其他与健康有关的评论网站,选择医疗服务等重要器官(http://www.vitals.com/),Healthgrades(http://www.healthgrades.com/),RateMDs(http://www.ratemds.com/)。在这些网站上,医院和医生的在线约会服务的详细信息。这种创新的医疗咨询的过程提高效率比传统现场医生选择(1]。

推荐系统可以帮助用户处理信息过载问题有效地提出项目(如产品、电影和音乐)匹配用户的个人喜好(2,3]。协同过滤(4),广泛利用的技术,已经广泛采用商业推荐系统(5- - - - - -7]。在以前的工作,提出了基于模型的方法来提高预测精度使用显式反馈(例如,数值评分)8- - - - - -10]。然而,在许多实际应用场景,显式数值评级可能不可用。最近的一些作品转向提高推荐的性能通过利用用户的隐式反馈,如浏览(11],点击[5,看6),和采购12]。这被称为看到下面成了一个推荐的问题,提出了各种解决方案来解决它利用辅助关系(例如,社会信息)。

MR-BPR [13),建议作为一种先进的方法治疗看到下面成了multirelational学习问题,着重于如何利用社会信息对用户项目预测和提出了一种扩展贝叶斯个性化排名multirelational排名在社交网络。在这项工作,MR-BPR模型用户的同时社会偏好和产品偏好,但不能模型(即辅助关系。社会关系)直接影响用户的偏好物品。赵等人开发SBPR [14),用户偏好模型项目排名利用社会关系从用户的朋友。在[14),一个新的社会阶层利用用户的反馈的社会信息介绍,社会系数的参数可以从用户的显示的态度对一个项目的社会关系。然而,社会反馈只是基于用户的社会信息与他们的朋友,这种类型的反馈也可以被认为是“消极反馈。“然而,很少有作品采用多个类型的观察反馈来自多作用之间的用户和推荐的项目同时看到下面成了一个问题,尤其是在医疗建议。

在本文中,我们研究如何利用多个观察反馈更好的推荐模型,鉴于项目的假设关于一个新类称为“辅助反馈。介绍了”,一个特殊的系数来表示偏好的多个操作用户之间的距离。然后,我们提出一个新算法称为医疗贝叶斯个性化排名(MBPR)多个用户的操作。该方法是评估一个真实的数据集从医疗服务的网站,收集和实证结果表明,该模型是更有效的,能够实现更好的推荐性能。一般性的方法也被应用到另一个数据集的实验中已经证明了从移动电子商务应用程序。

在本节中,我们将简要地回顾一些相关工作在两个方面:(1)方法基于逐点的偏好假设和基于成对偏好假设(2)方法。

在逐点的方法,隐含的反馈被认为是绝对分数的偏好。具体地说,观察user-item的一对被认为是一个积极的反馈和解释为该用户吗u喜欢的项目我绝对高的分数。负面反馈是采样低偏好分数使用几个策略。两种典型的逐点的方法解决这个建议问题OCCF协同过滤(看到下面成了)[15)和国际货币基金组织(隐式矩阵分解)16),矩阵分解方法可以应用这些方法。OCCF [15)提出了两种不同的抽样策略未被注意的推荐user-item交互解决看到下面成了问题。一个是加权低秩近似;另一种是负面例子抽样。在国际货币基金组织(16)工作,介绍了隐式反馈信心权重,可以用两个潜在的近似特征矩阵。然而,OCCF的限制,无法user-item对作为一个负面的反馈,未被注意的user-item对并不总是意味着用户吗u不喜欢的项目j在现实世界中。至于iMF,信心是每个观测所需的辅助知识反馈,这可能不是在真实的应用程序中可用。

与点态方法相比,成对的方法以隐含的反馈为相对偏好,而不是绝对的和订单或关注排名的反馈。例如,user-item-item三重表明用户u假定喜欢项目我在项目j,这可以解释为该用户显示更高的偏好上的积极反馈比消极反馈。在[12),贝叶斯个性化排名(BPR)算法是首先提出了解决这样成对偏好假设看到下面成了协同过滤的问题。这个框架后,提出了各种各样的新作品结合不同类型的上下文数据到BPR的算法。锅和陈11)开发一个通用的算法称为协同过滤通过学习成对偏好对项集(CoFiSet)基于一种新的和放松假设成对偏好的项集,它定义了用户的偏好在一组项目(项目集),而不是在单个项目。杜et al。17]提出一种新颖的方法称为用户图正规化成对矩阵分解(UGPMF),来改善推荐性能将用户端的社会关系纳入成对矩阵分解过程。锅和陈18]提出一种改进的假设和组贝叶斯个性化排名(GBPR),通过引入一个新的概念群偏好放松两个基本假设在成对的排名方法。该算法使用更丰富的用户之间的交互和聚合的特点一组相关的用户。赵et al。14)设计一个成对的算法称为社会贝叶斯个性化排名(SBPR)是基于简单的观察,用户倾向于分配更高的排名他们的朋友喜欢的东西,而这种方法使用的社会关系来更好地估计用户的产品排名。Rendle和州长戴夫[19]提出的非均匀采样器和上下文相关的项目-项目通过过采样信息对加快收敛速度。

然而,上述作品主要关注建模反馈订单通过使用用户的积极反馈、负反馈或社会信息,但不要研究反馈用户的其他操作可以组合模型用户的订单商品的偏好。与这些方法相比,我们提出MBPR算法利用两种观察指示的多个操作用户的反馈,以建立更好的模型模拟用户的偏好。

3所示。问题定义

在本节中,我们将首先介绍的数据收集从医疗服务网站(Topmd(http://www.topmd.cn/))。然后,我们将使用的基本概念和定义纸张和复杂的医疗问题的贝叶斯个性化排名在多个用户的行为。

让表示用户集, 表示项目集, , 。

该网站Topmd设计和开发的实验室,作者在工作。用户的主要操作包括预约登记和在线咨询医生正式注册的这个网站。在这种情况下,“医生”可以定义为“物品。“用户的数量u预约医生我或用户u咨询了医生k分别加起来。“积极的反馈”数据集表示用户是否与医生预约,和“辅助反馈”表示用户是否在网站上咨询医生。Topmd数据集是短暂地见图1。在本文中,这两种观察反馈来自多个用户的行为是利用同时提高推荐的性能。

将在本文中使用的概念被定义为以下。

3.1。观察项目和未被注意的项目

为每个用户观察项目和包括用户的项目u分别显示了两种不同的观察偏好。未被注意的事项剩下的物品。在这个工作,为每个用户 ,我们把总项目集我分为三个部分:正反馈,辅助反馈,和负面的反馈,如下。

3.1.1。积极的反馈

积极的反馈被定义为一组user-item对包含用户吗u和他/她的观察项目这些用户可能是项u购买、评价,等等。根据数据集的问题,P_u(即被定义为项目集。,做ctors) that have been made an appointment by useru。

3.1.2。辅助反馈

辅助反馈被定义为一组user-item对包含用户吗u和他的观察项。根据数据集的问题,(即被定义为项目集。,做ctors) that have been consulted online by useru。

3.1.3。负面的反馈

表明负面反馈定义为user-item对的集合, 代表项目,用户u既没有预约和咨询。注意,一个负面的反馈并不代表用户不喜欢的物品。

很明显, 和包括所有的项目集。

3.2。辅助系数

鉴于辅助反馈的定义,我们引入一个辅助系数它描述了偏好之间的距离u积极的反馈和辅助反馈。给定一个特定的用户u,与他们的积极的反馈和辅助反馈 ,是一个参数表明偏好之间的距离u对项目的积极反馈我和辅助反馈对一个特定的项目k。的价值和辅助系数的计算方法将在稍后讨论。它可以发现,辅助价值系数越大,越大的偏好行动和协商行动之间的距离约会。在这种情况下,我们可以自然地假设用户u也可以预约项目k这是只观察到辅助反馈。

我们列举一些论文中使用的符号表1。


符号	描述

	用户设置,
	项目集,
	项(在用户偏好的观察u一种行动)
	项(在用户偏好的观察u的辅助动作)
	观察项(偏好),
	观察项(缺席),
	用户指数
	项指数
	两集(在用户偏好的观察u的一种动作),
	两集(在用户偏好的观察u的辅助作用),
	两组(缺乏观察),
	辅助系数, ,
	哪个用户数量u对项目我基于一种行动
	哪个用户数量u对项目j基于辅助行动
	偏好的用户u在项目我
	模型参数
	用户u潜在的特征向量,d是潜在的因素的数量吗
	用户我潜在的特征向量,d是潜在的因素的数量吗
	项我的偏见

不同于之前的工作,我们引入一个新的辅助反馈类利用用户的其他类型的行动信息。与这些概念,医疗问题的贝叶斯个性化的排名可以定义多个用户的操作。本文的目的是推荐个性化的排名为每个用户的项目列表u。根据上述定义的概念,使用用户的积极反馈和辅助反馈,主要的任务是如何学习排名功能,包含所有这些信息的来源。

的问题(即利用辅助反馈。,healthcare consultation information) to improve personalized ranking for collaborative filtering can be defined precisely as follows:

鉴于观察反馈和辅助反馈来自多个操作,本文的目标是为每个用户学习排名函数u。在哪里代表该用户对项目显示更高的偏好比项目。

4所示。医疗贝叶斯个性化排名在多个用户的行为

在本节中,我们将描述我们的模型假设关于积极,辅助和负面的反馈,然后详细医疗贝叶斯算法的个性化的排名在多个用户的行为。

不同于之前的工作,我们将辅助反馈用户的医疗咨询信息和介绍一个基于偏好系数之间的距离正反馈和辅助反馈控制训练对如何取样。

4.1。模型的假设

我们首先介绍基本假设采用贝叶斯个性化排名(BPR) [12]。BPR的主要想法是利用偏序的项目,而不是单一user-item例子,培训推荐模型,它可以表示为在哪里代表用户的偏好在项目。给定一个积极user-item用户的例子在项目(例如,用户浏览或购买物品),我们假设用户可能喜欢的项目所有其他nonobserved项目这表达的关系。逐点地的基本思想和两两之间的差异可以反映这一假设。逐点方法(15,16)关注拟合数值等级值而成对方法(12,20.,21)模式的偏好顺序数据相反,可以提取一个成对数据集的偏好通过在哪里积极的项目集和吗是失踪的设置与用户。每个三的语义是,用户u假定喜欢项目在项目。

个性化BPR-OPT排名的优化标准的目标是最大化对这些对后验概率如下: 在哪里是物流乙状结肠函数

的代表了一个任意的参数向量模型类(例如,矩阵分解)模型相关的正则化参数。

先前的工作已经证明成对假设生成推荐结果比逐点的方法。现在,我们提出的假设是基于以下详细成对比较的偏好。

有很多种情况下的医疗服务的医疗建议。根据收集的数据集医疗网站,我们选择最具代表性的两种类型的用户的行为。一个是预约登记,另一种是在线健康咨询。鉴于此概要,提出的假设就像如下: 在哪里代表用户在正反馈的偏好 , 代表辅助反馈的偏好 ,和代表了负面反馈的偏好。基于这样的假设,“观察”的反馈是由两部分组成:积极的反馈和辅助反馈。根据数据集的应用场景,正反馈是一组user-item对来自预订的关系,和辅助反馈是user-item集对根据卫生咨询关系。提出假设认为用户的积极反馈的影响及其辅助反馈,使它更普遍的和现实的医疗建议设置。

4.2。模型公式

在本节中,我们将介绍模型的制定和学习假设如(6),将部分中描述的实验比较5。

对于每个用户,优化准则可以表示如下: 在哪里 , , 和的指标函数

为一个特定用户的数据集,(7)反映了主要的假设提出了部分4所示。1这篇论文。一方面,由于正反馈用户的偏好从预订行为应该比辅助反馈健康咨询,另一方面他的偏好由于辅助反馈应大于负面的反馈。

由于整体和反对称性的成对订购计划详细(12),(7)可以写成

这一假设,我们有一个新的标准称为贝叶斯个性化医疗(MBPR)排名在多个用户的操作。我们的目标是最大化目标函数如下: 正则化项是用于防止过度拟合。

4.3。辅助系数

与其他作品不同,系数是用于(10)来控制每个样本训练的贡献对目标函数。这个系数表示偏好之间的距离正反馈和辅助反馈。辅助反馈有一个很大的辅助系数意味着项目有更高的几率被采用或用户首选。在我们的数据集基于医疗服务,预约用户的频率或健康咨询被认为是重要的评价指标,可以显示用户的偏好项目(即。,医生)。因此,我们将详细介绍这个系数的计算方法的基础上,具体情况。

4.3.1。第一个方法

我们定义哪个用户数量u对项目我基于一种行动,哪个用户数量u对项目j基于辅助行动。根据收集的数据集从实际生活的场景,正反馈是user-item对基于预订操作,和辅助反馈是user-item集对来自卫生咨询行动。用户数量吗u已经预约了项目我,用户数量吗u已建议项k。相比之下,预约用户的频率的频率健康咨询,有两种情况如下:(1)如果 ,然后 ,差异越大和 ,更大的用户u对商品的偏好我比项目k。(2)如果 ,然后 ,之间的差异越小和 ,之间的差异越小u对商品的偏好我比项目k。

因此,辅助系数可以被定义为

基于上述分析,辅助系数可以计算物流乙状结肠函数

和(10)可以写成

4.3.2。第二种方法

辅助系数可以被视为一个模型的参数。首先,的初始值可以由(11),然后是基于采样反馈迭代更新成对使用在哪里是学习速率。

基于先前描述的两种方法,将进行实验和比较分析将演示部分5。

4.4。模型的学习

(描述的优化问题13)可以解决采用广泛使用的随机梯度下降法(SGD)在协同过滤算法16]。SGD是随机选择的主要过程((积极辅助)和(辅助,-))的反馈,然后基于采样反馈迭代更新模型参数对。我们将首先获得每个变量的梯度和更新规则。

在我们的工作中,矩阵分解模型建模中使用的隐藏偏好一个用户对一个项目的偏好函数, , , , , , ,在那里d是潜在的数量因素和是矩阵分解的模型参数。

根据(13),正则化项可以写成

我们有变量的梯度项和正则化项包括损失的正则化项是用于空白期间过度拟合模型学习和 , ,和hyperparameters。

因此,我们为每个变量更新规则在哪里是学习速率。

我们可以发现,当用户的辅助反馈并没有被观察到,该偏好的假设4所示。1将相同的假设的贝叶斯个性化排名(BPR)。MBPR的算法步骤中描述的算法1,在那里米用户的数量和吗n是条目的数量。

输入:观察反馈和辅助反馈
输出:参数
初始化:为 ; ;做
分裂n项目分为三个部分: , , ;
结束
为迭代做
为训练样本做
步骤1。均匀样本用户 ;
步骤2。均匀采样一个项目我从 ;
步骤3。均匀采样一个项目k从 ;
步骤4。均匀采样一个项目j从 ;
第5步。计算 ;
步骤6。更新通过(17),(24);
步骤7。更新通过(18),(25)和最新的 ;
步骤8。更新通过(19),(26)和最新的 ;
第9步。更新通过(20.),(27)和最新的 ;
Step10。更新通过(21),(28);
Step11。更新通过(22),(29日);
Step12。更新通过(23),(30.);
结束
结束

模型中给出了学习算法的伪代码1。user-item观察反馈和辅助反馈被作为输入。首先,我们分手n项目分为三个部分。对于每次迭代,我们随机样本用户u(步骤1),然后随机样本项目我,j,k从 , ,和分别(步骤2 - 4)。具体来说,我们计算变量梯度根据(17),(18),(19),(20.),(21),(22)和(23)(步骤5),然后更新变量的梯度下降法(步骤6 - 12)。辅助系数分别计算,根据这两种方法在部分4所示。3。

学习MBPR模型的计算时间主要是由评估目标函数及其对功能梯度向量(变量)。的总体时间复杂度MBPR在一个迭代 ,在那里d是潜在的数量因素,一个是预约登记矩阵,C是在线咨询矩阵,然后呢 , 指的是观察到的条目的数量。

5。实验

在本节中,我们两个真实数据集上进行实验评价了该方法的性能。

5.1。数据集

我们使用两个真实数据集的实验研究。Topmd-A数据集简要说明部分3。该网站已经从6结合优质医疗资源医院,隶属于郑州大学。2014年12月底,它包括2288名医生和38490的注册用户。该网站提供的主要功能包括在线预约登记和咨询。根据网站的实际历史数据,我们从20754用户中提取数据和1127件连同他们的登记和咨询号码。登记行为和协商行为的数量是42831和6735,分别。现在,任务感兴趣的个性化的排名从医生是最有可能约。

为了证明该算法的通用性,实验数据集上进行了从移动电子商务应用程序。第二个数据集是来自Sobazaar移动购物应用程序包括17126个用户和24785件。采购数据和product-wanted收集数据基于内容的交互。在这种情况下,“正反馈”表示用户是否购买一个项目,和product-wanted数据可以被认为是“辅助反馈的一个变体。“采购行为的数量和product-wanted行为是积累,总额是18268年和8916年,分别。现在的任务是预测一个个性化的排名列表项的用户想买。

这两个数据集的统计数据,总结在表2。


功能	Topmd-A	Sobazaar-A

用户	20754年	17126年
项目	1127年	24785年
积极的反馈	42831年	18268年
辅助反馈	6735年	8916年

5.2。评价指标

以前,我们使用流行的ranking-oriented评价指标@k(22,23),回忆@k(14),AUC(曲线下的面积)12),地图(意味着平均精度)15),NDCG@k(24],MRR(意思是倒数排名)(22),研究方法的推荐性能基线相比。

5.2.1。Pre@k

对于每个用户,用户的精度被定义为 ,在那里是推荐的物品的数量和用户喜欢(真阳性,TP),是推荐的物品的数量但用户不喜欢(假阳性,FP)。对于所有用户,被定义为

5.2.2。Recall@k

对于每个用户,的用户被定义为 ,在那里是不推荐的物品的数量但用户喜欢(假阴性,FN)。对于所有用户,被定义为

5.2.3。AUC

平均统计的定义是在哪里

5.2.4。地图

地图计算平均值平均精度()所有用户在测试集 ,在哪里平均的精度计算和首选项职位吗在哪里排名列表中的位置,检索项的数量,是截止的精度等级列表从1到吗 , 如果我项优先和否则。

5.2.5。NDCG

的被定义为

NDCG的比值理想的价值值为该用户来自最好的排名为用户功能。

. 5.2.6。MRR

对于每个用户,用户的排名倒数被定义为 ,在那里第一的位置相关项估计用户的排名。然后,被定义为

5.3。基线和参数设置

本文基于执行的实验LibRec(http://www.librec.net/对gpl许可下)这是一个Java库对于推荐系统,旨在解决两个经典问题:评级预测和项目排名。

在我们的实验中,我们使用5倍交叉验证模型的学习和测试。具体来说,我们随机每个数据集分割成五倍。四倍作为训练集,其余褶皱作为测试集。五迭代将确保所有折叠进行测试。然后,平均测试性能报告为最终结果。

BPR项目排名和提出一个成对的假设也是一个非常强大的基线,这被证明是比著名的点态方法(例如,UGPMF [17],OCCF [15])。我们的方法,提出了通过扩展BPR (12)通过引入丰富的行为,因此,我们的研究集中在比较BPR和我们的模型。

MBPR-1:这种方法的假设(6),辅助系数是计算方程。所示的模型制定和学习方法的算法1。

MBPR-2:这种方法的假设(6),但是辅助系数被认为是一个模型的参数和迭代更新使用(14)和(15)。

的迭代次数T,我们尝试所有的方法。的潜在特性,我们使用。对所有实验中,参数搜索的权衡。NDCG性能验证数据用于选择最佳参数 , ,和。我们可以发现最佳的权衡参数值不同的方法在不同的数据集是不一样的。使用学习速率。

5.4。实验结果和讨论

实验结果MBPR和其他基线两个真实的数据集是在桌子上3和表4和的结果NDCGTopmd-A和Sobazaar-P如图2,我们可以有以下的观察:(1)对于这两个数据集,BPR和MBPR比随机算法,显示成对偏好假设的有效性。(2)的结果,很明显,我们的方法显示在所有评价指标进一步改善与其他算法相比,这表明注射辅助操作的影响。原因是BPR模型用户的偏好只基于单一的正反馈(如采购、查看、和卫生保健预约),但忽视了一个事实:辅助反馈是非常有用的预测用户的喜好一个项目。因此,我们的方法将不同种类的成对偏爱在多个用户同时操作确实是更有效的比简单的BPR成对偏好假设。(3)所有模型显示Sobazaar数据集上表现不佳,我们考虑的原因是稀疏的用户的积极反馈和辅助反馈(这是显示在表2)。从改善的百分比MBPR达到的所有评价指标相对于其他模型在表3和4,它清楚地表明,MBPR显示比Topmd-A Sobazaar-P有明显改善。这个观察表明,我们的方法是专门帮助应用程序中数据稀疏的更加严重。(4)作为讨论的部分4所示。3,本文使用两种不同的方法计算和大型辅助系数意味着项目有更高的几率被采用或用户首选。我们可以看到,两个真实数据集,MBPR-1的性能非常接近MBPR-2。和一个观察表3和4在多数评价指标,MBPR-1执行比MBPR-2 Topmd-A,而MBPR-2执行比MBPR-1 Sobazaar-P。图2清楚地显示了相同的趋势NDCG。上下文中的一个可能的原因可能是Topmd-A数据集医疗服务、辅助系数计算的第一个方法可以显示偏好两个动作之间的距离(即。、预约登记和在线健康咨询)更准确。而在Sobazaar-P的上下文数据集移动购物,之间的相关性(即用户的不同操作。、采购和product-wanted)较低。因此,辅助系数的两种不同的方法对实验结果影响甚微MBPR-1 MBPR-2。(5)我们可以发现,这两个数据集来自不同的应用领域包括医疗服务和移动电子商务。因此,结果明确显示优越的预测MBPR在各种应用场景的能力。


	Pre@5	Recall@5	AUC	地图	NDCG	MRR

随机	0.0010	0.0042	0.4989	0.0070	0.1248	0.0076

BPR-MF	0.0154	0.0720	0.8384	0.0577	0.2043	0.0602
MBPR-1	0.0154	0.0723	0.8427	0.0584	0.2051	0.0610
MBPR-2	0.0155	0.0725	0.8427	0.0580	0.2048	0.0606
改善	0.64%	0.69%	0.51%	1.21%	0.39%	1.32%

BPR-MF	0.0160	0.0749	0.8383	0.0587	0.2052	0.0614
MBPR-1	0.0172	0.0801	0.8304	0.0672	0.2123	0.0707
MBPR-2	0.0172	0.0800	0.8388	0.0629	0.2095	0.0661
改善	7.50%	6.94%	0.05%	14.48%	3.46%	15.14%


	Pre@5	Recall@5	AUC	地图	NDCG	MRR

随机	0.0003	0.0011	0.5035	0.0019	0.1010	0.0023

BPR-MF	0.0087	0.0308	0.7203	0.0226	0.1411	0.0292
MBPR-1	0.0101	0.0359	0.7464	0.0263	0.1480	0.0344
MBPR-2	0.0098	0.0351	0.7461	0.0266	0.1483	0.0347
改善	16.09%	16.56%	3.62%	17.70%	5.10%	18.83%

BPR-MF	0.0086	0.0309	0.7290	0.0236	0.1426	0.0308
MBPR-1	0.0098	0.0347	0.7462	0.0263	0.1480	0.0344
MBPR-2	0.0099	0.0354	0.7464	0.0263	0.1481	0.0345
改善	15.11%	14.56%	2.38%	11.44%	3.85%	12.01%

(一)Topmd-A

(b) Sobazaar-P

6。结论和未来的工作

协同过滤在这篇文章中,我们研究了看到下面成了问题,设计了一种新颖的算法称为贝叶斯个性化医疗(MBPR)排名在多个用户的操作。我们的新方法,MBPR,利用用户的不同成对偏爱在多个动作。两种观察反馈同时考虑改善预测性能。真实数据集的实验结果在两个显示MBPR可以推荐比BPR项目更准确地使用各种评价指标,和这种方法特别适用于医疗服务建议方案。

对于未来的工作,我们有兴趣扩展MBPR在三个方面:(1)使用一个活跃的抽样策略选择培训对有效;(2)研究如何利用物品的分类信息到MBPR模型;(3)利用个人医疗信息模型用户的偏好顺序在医疗保健服务;(4)在其他真实的医疗设置部署我们的模型设计一个更一般的偏好学习解决方案。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

本文在一定程度上是由中国国家自然科学基金(没有。中国61602422)和赛尔创新项目(NGII20161202)。

引用

t·r·霍恩·m·布兰顿a·斯蒂尔和n v·乔,“可靠的医疗建议系统和病人隐私,”学报第一ACM国际卫生信息学研讨会(IHI 10),页173 - 182,阿灵顿,弗吉尼亚州,美国,2010年11月。视图:出版商的网站|谷歌学术搜索
j·李和n·扎曼,“个性化医疗推荐基于社交媒体,”IEEE学报》28日国际会议上先进的信息网络和应用程序(AINA 14)维多利亚,页993 - 1000年,加拿大,2014年5月。视图:出版商的网站|谷歌学术搜索
王g和h·刘,“个性化推荐系统的调查,“计算机工程与应用,48卷,不。7,66 - 76年,2012页。视图:谷歌学术搜索
g . Adomavicius和a . Tuzhilin”向下一代的推荐系统:一项调查的最先进的和可能的扩展,“IEEE知识和数据工程(TKDE),17卷,不。6,734 - 749年,2005页。视图:出版商的网站|谷歌学术搜索
p . j . Davidson b . Liebald j . Liu Nandy,和t . v . Vleet“YouTube视频推荐系统”第四届ACM会议程序推荐系统(RecSys 10)西班牙巴塞罗那,页293 - 296,,2010年9月。视图:出版商的网站|谷歌学术搜索
g·林登、b·史密斯和j .纽约“Amazon.com建议:item-to-item协作过滤,”IEEE网络计算,7卷,不。1,第80 - 76页,2003。视图:出版商的网站|谷歌学术搜索
g .郭j·张,n . Yorke-Smith”利用multiviews方法相似的信任和加强基于集群的推荐系统,”以知识为基础的系统(KBS)卷。74年,14-27,2015页。视图:出版商的网站|谷歌学术搜索
x Ning和g . Karypis苗条:稀疏线性方法头n个推荐系统,”学报11日IEEE国际会议数据挖掘(ICDM 11)加拿大温哥华,页497 - 506,2011年12月。视图:出版商的网站|谷歌学术搜索
与libfm s Rendle“分解机器,”ACM智能交易系统和技术,3卷,不。3、219 - 224年,2012页。视图:出版商的网站|谷歌学术搜索
g .郭j·张,n . Yorke-Smith”小说推荐与用户信任和项评级模型正规化,”IEEE知识和数据工程(TKDE),28卷,不。7,1607 - 1620年,2016页。视图:出版商的网站|谷歌学术搜索
w .锅和l·陈,“CoFiSet:协同过滤通过学习成对偏好在集,”暹罗学报》国际会议数据挖掘(SDM (13)奥斯汀,页180 - 188年,TX,美国,2013年5月。视图:谷歌学术搜索
s . Rendle c .州长戴夫z Gantner, l . Schmidt-Thieme“BPR:贝叶斯个性化的排名从隐式反馈,”学报25日会议上的不确定性人工智能(可用' 09)蒙特利尔,页452 - 461年,QC,加拿大,2009年6月。视图:谷歌学术搜索
a . Krohn-Grimberghe l . Drumond c州长戴夫,l . Schmidt-Thieme”Multi-relational矩阵分解为社交网络数据使用贝叶斯个性化的排名,”学报》第五届ACM国际会议网络搜索和数据挖掘(WSDM的12),第182 - 173页,西雅图,佤邦,美国,2012年2月。视图:出版商的网站|谷歌学术搜索
t .赵,j . McAuley,即国王,“利用社会关系来改善协同过滤的个性化的排名,”学报》第23届ACM国际会议会议信息和知识管理(CIKM 14),第270 - 261页,上海,中国,2014年11月。视图:出版商的网站|谷歌学术搜索
曹r·潘黄懿慧周,b . et al .,“看到下面成了协作过滤”学报》第八届IEEE国际会议数据挖掘(ICDM ' 08),页502 - 511,比萨,意大利,2008年12月。视图:出版商的网站|谷歌学术搜索
y, y科伦,c . Volinsky“隐式反馈数据,协同过滤”学报》2008年第八届IEEE国际会议数据挖掘(ICDM ' 08),页263 - 272,比萨,意大利,2008年12月。视图:出版商的网站|谷歌学术搜索
l·杜、李x和y . d .沈”用户图正规化成对矩阵分解为项目建议,”学报》第七届国际会议上先进的数据挖掘和应用程序(ADMA的11),页372 - 385年,柏林,海德堡,2011年。视图:出版商的网站|谷歌学术搜索
w .锅和l·陈,“GBPR:集团协同过滤、基于偏好的贝叶斯个性化排名看到下面成了”第23届国际联合会议上人工智能学报》(IJCAI”展出13),第2697 - 2691页,北京,中国,2013年8月。视图:谷歌学术搜索
Rendle和c .州长戴夫“改善成对学习项目从隐含的反馈建议,”第七届ACM国际会议程序网络搜索和数据挖掘(WSDM 14),页273 - 282,纽约,纽约,美国,2014年2月。视图:出版商的网站|谷歌学术搜索
s . Rendle c州长戴夫,l . Schmidt-Thieme”next-basket建议都可以个性化的马尔可夫链,”19国际会议的程序万维网(WWW的10)罗利,页811 - 820年,数控,美国,2010年4月。视图:出版商的网站|谷歌学术搜索
美国Rendle和l . Schmidt-Thieme”张量分解成对交互个性化标签推荐,”学报》第三届ACM国际会议网络搜索和数据挖掘(WSDM 10),页81 - 90,纽约,纽约,美国,2010年2月。视图:出版商的网站|谷歌学术搜索
y Shi, a . Karatzoglou l . Baltrunas m·拉尔森n .奥利弗和a . Hanjalic”CLiMF:学习最大化与协作少做过滤,排名倒数”学报第六届ACM会议推荐系统(RecSys 12),页139 - 146,都柏林,爱尔兰,2012年9月。视图:出版商的网站|谷歌学术搜索
g·塔卡克斯d . Tikk“交替最小二乘个性化排名”学报第六届ACM会议推荐系统(RecSys 12),页83 - 90,都柏林,爱尔兰,2012年9月。视图:出版商的网站|谷歌学术搜索
s·h·杨,长b, a . Smola h . y .咋和z h .郑”协作竞争过滤:学习推荐使用上下文用户选择,”美国第34国际市立图书馆会议在信息检索的研究和开发(" 11),第304 - 295页,北京,中国,2011年7月。视图:出版商的网站|谷歌学术搜索

医疗保健工程