文摘
随着信息技术的快速发展,信息过载已经成为一个非常严重的问题在网络信息环境。个性化推荐。当前的推荐算法,然而,面临一系列的挑战。解决这个问题的复杂背景下,一个新的上下文基于三方图模型的推荐算法提出了复杂系统的三维模型。提高推荐的准确性由物质扩散,通过热传导改善推荐对象的多样性,和平衡的准确性和多样性通过集成资源从而实现个性化推荐。实验结果表明,提出的基于三方图的上下文推荐算法模型优于其他传统推荐算法的推荐性能。
1。介绍
互联网的快速发展和智能手机的日益普及,人们可以访问的信息增加复杂的系统。获取信息变得困难,容易迷失在大量的信息。主要的数据包括信息网站和移动应用程序。如果数据给了一定的处理,信息可以被更多的用户友好和高效。与此同时,用户会被提供一个友好的经验,和信息提供者可能有更高的收入。所以,推荐系统应运而生(1- - - - - -4]。复杂的上下文信息的引入带来了更多的想法来改进推荐算法的效率。主要复杂上下文信息包括用户上下文信息,例如用户的年龄、职业、地区;物理上下文信息,如位置、天气和时间。有很多复杂的上下文信息,可以考虑推荐算法。上下文信息可以给用户带来更准确的推荐推荐系统的复杂的真实世界的应用程序(5- - - - - -9]。
通过应用推荐技术,用户不再是知识的被动接受者服务,但成为积极的参与者,直接影响服务的方式和内容。与移动信息服务的迅速发展和普及,数据采集技术的不断进步,我们可以收集的信息的维数不断改善(10]。传统上,只有“user-item”二维推荐模型认为收集的信息量。相对较少的数据可以获得相对较低的数据维度,但在移动信息服务的背景下,仅仅依靠“user-item”二维推荐模型不能生成一个用户对于一个给定的情景语境有效的个性化推荐(11- - - - - -14]。因此,它是非常重要和紧急的在特定的情况下为移动用户提供个性化的推荐。
有三种常用的上下文感知推荐算法,以及它们的上下文前置过滤,上下文预滤器和上下文建模。本文基于三方图的上下文推荐算法提出了三维模型。提高推荐的准确性由物质扩散,通过热传导改善推荐对象的多样性,和平衡的准确性和多样性通过集成资源从而实现用户的个性化推荐。这个算法主要关注项目高人气,提高推荐的准确性。实验结果表明,该推荐算法的精度和召回评价指标有明显的改善性能比传统的推荐算法。
本文的组织结构如下:的提醒2介绍了相关的工作。部分3的描述和理论背景下基于三方图模型的推荐算法。部分4介绍了实验过程和结果。相关工作的总结我们的提出的模型和算法,并给出论文的结论部分5。
2。相关工作
最重要的推荐算法的协同过滤算法和基于内容的推荐算法。然而,有一些问题难以解决的两个基本算法。因此,单一的推荐算法精度很难提高。许多学者已经将自己的目标从传统的推荐算法,重点研究基于上下文的推荐系统。
研究方向和应用领域包括购物、旅游、餐饮、和其他方面,但他们集中在提出改进的算法是基于传统算法。的对比各种算法基于上下文感知的优势和劣势是相对罕见。适用于不同的上下文感知算法的字段和数据类型不研究。康等人提出不仅关注明确的上下文信息,还隐式上下文信息。他们使用了包嗅探技术(15]。Ohbyung Kwona Jihoon金提出了一个方法来发现用户的肖像描绘用户的轮廓树(16]。自2012年以来,相关研究已经爆炸了。刀等人结合用户首选项和上下文交互信息,提出了一个基于地理位置的广告推荐算法(17]。Sanchez-Pi等人提出了建设一个基于知识的上下文感知系统(18]。Kasaki等人提出了一种局部自适应修正模型使用向量空间模型和保存时间来获取相关的信息(19]。昂格尔等人做了一个突破的情况下,提高推荐精度通过提取隐式上下文信息从用户数据20.]。
的对比各种算法基于上下文感知的优势和劣势是相对罕见。2016年以前,没有很多研究上下文感知推荐算法。其中大部分集中在协同过滤算法的研究。这样的研究是罕见的。有三种常用的上下文感知推荐方法和上下文前置过滤,上下文预滤器,和上下文建模21]。其中,李等人提出了一个新颖的电视系统,它结合了姿态控制、标签排名,和上下文感知,提供个性化的推荐(22]。蔡等人利用协同过滤生成语境概念本体(23]。霁等人提出了一种改进的基于聚类矩阵近似模型(24]。王等人提出了一个基于上下文的推荐模型分层树结构,第一层计算情况下转移,建议项目在第二层25]。
在上下文中推荐算法的研究,很多学者都有贡献。在上述现有文献的研究,一些只使用二维模型来计算推荐列表。大部分的论文3 d模型的研究集中在基于标签的3 d模型。研究方面相对狭窄和有限的(26- - - - - -30.]。本文中基于三方图模型的推荐算法。研究更多的创新和改善了精度的建议。
3所示。User-Item-Context三方图模型
3.1。三方图模型
上下文结合任务管理和解释的过程中直接集成建模环境的推荐系统。这一步包括识别用户和他/她的偏好从他/她的隐式和显式与系统的交互。这些首选项敏感用户的上下文和变化从一个环境到另一个地方。然后,所谓的上下文配置文件,用户的偏好在给定的情况下,可以定义的元组(用户、偏好和上下文)。这些元组可以被保存在一个数据库,必须定期更新跟踪用户的利益的进化。
应用程序上下文感知算法的基于上下文的收购。当前技术浅上下文收购已经可以实现。用户的经度和纬度位置、天气条件、时间信息,等,可以通过移动设备。年龄,性别,和其他信息,但深层信息处理目前相对较小,例如获得用户的位置类型、时间类型,和深层上下文信息,对算法有更大影响的建议。当前研究这种类型的信息主要是通过用户调查和由用户自愿提供。
中扮演重要的角色在用户的选择项。用户的兴趣也会由于环境迁移。如果上下文不介绍,兴趣的变化在不同的上下文中没有观察到。在不同的上下文中,用户可能会觉得不同的相同的项目。例如,人们会与朋友看动作片,但是他们可能会选择其他类型的电影时和家人在一起。传统算法忽略了这些兴趣迁移,建议不够个性化。形成的三维模型中介绍了更有效地改进推荐算法的局限性。
在基本的图论算法,两偶图中常用的相关网络模型。两偶图中,有两组集和 :
推荐的项目实现两偶图模型。我们应该确保两组之间的十字路口是一个空集和不受对方的影响。两个集合中的每个元素都被视为一个不同的点图,代表用户的一个二维模型项目。同一组之间的元素是没有连接的边缘,和不同连接之间的边缘显示用户喜欢这个项目,形成一个二元组 。构成一个无向两偶图模型。两偶图模型如图1。
三方图模型是一个两偶图模型的升级版本,可以视为一个合并的两个由两部分构成的图。它包括三组 ,在哪里集合 。每组确保二二十字路口是空集,所以分三组的图可以获得。类似于两偶图模型,集合是保证是无底洞。有两套two-tuple关系图。有两组边缘连接, 和 。前者表明用户喜欢这个项目,而后者表明这个项目是在一个特定的上下文中。我们可以通过三个数组实现推荐的关系。三方图模型图所示2。
通过数据1和2的概念模型是直观的感受。项目作为一个换乘站,与用户的通信信息,与上下文信息通信,最后推荐的项目列表是一个推荐算法。与传统的算法相比它更全面。
3.2。三方图模型基于大规模扩散
当两偶图用于获得推荐的结果,与用户相关的项目获得物品的偏好。常用的算法质量扩散算法和热传导的算法。从现有的文献可以被理解,质量扩散算法节能导热算法并不是。这两个算法领域的推荐算法中扮演不同的角色。质量扩散算法通常比作一个凸透镜,它可以用高温重点项目。热传导算法就像一个凹透镜,可以集中在项目哪个更不受欢迎,从而增加多样性的建议。
在结果中,每个用户的最近邻居发现,假设的选择这些最近的邻居用户的自己的选择有关。在寻找目标用户的评分的项目 ,最邻近的用户的评分项目也发现。然后,最近的邻居的得分的均值计算。如果均值大于预测分数和绝对值超过一个阈值不同,结果都是预测的分数增加均值和预测值的商。如果均值等于预测结果或绝对值差小于一个阈值,不执行操作。如果均值小于预测评分,结果都是预测的分数减去均值和预测值的商。
每个项目下面所示的能量方程:
根据用户的历史行为,用户的偏爱的项目。一个意味着用户喜欢的项目,0表示不喜欢。用户首选项的总数是该算法的总能量。
项的扩散的第一步是给用户。用户获得的能量项,项目向用户传播能量通过同样的能量分配的每一项每一个购买的用户。用户获得的能量所示以下方程: 在这 代表了项和的程度代表了初始能量拥有的物品。每个用户所拥有的能量值是通过一步扩散,然后执行第二步。
第二步扩散来自用户的项目,分配用户的能量同样相关的物品,和总结收集到的每一项能源获得的总能量,见以下方程: 在这 代表了用户和的程度bα是能量通过用户如上所述。模型的推荐系数之一是获得的平均获得的能量在第一步第二材料扩散。
偶图,图中的元素所取代,但这个想法的一式两份的方法没有改变。两步扩散用于生成推荐的概率。第一步是传播项目的上下文。初始能量与用户是否喜欢的项目。一个意味着用户喜欢的项目,0表示不喜欢。根据上下文之间的关系和项目,项目的能量均匀分布。对于每个出现的上下文,每个上下文获得的能量是能量的总和分配给所有相关的项目。 在这 表示程度的上下文中,代表最初拥有的能量项,和对应于彼此。每个上下文表示的能量方程。上下文的能源价值扩散得到的第一步,然后是第二步仍需要传播。
第二步是项目的上下文。像第一步,能量分为上下文中获得的所有物品,每件的能量积累和获得: 在这 代表了项和的程度代表着能量中获得的价值。在第二个扩散,能量的平均值从之前获得扩散。
从图可以看出3通过处理三方图模型的基于大规模扩散,可以计算项目的推荐值和推荐序列可以获得。推荐序列 。
(一)
(b)
3.3。三方图模型基于热量减少
本节讨论热传导方法。如前所述,热传导方法是一种不同的方法,建议不太受欢迎的产品为用户增加的多样性的建议。基于大规模扩散的三方图模型,该模型分为两个由两部分构成的图,分别和两个导热方法。最后,两个图的值融合获得推荐的系数模型。
每一项的能量是在上面提到的一样:
根据用户的历史行为,用户的偏爱的项目。一个意味着用户喜欢的项目,0表示不喜欢。总能量在热传导方法不是守恒的。
同样,传导的第一步从项目给用户。用户获得的温度项,项目用户传输的温度。转移温度的方法划分的和用户最喜欢的物品的温度通过用户的程度,和由用户获得的温度以下方程: 在这 代表了用户和的程度代表了初始温度拥有的物品。温度被每个用户是通过传导的第一步,第二步办理紧随其后。
第二步办理来自用户的项目。每件的温度的总和所有用户喜欢它的温度除以程度的项目: 在这 代表了用户和的程度温度通过用户如上所述。通过热传导的第二步,平均气温值了;即获得粒子温度价值是一种推荐的热传导系数的方法。
三方图划分方法基于热传导方法符合物质扩散。为item-context两偶图,计算的温度环境温度相关项之和除以上下文: 在这 表示程度的上下文中,代表了初始温度被项,和对应于彼此。每个上下文方程表示的温度。环境的温度是通过传导的第一步,第二步是进行温度。
第二步是获得物品的温度从上下文项和分裂的温度环境的与项目相关的学位项目: 在这 代表了项和的程度代表了温度,通过上下文。在第二导电,能量价值从之前获得扩散系数平均获得另一个建议。
处理基于热传导的三方图如图4。处理基于热传导的三方图节点吸收资源的相邻节点根据相邻节点的数量和边缘的重量的比值。后三方图分为两个由两部分构成的图,两个推荐系数。为了获得最后的推荐系数,推荐系数的平均值获得的两个是作为最终的推荐系数:
(一)
(b)
3.4。混合模型
质量扩散和热传导方法不同的推荐系统改善推荐效果。质量扩散法侧重于提高推荐的准确性和高人气的条目。热传导方法侧重于改善建议的多样性。因此,这两种方法的结合也是一个因素,通常被认为是确保准确性的目标和增加多样性的建议。
当混合这两种方法,它通常是一个线性混合。我们设置了参数λ在最初由三部分组成的图模型,引入参数,并构造一个混合模型:
它是一种常见的方法在混合模型改变参数的值λ实现模型的最优效果。本文对模型的影响,不同的参数值也将探索。
4所示。实验分析
这个实验的硬件环境是英特尔酷睿i5处理器,8 g内存。软件环境是64位的Windows操作系统,VMware虚拟机工作站Pro, CentOS7操作系统,开放JDK1.8 Python3.7 Python3.7,蟒蛇。
这个实验的数据主要是问卷调查的大学生看电影背景。共有107用户的数据收集。为了确保数据的准确性,他们并不过于稀疏。消除一些无效的问卷调查。96用户的数据被保留,包括2145年的数据。
在这个实验中,原始的数据集是关于用户的评级项目的范围是1到10分。用户的评级反映了用户的满意产品。推荐算法应该是指这个满意度。
如图51、用户A和用户B得分项,但比分是完全不同的。所以,用户之间的相似性很低。因此,当建立了三方图模型,只有用户选择喜欢的物品。之间的连接用户和项目表明,用户更喜欢一个项目超过一定等级范围。
(一)
(b)
在这个实验中使用的评价参数是一个标准来评估推荐结果的质量。推荐结果的精度和召回率。精度的措施建议的比例项结果相关的用户,也就是说,那些用户实际使用的推荐项目。召回措施的比例消耗物品是正确的建议;即项目分数与用户相关建议的系统。查全率和查准率通常被认为是在一起的两个方面建议的质量。召回和精确给出如下: 在哪里支安打的数量是正确的建议,items_relevant是所有可能的项的数量,可以建议对于一个给定的用户,然后呢items_recommended是物品的数量推荐给用户。的精度和召回率在0和1之间。越接近1,推荐算法的效果越好。接近0表明推荐算法的推荐效果很差。
本文还利用新颖性判断一个项目的新颖性: 在这表示程度的推荐列表中的项l代表推荐列表的长度。本文的平均支持率用于表示新奇,值越小,越新颖的项目。
这个实验的原始数据是关于用户的分数电影在某些情况下。它转换为用户和项目之间的联系,项目和上下文,用户和项目之间的联系。我们建立项目和上下文之间的联系,和形式如表所示1。
如果用户提供的项目速度大于或等于8,我们认为用户是很喜欢的物品。基于此规则建立之间的连接用户和项目,以及项目和上下文之间的联系,过滤数据的总数是1451。一些相关的预测了这些数据。这个实验中,两个控制实验设置来确定协同过滤算法下的精度和召回率和user-item两偶图算法和算法的结果进行比较。
在实验中,用户1101为例。语境下的电影推荐选择1、5、9、13、17日和21日和5,10,15日和20个不同的电影分别推荐。比较结果的准确率和召回率数据所示6和7。
(一)
(b)
(c)
(d)
(e)
(f)
(一)
(b)
(c)
(d)
(e)
(f)
我们计算的新奇的建议。新奇的计算基础是20推荐项目时如表所示2。
它可以从实验结果的比较,在实验的数据集,该算法的性能还不够优秀。精确率不降低,召回率也有所降低。推荐的条目的数量是10时,算法的精度和召回率是最优的。与此同时,新奇也有所改善。与双边的地图推荐算法相比,项目推荐的三个地图更多的小说。
实验后,三方图模型的精度和召回率基于热传导几乎是零,和新颖性是非常高的。由于算法的差异,项目集中在不受欢迎的,和推荐的结果不符合实际需要,也不适合这个数据集。
在混合算法,几个混合参数的选择,0.1,0.3,0.5,0.7和0.9。我们计算的准确性,回忆起和新奇的每个结果如表所示3。
混合模型算法的性能已基本稳定的价值λ大于0.5。参数的变化几乎没有变化对算法的结果。新奇的收缩随着参数的增加,作为参数精度的增加而增加。
5。结论
本文解决问题复杂的环境中,一个新的上下文推荐算法基于三方图模型提出了复杂系统的三维模型。这个算法主要关注项目高人气,提高推荐的准确性。推荐结果的范围很窄。的部分原因是,数据集内的物品的数量并不大,和推荐结果并不明显。迫切需要改善。最受欢迎的项目,应给予一些处罚机制,使更多的用户兴趣。然而,算法的新奇略有改进,算法的性能趋于稳定后,模型参数达到一定值(5- - - - - -14,26- - - - - -30.]。
数据可用性
使用的数据来支持本研究的发现可以要求从相应的作者。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
这项工作得到了国家社会科学基金(18 ctq030)。