文摘
电子商务和互联网的发展和普及,越来越多的受到关注为用户个性化推荐。传统的用户兴趣模型只考虑项目的用户行为,忽略了用户的上下文。指向短缺,上下文相关的因素没有被认为是在以前的作品,结合移动计算环境的特点,本文研究的算法和模型移动服务的建议。基于指定上下文的推荐算法滤波提出了在移动计算环境中。分类是聚合的背景下,通过分组一起同一类别的场景。通过实验,我们发现改进的个性化推荐算法优于常见的协同过滤算法。
1。介绍
主要的数据包括信息网站和移动应用程序。如果数据给了一定的处理,信息可以被更多的用户友好和高效。与此同时,用户会被提供一个友好的经验,和提供的信息可能会有更高的收入1]。因此,推荐系统应运而生。
推荐算法的推荐系统的重要组成部分2]。主要的协同过滤推荐算法的推荐算法,基于内容的推荐算法,和混合推荐算法3- - - - - -8]。深入研究推荐系统允许用户个性化的推荐,这大大节省了他们的时间来搜索信息。同时,正在改善,而推荐系统用户的个性化推荐的需求变得越来越高;更准确的推荐是未来发展方向9]。现有的算法上的改进推荐算法很多,所以许多学者将上下文感知推荐(10- - - - - -15]。上下文信息成为一个重要的作用来提高推荐的效果。
上下文信息的引入带来了更多的想法来改进推荐算法的效率。主要的上下文信息包括用户上下文信息,例如用户的年龄、职业、地区;物理环境,如位置、天气、时间。有很多上下文信息,可以考虑推荐算法(16]。上下文信息可以带来更准确的推荐系统的推荐给用户。有三种常用的上下文感知推荐方法,上下文前置过滤,上下文预滤器,和上下文建模17]。结果,上下文感知推荐算法逐渐成为一个受欢迎的研究趋势。本文结合移动计算环境的特点,基于指定上下文的推荐算法滤波提出了在移动计算环境中。
本文结构如下的提醒:部分2介绍了相关的工作。节3的概念模型,提出了基于上下文感知推荐系统理论的环境敏感。部分4提出了一种基于上下文的推荐算法在移动计算环境中。部分5介绍了实验过程和结果。相关工作的总结我们的提出的模型和算法,并给出论文的结论部分6。
2。相关工作
协同过滤算法的引入后,学者们更多的研究在推荐系统。最重要的推荐算法是一个协同过滤算法和基于内容的推荐算法18]。然而,有一些问题难以解决的两个基本算法,如协同过滤算法有一个冷启动和高稀疏,和基于内容的推荐算法难以处理多个属性。因此,单一的推荐算法的推荐的准确性难以提高(19]。许多学者已经将自己的目标从传统的推荐算法,重点研究基于上下文的推荐系统(20.]。
国外研究已经相当富有。研究方向和应用领域包括购物、旅游、餐饮、等方面。但他们关注提出改进算法,基于传统算法。的对比各种算法基于上下文感知的优势和劣势是相对罕见。适用于不同的上下文感知算法的字段和数据类型不研究。其中,康et al。21]提出不仅关注显式上下文信息,还隐式上下文信息。他们使用包嗅探技术。Kwona和金22)提出了一种由用户发现用户的肖像描绘轮廓的树。老爷et al。23)结合用户首选项和上下文交互信息,提出了一个基于地理位置的广告推荐算法。Sanchez-Pi et al。24提出了建设一个基于知识的上下文感知系统。Sanchez-Pi et al。25)提出了一种局部自适应修正模型使用向量空间模型和保存时间获取相关的信息。
李等人。26)提出了一种新颖的电视系统,它结合了姿态控制、标签排名,和环境敏感,提供个性化的推荐。Cai et al。27)使用协同过滤来生成一个上下文本体概念。霁et al。28)提出了一种改进的基于聚类模型矩阵近似。王等人。29日)提出了一种基于上下文树结构层次推荐模型,计算情况转移在第一层,第二层和推荐项目。昂格尔et al。30.]做了一个突破的背景下,提高推荐的准确性,从用户数据中提取隐含的上下文信息。
3所示。概念模型的环境敏感
3.1。上下文信息的分类
所谓的上下文信息是一个一般的概念,它可以分为用户上下文信息,物理上下文信息,上下文信息,网络上下文信息,等等。用户上下文信息包括一些个人信息,如用户的性别、年龄、地区、职业、和情绪。物理上下文信息包括地理位置、温度和天气。上下文信息包括季节的时候,早上或晚上,周末或工作日。这个上下文信息的获取有利于更好的建议。如果系统有这样的环境,它可以推荐合适的广告根据地理位置,合适的音乐情绪,并决定是否根据网络视频会自动加载速度。
如图1,上下文信息当前定义的类型非常多样化,但并不是所有上下文信息是可用的。上下文感知的应用算法是基于上下文的收购。浅层次的情况下收购技术已经可以实现。移动设备可以获得用户的经度和纬度位置、天气条件、时间信息等,并且可以通过调查获取用户的进一步信息,如年龄和性别。然而,目前深层信息处理是相对罕见,例如获得用户的位置类型和时间类型。深上下文信息有助于推荐算法。在当前的研究中,这些信息主要是通过用户的自愿的调查。
3.2。模型建设
相关研究上下文信息的建议是增加,和个性化推荐情况起着重要的作用。用户利益的范围下,有些飘在不同上下文的利益,和更好的建议可以通过学习获得的变化情况。目前,环境敏感模型具有相对一致的定义。
上下文信息的收集用户的信息,一般用 ,这是 ,代表一组上下文。和在一组表示一个上下文元素开始的,而代表一个共同上下文元素。上下文信息的分类已经节中描述3.1。一些部分的上下文3.1可以选择设置形成本文的上下文集合。的影响可以探索一些上下文信息的推荐模型。
上下文感知推荐模型主要是收集用户的上下文信息,历史的行为趋势,个人喜好,和其他信息。通过过滤和计算,他们可以应用于个性化推荐提供更准确的推荐。
作为显示在图2,环境敏感的推荐模型可分为三层。第一层是数据采集层,它收集用户的各种类型的数据。第二层是数据处理层,过滤和处理数据。第三层是推荐的服务层,这是由该算法形成个性化推荐。协会服务的每一层提供了一个上下文感知的手段。
在传统的推荐算法,与用户和项目相关的得分矩阵,称为user-item模型,表示为 。 代表用户组, ,和表明项目集, 。 表示一组得分;代表一个用户的评分的项目 。 表示用户的数量表示条目的数量。上述公式构成二维分数矩阵之间的用户和操作的项目,可以使用协同过滤算法获得一个推荐的结果。
环境敏感的推荐模型,介绍了环境因素,而不再是一个二维模型,也就是说,它变成了一个user-item-context模型,表示为 。 代表用户集合, 。 表示一组项目, 。 表示一组上下文中, 。 表示用户的数量,表示物品的数量显示的数量情况。的意思项目的仍然是用户的评级。
在三维模型中,比分是表示为每一个小方块分割出来。三维坐标系中的立方体是评分数据的集合R。
4所示。环境敏感的建议
4.1。基于特定上下文的推荐算法
在相同的情况下,用户的选择可能有相似之处。基于这一理论,算法实验可以进一步发展。当探索环境因素,本文选择三种类型的分类情况。有一个包含个境况因素和multisituation因素之间的关系,比如上下文(在家里),包括(工作日,周末和假日),和(孤独,与朋友,家人,和恋人)。它实际上是复合上下文信息。通过上下文信息的聚合,探索是否存在一致性在用户的上下文中选择聚合。
这个算法是一个基于上下文的前置过滤算法,这是一个上下文选择的过程。算法的目的是将三维模型转化为一个二维模型通过上下文滤波。比分预测函数, 应该表示为下面的公式(1): 在哪里 代表三维模型的得分矩阵,上下文的门槛设置表明上下文信息 。 是估计分数根据基于用户的协同过滤算法在特定情况下的相似之处。
在得到得分矩阵,计算用户之间的相似性。皮尔森相关系数计算应表示为下面的公式(2): 在哪里代表用户的评分为项目 。 代表一个用户的平均价值得分。代表用户的评分为项目 。 代表一个用户的平均价值得分。通过计算其相似之处,形成相似矩阵如下:
得到相似用户的利益后,可以通过以下公式计算预测评分(4)。
预测的分数决定了用户的兴趣度。分数越高,用户感兴趣。算法1的过程可以概括如下:
|
||||||||||||||||||
4.2。基于用户上下文的推荐算法
在上述算法中,上下文信息是一个单独的因素。上下文信息不纳入算法模型,因此上下文建模算法。
上下文建模算法分为启发式和模型。有很多文献和论文研究的基于模型的上下文建模算法。不是本文的重点。本文提出的算法的上下文信息和过程集成 三维模型。我们提出一个基于用户上下文的推荐模型。
基于用户的上下文是评分矩阵 构建,方法和步骤是相同的。根据公式计算皮尔逊相关系数,计算用户的上下文相似性。
在该算法中,我们使用用户作为一个例子来预测对项目的评分在的背景下 。的最近邻用户需要被发现,用户相似矩阵可以得到所需的数据公式。在所有获得用户相似性,头n个相似的用户选择最近的邻居,和得分的项目的形势下预测是基于这些用户的评分数据。
为了获得用户的评级根据上下文 ,我们发现评级最邻近用户的上下文设置项 。加权操作结合用户相似性和执行上下文相似性在上述获得的。 在哪里 。 是用户的相似性, 目标上下文之间的相似性和当前上下文。
得分可以获得的结果。该算法是基于用户的上下文建模算法,和上下文模型中起着重要作用。算法描述如下:
|
||||||||||||||||||||||||
4.3。基于项目的上下文的推荐算法
上面所讨论的,基于用户的启发式的上下文模型,该算法是类似的讨论。基于项目上下文推荐模型也是一种推荐算法基于上下文建模。
首先,为了建立基于项目背景矩阵 ,用户的信息需要被转换。我们计算的平均分数相同的物品相同的情况。
然后,我们计算上下文使用皮尔森公式基于项目相似。
在该算法中,我们使用用户作为一个例子来预测对项目的评分在的背景下 。的最近邻用户需要被发现,项目相似矩阵可以得到所需的数据公式。在所有获得的项目相似,头n个类似项选为最近的邻居,和项目的得分的形势下预测是基于这些项目的得分数据。
为了获得项目的评级根据上下文 ,我们发现评级上下文设置最邻近的项目背景 。加权操作执行结合项目相似性和上下文相似性在上述获得的。
。 项的相似性, 目标上下文之间的相似性和当前上下文。
|
||||||||||||||||||||||
5。实验分析
这个实验的硬件环境是英特尔酷睿i5处理器,8 g内存。软件环境是64位的Windows操作系统,VMware工作站支持虚拟机,分OS7上市操作系统,开放JDK1.8 Python3.7, Python3.7蟒蛇,PyCharm-community。
这个实验的数据主要来自大学生的问卷调查是关于看电影的上下文信息。107用户的数据被收集。为了保证算法的准确性,消除一些无效的问卷调查。96用户的数据被保留,包括2145年的数据。
推荐系统的质量主要是用一些指标来衡量。预测的准确性在推荐系统是极其重要的。主要从根均方误差(RMSE)和平均绝对误差(MAE)。
均方根误差和平均绝对误差之间的偏差程度,计算预测值和真实的价值。值减去预测值的真正价值的重新计算,和获得的结果值越大,偏离的程度就越大。相反,更准确的预测算法。当判断算法的优缺点根据这两个参数,将小的值。
传统预测算法设置为这个实验的控制对象,以便后者获得的实验与实验结果相比,二维算法。
在本文中,基于用户的协同过滤算法被选中。根据皮尔森相似系数,这部电影的最近邻,我们用它们来预测计算。几个经典的协同过滤算法及其改进算法选择,基本资讯,资讯手段,然而Zscore,然而基线,分别代表基本的协同过滤算法,基于平均得分的协同过滤算法,基于评分标准化、协同过滤算法和协同过滤算法基于基线得分。与此同时,为了避免偶然性错误,以下实验设置5倍交叉验证,并对结果进行评估使用的RMSE值和梅。
协同过滤算法的推荐精度取决于最近的邻居的数量。本文四个值被选为代表,和不同价值观代表最近的邻居的最大数量。
根据表1和2,然而,基线算法(基于基线分数)的协同过滤算法显然不如其他算法,表明它不适合的问题。所以,我们忽略它在接下来的实验。
它可以观察到数据3和4该算法的优点和缺点并不总是相同的。在不同值,推荐算法的预测效果的变化。总的来说,邻居的最大数量的增加伴随着预测精度。它上升,然后下降。如果该值选择约,预测效果最好。基本的协同过滤有较大的RMSE和梅值时值较小,但它显示了优势当k超过10。当其他两个算法也显示优势不到15,基于评分标准化的协同过滤算法总是比基于评分的协同过滤算法平均水平。
为了实现基于特定上下文的推荐算法,我们最初筛选和组织数据集,如图5上下文信息有一个包容的关系。上下文信息的集合就像一片森林。在这里,我们选择看电影的三个属性,他们是时间,地点,和公司,形成了三棵树。有父节点和分支,每个,分别代表了特定的看电影的行为。
我们选择6到12上下文信息聚合,结果如下。
根据表3,这导致一个聚合的六种不同的上下文,即,在家里,在看电影,一个人,在周末,在工作日和节假日。选中的情况必须是符合现实的逻辑。通常,在这个上下文信息,人们看电影的频率将会增加。为每个上下文环境中,我们使用协同过滤算法来预测和推荐结果在这种情况下。最近的邻居数量不同,我们会得到不同的结果在表4和5。
几个选择上下文的性能影响是不同的,为了更直观地观察算法的优缺点并比较与传统的协同过滤算法。
通过以上实验结果,它可以观察到,RMSE和梅的价值越小,更好的预测效果。相反,推荐算法更有效。在图6,实线表示传统算法,得到的结果和折线表示改进precontextual过滤算法获得的结果。
在不同的情况下,算法的性能是不一样的。在上面的六个环境,有四个环境比传统的算法无论最近邻的价值。他们在家里,一个人,在周末,节假日,最近的邻居在不同情况下的最佳值是不一样的。另外两个环境中,在电影院和工作日,不适用于precontextual过滤算法,获得的预测效果不如传统的协同过滤算法。同时,可以看出最大值的最近邻算法几乎没有影响。
6。总结和未来工作
在本文中,提出了基于上下文的推荐算法和实现。比较该算法和传统算法,新算法比传统的算法作为一个整体,但是,新算法在某些情况下并不适用。在六上下文获取后聚合中,只有四个环境优于常见的,和其他两个上下文不足够好适用的算法。
数据可用性
使用的数据来支持本研究的发现可以要求从相应的作者。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
这部分工作是支持湖南省社会科学基金会(16 ybq003),长沙城市科学和技术局(k1705072)和湖南省社会科学成果评价委员会一般项目(XSP18YBC166)。