研究基于电子商务平台的个性化推荐算法

文摘

针对数据稀疏和及时性在传统电子商务协同过滤推荐算法,当构建user-item评级矩阵,本文利用大宗商品电子商务系统的功能属于不同级别填写nonrated物品通过计算射频/ IRF商品相应的水平。在推荐预测阶段,考虑到推荐系统的及时性,时间加权基础建议采用预测公式设计个性化推荐模型通过整合水平充填法和评级。真实数据集的实验结果验证了算法的可行性和有效性,它拥有更高的预测精度与目前的推荐算法。

1。介绍

互联网的快速发展和电子商务规模的不断扩大,商品数量和种类迅速增加。商家通过购物网站提供大量的商品和客户通常花大量的时间去寻找他们的商品。浏览大量无关的信息和产品将使消费者由于信息超载运行。在电子商务时代,用户需要电子购物助手,可以推荐有趣的或令人满意的商品根据用户的兴趣和爱好。为了解决这些问题,个性化推荐系统中(1]。

个性化推荐推荐信息和商品用户根据用户的兴趣和购买行为。个性化推荐系统是一种先进的商业智能平台的基础上建立了大规模的数据挖掘,它旨在帮助电子商务网站为客户提供完全个性化的决策支持和信息服务。基于电子商务平台的个性化推荐技术在学术界和产业界被广泛提及。建议因素通常是基于网站畅销商品,用户的城市,过去的购买行为和购买历史来预测可能的用户的购买行为。

传统的协同过滤(CF)算法数据稀疏和冷启动的问题。随着计算机网络技术的迅速发展,个性化推荐在电子商务环境下面临着新的挑战,更快的及时性,准确性更高,更强的用户个性化。其主要特点是考虑实时情况的影响。传统的协同过滤算法的基础上,添加三个创新点:一个更合适的填充数据方法nonrated商品;添加时间和给高重量数据接近评价时间和低体重数据远评价时间;和探索的影响的最近的邻居推荐准确性和获得最优加权集。通过上述变化,可以提高算法的预测精度,可以满足用户的个性化服务的需要。

本文的其余部分组织如下。节2,我们提供国内外相关工作的概述。部分3介绍了电子商务推荐系统的关键技术。部分4提供了实验数据集和评价指标,介绍了实验方案,实验结果及其分析,其次是结论和未来的工作5。

持续改进的电子商务平台,电子商务个性化推荐系统逐渐形成一个完美的系统。学术界和电子商务企业越来越多的关注推荐系统。目前,国内外许多大型网站功能为用户提供了建议和许多的原型出现了个性化推荐系统,取得了良好的应用效果。很多谴责的推荐系统如表所示1。


场	个性化推荐系统

电子商城	Amazon.com, eBay,阿里巴巴
电影	MovieLens, Netflix.com, Moviefinder.com
消息	PHOAKS、GroupLens p-Tango
网页	Siteseer QuIC, R2P METIOREW
音乐	Music.Yahoo.com,林格,可可

利用各种社会关系的社交网络服务推荐研究取得了很大的进步,成为个性化推荐研究的热点领域。Bonhard和船闸研究社会背景对推荐结果的影响,结果证明,当用户购买商品,他们倾向于接受熟人的推荐2]。Sinha和Swearingen实验进行多个在线推荐系统的帮助,实验结果表明,当在线系统和朋友提供建议,用户倾向于选择后者(3]。Caverlee et al。4)通过在线社交网络服务构建信任框架,采用信任和反馈信息生成推荐结果列表,较高的推荐精度。Adomavicius和Tuzhilin5)提出了多维空间的推荐算法,并指出有必要根据具体情况添加推荐功能维度。阮等人提出了一个非线性概率算法我们上下文推荐模型。在推荐过程中,该算法使用高斯过程,这不仅显示反馈信息,也可以使用隐式反馈信息。梯度下降法是用于优化,提高了模型的可扩展性(6]。文献[7]比较四个主要的推荐技术,介绍了研究电子商务个性化推荐领域的热门话题。研究[8]基于偏好相似性提出了个性化产品推荐,推荐信任,和社会关系。

针对电子商务的个性化问题,许多国内学者进行深入研究。黄和Benyoucef电子商务个性化推荐的复习有关文献,说明社交商务的概念,讨论了有关社交商务和电子商务的设计特点,并提出一个新的模型和一组原则指导社交商务的设计(9]。李等人提出了一个电子商务个性化推荐算法,综合商品相似,推荐信任,和社会关系8]。实验结果表明,社会关系的社交网络可以用来改进推荐算法的准确性。张和刘提出了个性化推荐算法集成信任关系和时间序列10]。在另一篇论文11),社交网络整合各种上下文信息的推荐算法。根据用户的地理位置和时间信息,该算法深入探讨了社会关系的潜在用户,帮助用户寻找其他用户提供类似的偏好。然后,结合相应的建议是由移动用户的社会关系,它有效地解决了推荐精度。在文献[12),作者全面考虑用户偏好的影响,并提出地理便利,和朋友团购的折扣优惠券推荐系统,促进商品与敏感的位置。

不难发现通过上述算法的深入分析,现有的个性化推荐算法仍有许多不足:偏好模型的可扩展性差,无法适应动态变化的数据集,导致没有时间信息,可以使用,而且无法解决冷启动问题的很好。针对上述问题,基于综合考虑的因素,如推荐系统的及时性,采用时间加权基础建议预测公式和不同的权重根据评级,评级数据,提高电子商务推荐系统的推荐质量。

3所示。推荐系统的关键技术

为了更好地解决数据稀疏和评级时间因素的问题,本文采用水平充填方法预测nonrated物品,最后结合时间权重推荐预测阶段提高推荐精度的算法。

3.1。分层充填法

传统协同过滤算法CF集nonrated项目的平均或一个固定的值,例如,3(等级1 - 5),如表所示2。三是设置中间1 - 5的评级。它没有考虑用户偏好和纯粹的集值作为预测评级。不同的用户提供不同的项目评级。这种方法的优点是简单,但它不能解决的问题,传统的协同过滤方法在用户矩阵稀疏。


用户/项目	第一项	第二项	项目3	第四项

用户1	1	3	4	3
用户2	3	2	3	3
用户3	3	5	2	3

降低评级的稀疏矩阵,本文采用水平填补评级矩阵构造方法。对于电子商务网站来说,每个商品拥有自己的类别,一个父类别。也就是说,大宗商品电子商务的水平和不同商品的不同层次结构的概念,如图所示1。一个商品的水平被认为是建设评级矩阵。对大宗商品在不同的水平,本文认为其下属商品填补不同的预测评级通过计算。本文结合了传统的分类方法和用户评级数据,通过计算初步评级了nonrated推荐用户的数据。这个方法是用来构造一个新的user-item评级矩阵。

额定数据,评级被提取到所属的类别。建设评级矩阵通过协同过滤技术,为一个类别,其额定频率(RF)计算,计算方法如下所示:

项额定频率(IRF)代表评分项目的重量,计算方法如下所示: 在哪里表示额定数据和自动填充的总量预测评级。代表自动填充的总数预测评级。

提出了一种user-item评级矩阵构造算法,自动填充的评级nonrated数据大于阈值。分层充填方法的设计流程如下所示:输入:初始user-item评级矩阵。输出:用户评分矩阵预测评级后填满。

步骤1。计算每个类别的矩阵。

步骤2。填写的平均项目评级大于阈值的评价矩阵。

步骤3。为新项目评分矩阵,3是自动填充,最后构造user-item评级矩阵。

通过计算特定类别的项目,本文填充分数最高的-类物品的而不是简单地填充数据集,它可以降低数据稀疏。最后,算法自动填充新项目新项目,旨在解决冷启动。

3.2。改进的推荐及时性

CF算法不考虑时间的影响评级数据,对项目在不同的时刻不同的用户访问同样的评级。利益和偏好不同的用户动态地改变随着时间的推移,所以当不同用户在同一项目不同的利益。然而,如果评级是相同的,他们可能会被视为相似的邻居用户,进一步影响推荐质量。本文介绍了时间函数,如下所示: 在哪里代表了次用户在项目的利益。时间函数是一个单调递减函数,随时间的增加时间和保持体重。即更新数据,更大的重量和时间的函数。通过这种方式,推荐质量是解决时间的影响。

3.3。基于时间加权预测函数

CF算法预测项目的评级由当前用户根据评级相似的用户或项目,显示如下: 在哪里代表用户评级之间的相似性和和(5)计算用户之间的相似度和由皮尔森相关系数: 在哪里代表项目集被用户和。和分别代表项的得分由用户和,和分别代表所有项目的平均评分的用户和。

时间函数添加(4)和加权预测评分的项的目标用户改进:

在这里,显示为(3),每个评级项目仅拥有一个重量。最新评级给出的重量和过去的评分给出了用小重量,这有助于更准确地预测。

3.4。新推荐模型(NewRec)

针对数据稀疏和及时性在传统协同过滤推荐算法,本文结合分层充填法和时间CF的基础上,提出了一种新的个性化推荐算法,NewRec。NewRec推荐模型如图所示2。整个推荐模型分为三个主要模块:数据预处理模块,减少稀疏模块,并加权推荐模块。

数据预处理模块输入用户信息,包括用户的购买记录,用户评级商品和网站上的用户持续时间。这个有用的信息转化为可接受的数据格式的推荐方法,形成user-item评级矩阵。

减少稀疏模块,所有物品user-item评级矩阵,射频/ IRF商品的相应水平的特定值计算并填写评级矩阵,解决了数据稀疏问题。

在近邻推荐模块,考虑到推荐系统的及时性,采用时间加权基础建议预测公式计算目标项目的预测评分,排名,并选择最高项目推荐集。

4所示。实验分析

4.1。数据集

本文从数据集https://movielens.org/收集的,这是GroupLens在明尼苏达大学研究小组。这个数据集实现网站用户个性化推荐的协同过滤技术。系统采用用户评分从1到5。等级越高,就越感兴趣的用户。这个数据集包含了1682部电影的评级943用户。根据最新的统计,有超过70000个用户和6600级电影MovieLens网站的数据库中。目前,数据集在MovieLens网站丰富,清晰,真实,准确,所以他们一直广泛应用于个性化推荐系统的模拟试验和权威的测试数据来源。在此仿真数据集,本文设计一个合理的和可行的评价标准,进行比较分析的推荐质量改进算法。实验结果证明了改进算法的有效性和合理性。

4.2。实验方案

协同过滤推荐算法,其实际影响电子商务个性化推荐系统主要受两个因素的影响:数据稀疏和最近的邻居的数量。因此,这个实验设计以下两个方案。

CF算法,基于时间的函数推荐(简称TimeRec),分层充填(高频),摘要NewRec下不同程度的数据比较稀疏。不同程度的数据稀疏可以真正模拟电子商务推荐系统的工作条件和验证推荐效果的变化在不同条件下的有效信息。

在不同数量的最近的邻居,推荐的CF,高频,TimeRec, NewRec进行了比较。这个过程可以验证每个推荐算法的推荐效果的变化在不同数量的最近的邻居,帮助每一个推荐算法选择最佳数量的最近邻居为了方便将来的操作实验。

本节设计5实验来验证本文算法的优越性:(1)不同程度的稀疏的影响推荐质量:在实验中,本文选择3度的数据比较稀疏。(2)美比较分层充填法和传统协同过滤CF。(3)在推荐精度的影响时间。(4)数字的影响最近的邻居的推荐算法:加权集的不同尺度的影响推荐质量。(5)推荐品质:与相同数量的邻居,推荐品质不同的算法进行了比较。

4.3。基线

测试NewRec推荐模型的性能和时间TimeRec基于函数的改进算法,本文将通过实验验证模型的有效性。传统的协同过滤推荐算法CF (13是作为基线。CF算法利用项目间的相似性为目标用户推荐类似的商品。用户或项目之间的相似性可以计算(5)。

4.4。指标

比较算法的性能,本文采用美和RMSE对推荐算法的推荐性能进行评估。梅的定义如下所示: 在哪里代表商品的实际评级由用户和代表商品的预测评价由用户。代表所有的数量预测评级。的定义显示如下:

4.5。实验结果

4.5.1。数据稀疏的推荐算法的影响

数据稀疏的比例是指nonrated条目元素在整个评级矩阵。来验证数据稀疏的推荐精度的影响,本文填补了预测评级在原始user-item评级矩阵计算的建议。数据稀疏的0.92,0.81,和0.74选择和CF算法被用于验证。实验结果如图所示3。

从图可以看出3推荐质量不稀疏的增加和减少。在这个实验中,稀疏是0.81时,推荐质量是最高的。在接下来的实验中,数据集的稀疏0.81被实验。

4.5.2。分析分层充填(HF)方法推荐精度

验证数据稀疏的推荐精度的影响,美计算分层充填前后(高频)方法通过实验。从图可以看出4,随着越来越多的集中用户的邻居用户,梅的高频方法和梅CF方法减少和梅的高频小于CF算法在相同数量的邻居。因此,高频方法比CF算法。

4.5.3。在推荐精度的影响时间

保证推荐的准确性,影响的时间预测评级舞台上应当考虑,每个评分项仅拥有一个重量。最新评级被赋予更大的重量和过去的评级被赋予较小的权重,这有助于更好地预测。验证时间推荐准确性的影响,本节CF算法和TimeRec算法之间的比较美。

从图可以看出5梅的时间函数的改进TimeRec算法是低于CF没有时间函数。通过比较,证明时间确实有影响推荐预测和时间函数的使用提高了推荐系统的推荐质量。

4.5.4。影响用户的邻居推荐数量的准确性

很容易计算出每个用户的最近邻通过计算用户之间的相似性。来验证用户的数量的影响邻居推荐准确性,本节通过实验比较和最近的邻居的数量从10增加到60岁的间隔10。实验结果如图所示6。

从图可以看出6的越来越多,最近的邻居、美四个算法都倾向于降低首先和增加。然而,梅的改进算法NewRec是低于其他三个算法,这表明NewRec可以提供比其他三个更好的推荐质量。进一步分析,可以看出,四种推荐算法的最低美当最近的邻居的数量是40。也就是说,当最近的邻居的数量是40,四个推荐算法都可以实现良好的推荐质量。

4.5.5。比较在不同的推荐算法的推荐精度

验证建议摘要NewRec算法的准确性,本节计算RMSE算法通过实验和实验结果如图所示7。

从图可以看出7,与传统的协同过滤推荐算法CF相比,水平高频filling-based改进算法,基于函数和时间TimeRec改进算法,改进的算法NewRec拥有最高的推荐精度。

总结上述实验结果,可以得出以下结论。与其他三种算法相比,改进算法的推荐质量NewRec后显著提高分层充填时间和功能添加。

本文利用大宗商品电子商务系统的功能属于不同级别填写具体分数评级矩阵通过计算射频/ IRF商品的相应水平,解决了数据稀疏问题和冷启动。在推荐预测阶段,考虑到推荐系统的及时性,采用时间加权基础建议预测公式和不同的权重根据评级,评级数据,提高电子商务推荐系统的推荐质量。真实数据集的实验结果表明,本文算法比传统的协同过滤推荐算法运行效率和推荐精度。

5。结论

协同过滤是一种常见的电子商务个性化推荐系统的推荐技术。然而,它还拥有许多问题。user-item评级数据稀疏矩阵和用户评价的及时性,本文提出了一种改进的协同过滤推荐算法,NewRec,并通过实验仿真验证NewRec算法的可行性,证明它能提高电子商务推荐系统的推荐质量。目前,仍有许多问题和缺陷的研究电子商务个性化推荐。对用户的个性化推荐,本文改进的协同过滤算法未能考虑上下文和用户交互行为的影响,需要进一步深入研究的未来。

相互竞争的利益

作者宣称没有利益冲突。

确认

本文支持的山东省科技发展计划(2014 ggx101011 2015 ggx101018),山东省高等教育科技项目计划(J12LN31、J13LN11 J14LN14),和济南高等教育创新计划(201401214,201303001)。

引用

>和h .刘”的应用和研究在协同过滤概率矩阵分解技术的提高,“国际期刊的控制和自动化,7卷,不。8,79 - 92年,2014页。视图:出版商的网站|谷歌学术搜索
p . Bonhard m·a·水闸,“知道我,知道你的概要文件和社交网络习语改善推荐系统,”BT技术杂志,24卷,不。3、84 - 98年,2006页。视图:出版商的网站|谷歌学术搜索
r . Sinha和k . Swearingen”,比较建议由在线系统和朋友,”《Delos-NSF研讨会在数字图书馆个性化和Rocommonder系统,2001年。视图:谷歌学术搜索
j . Caverlee l·刘,s .韦伯“SocialTrust框架信任社会信息管理:体系结构和算法,”信息科学,卷180,不。1,第112 - 95页,2010。视图:出版商的网站|谷歌学术搜索
g . Adomavicius和a . Tuzhilin”多维推荐系统:数据仓库的方法,”电子商务:第二国际研讨会,欢迎2001海德堡,德国,2001年11月16 - 17,诉讼卷,2232在计算机科学的课堂讲稿施普林格,页180 - 192年,柏林,德国,2001年。视图:出版商的网站|谷歌学术搜索
t . v .阮、a . Karatzoglou和l . Baltrunas“高斯过程分解为上下文感知推荐机器,”美国第37国际市立图书馆会议在信息检索的研究和开发(" 14)ACM,页63 - 72年,黄金海岸,澳大利亚,2014年7月。视图:出版商的网站|谷歌学术搜索
y,“电子商务个性化推荐”,先进材料的研究卷,989 - 994,4996 - 4999年,2014页。视图:出版商的网站|谷歌学术搜索
Y.-M。李,C.-T。吴,彭译葶。赖,“社交电子商务推荐机制:结合相似,信任,和关系,“决策支持系统,55卷,不。3、740 - 752年,2013页。视图:出版商的网站|谷歌学术搜索
z黄和m . Benyoucef”,从电子商务到社交商务:仔细研究设计特性,”电子商务研究与应用,12卷,不。4、246 - 259年,2013页。视图:出版商的网站|谷歌学术搜索
z张和h·刘,“社会推荐信任模型结合传播和连续的行为,”应用智能,43卷,不。3、695 - 706年,2015页。视图:出版商的网站|谷歌学术搜索
Z.-J。张和h .刘”,对环境敏感移动SNS推荐算法的研究”,模式识别和人工智能,28卷,不。5,404 - 410年,2015页。视图:出版商的网站|谷歌学术搜索
Y.-M。李,C.-L。周,L.-F。林,”定位集团商业、社会推荐机制”信息科学卷,274年,第142 - 125页,2014年。视图:出版商的网站|谷歌学术搜索
a . p . j . Wang•德•弗里斯和m . j . t . Reinders”统一的基于用户和基于项目的协同过滤方法的相似性融合,”学报》第29届国际市立图书馆年会在信息检索的研究与开发ACM,页501 - 508年,2006年8月。视图:谷歌学术搜索