研究文章|开放获取
Kunni汉, ”个性化的新闻推荐和基于改进的协同过滤算法的仿真”,复杂性, 卷。2020年, 文章的ID8834908, 12 页面, 2020年。 https://doi.org/10.1155/2020/8834908
个性化的新闻推荐和基于改进的协同过滤算法的仿真
文摘
面对大量的在线新闻,公众通常难以快速地找到他们感兴趣的新闻。个性化推荐技术可以挖掘用户的兴趣点根据用户的行为习惯,从而推荐用户可能感兴趣的新闻。本文改进了数据预处理阶段和最近邻收集阶段的协同过滤算法。在数据预处理阶段,user-item评级矩阵是缓解其稀疏。介绍了标签因素和时间因素,使构建的用户偏好模型有更好的表达效果。寻找最近邻的阶段,协同过滤算法结合二分k - means算法,用户集群匹配目标用户选择的最近邻搜索范围设置,和相似性度量公式是改善。为了验证本文提出的算法的有效性,本文选择一组模拟数据来测试该算法的性能方面的平均绝对误差的建议,推荐准确率和召回率和比较它与基于用户的协同过滤推荐算法。模拟数据集,本文算法比传统算法在大多数用户。本文算法的稀疏矩阵分解降低数据稀疏的影响传统推荐算法,从而提高推荐算法的推荐准确率和召回率,减少推荐错误。
1。介绍
随着信息化的深入和网络技术快速变化,信息爆炸的时代即将到来,一个接一个,为用户获取信息的方式越来越丰富的(1,2]。的确,信息技术的迅速发展,允许用户查询信息,他们认为有价值的从更丰富的信息资源3]。然而,大量的信息在同一时间为用户很难发现他们感兴趣的是什么。我们已经进入了信息过载的时代信息匮乏的时代。此时,如何准确、有效地过滤掉用户真正感兴趣的内容从眼花缭乱的信息变得越来越重要4]。
基于内容的推荐算法模型实时新闻,然后构建一个用户兴趣模型基于一个特定用户的浏览信息,最后推荐类似的新闻事件到目标用户的兴趣模型,但不包括在浏览历史5,6]。可以看出,构建一个真正感兴趣的模型和计算模型之间的相似性是该算法的关键。相关学者应用协同过滤Tapestry邮件系统(7]。系统重新排列了新邮件收到了通过分析用户的历史行为习惯的邮件阅读,以提高效率的用户的邮件阅读(8]。Tapestry系统,用户可以确定电子邮件的类型根据他们自己的利益,才能决定是否基于标签读这封电子邮件的电子邮件9]。系统不能积极推荐根据用户的兴趣偏好,这限制了系统只有较小的用户。它还需要从用户的高度合作。尽管Tapestry有很多技术缺陷,其更重要的作用是告诉我们一个新的建议想法(10,11]。随后,明尼苏达大学的建造和发射电影推荐的网站。在这个系统中,用户速率他们看过的电影,然后用类似的评级系统推荐电影给用户评级的基础上,使用哪个更方便(12]。此外,实验室开发的音乐推荐系统林格,需要用户评级的音乐家相比,计算用户之间的相似性基于评级的结果,和集群用户相似性较高的在一起13]。早期Web观察者是一个比较流行的个性化推荐系统。在一开始,它需要用户反馈他们的个人利益,形成用户属性特征。然后,结合用户的浏览历史,它为用户提供推荐链接基于利益链接的当前用户的最大利益14]。个人网络网络观察家的观察者是一个改进的系统。它不再需要用户来描述他们的利益但是构建用户兴趣模型基于他们访问过的网页。的Amazon.com书推荐网站系统采用协同过滤技术,可以分析用户的购买所有的书及时、准确,然后推荐书籍已经被其他用户购买那些用户购买了同一本书15,16]。购买历史,感兴趣的产品,和其他信息,包括浏览产品,感兴趣的话题,人口学特征,和其他信息结合在一起,最后一个图书列表,用户可以购买(喜欢)是显示给用户17]。潜在的和实际需求也反映了推荐算法的价值在商业应用18]。这些研究人员在推荐技术的研究和推荐系统应用程序是对个性化推荐系统的发展具有重要意义[19,20.]。
摘要二分k - means聚类算法已得到改进,结合协同过滤算法。标签因素和时间因素,介绍了提高相似性度量公式,得到一种改进的协同过滤推荐算法。本文进行了实验测试算法。在实验中,模拟数据集和真实数据集选择测试算法的性能并与传统的基于用户的协同过滤推荐算法。模拟数据集,本文测试本文算法的性能和传统的算法在不同的邻居大小和不同的相似性度量。实验表明,本文提出的算法比传统的算法。在真实数据集,本文首先测试三个相似方案的利弊,然后选择相似方案来测试本文算法和传统算法在不同的邻居。
2。相关理论和技术
2.1。个性化推荐系统
个性化推荐系统是一个非常有效的解决方案来解决信息过载。它建议信息感兴趣的用户根据他们的行为数据和兴趣偏好。推荐系统可以计算相似性通过研究用户的利益和偏好,最终帮助用户找到他们的信息需求。一个好的推荐系统不仅为用户提供个性化服务,还应该与用户建立亲密的关系,这样用户可以依靠他们。个性化推荐系统已被广泛应用于许多领域,包括电子商务、视频,新闻,电子邮件,等等。同时,在学术界研究的热情也很高,并逐渐形成一个独立的主题。推荐系统有三个重要模块:用户建模、推荐对象,和推荐算法。传统的推荐系统模型流程如图1。
基于内容的推荐方法起源于信息采集领域的,是信息检索领域的一个重要研究内容。算法首先提取推荐对象的内容特征,然后与用户兴趣偏好的用户模型,最后建议的对象匹配度较高的用户。例如,在一个新闻推荐系统,该系统首先分析用户的共性之前阅读的新闻,发现他的兴趣偏好,然后推荐其他新闻类似于他的兴趣。推荐策略的关键部分是计算相似性推荐对象的内容特征和目标用户的兴趣特征模型。
基于内容的推荐系统被广泛用于推荐对象与特定的文本特征。他们的操作对象是文本内容,相应的重量主要是根据关键字的频率给定的文本,最后文本之间的关系计算出最终的预测和建议。基于内容的推荐系统通常使用TF-IDF方法在信息过滤。TF-IDF主要是用来测量的重要性,整个文本内容的关键字。它有两个测量标准:词频率(TF)和逆文档频率IDF(逆文档频率)。TF代表文件包含关键字的数量比文件的总数。IDF值较大时,形容词词出现在多个文件,所以不能用这个词作为关键词来区分文件。当IDF值比较小,这意味着这个词只出现在一个或少量的文件。
基于内容的推荐的缺点如下:①广泛应用的基于内容的推荐是限制的问题推荐对象的特征提取能力。这是因为没有有效的特征提取方法对多媒体资源。即使对文本资源、特征提取只能反映多媒体资源的内容的一部分。②对于新用户,有一个冷启动问题。当一个新用户加入,很难系统获得用户的利益,因此不能匹配推荐对象的内容特征。因此,不能令人满意的信息推荐给用户。③很难推荐新内容。建议只能当推荐对象的内容特征匹配用户的兴趣特征。因此,用户仅限于获得类似于之前的推荐结果,,很难获得新的兴趣信息,用户没有发现或容易忽略。④推荐的目标内容的分类方法需要大量的数据。⑤基于内容的推荐系统所面临的另一个问题是不同的语言描述的用户模型之间的不相容和推荐对象模型。
2.2。协同过滤推荐
协同过滤推荐的基本思想来源于日常生活,灵感来自于购买商品和选择感兴趣的新闻。如果有朋友有相似兴趣购买某种产品,然后购买本产品的概率也很高。当用户喜欢某些类型的产品,当他看到一个产品类似于这种类型的产品,当其他用户有一个高评价的这个产品,购买的概率也会高。基于用户的协作推荐的过程如图2。
基于项目的协作推荐是基于这样一个假设:如果用户有非常相似的一些推荐对象的评级,然后为这些项目当前用户的评级也非常相似。类似于如果很多用户信任某个品牌,是相对容易的其他用户选择该品牌。
基于项目的协同过滤的基本思想如下:
首先,它需要找到最近的邻居的目标对象;其次,你预测它的分数目标推荐对象基于最近邻当前用户的分数,因为当前用户的最近邻对象上的分数相对比较类似于目标对象上的得分;第三,它是必要的选择N预测得分较高的目标对象推荐给当前用户。
2.3。协同过滤推荐的过程
协同过滤推荐是为目标用户产生推荐列表基于偏好相似的邻居。它首先搜索目标用户的几个邻居,然后预测目标用户的评分项基于用户的得分在最近的邻居,最后生成一个推荐列表。从介绍在前面的章节中,我们知道,为了使用协同过滤的个性化推荐,必须满足以下三个条件:首先,用户不独立存在,和用户之间存在一定的关系;第二,评级矩阵可以显示一些用户的兴趣偏好和潜在的偏好;第三,用户可以预测和基于相似的邻居用户评分项集。传统的协同过滤推荐过程首先构造一个user-item评级矩阵,然后根据评级计算用户相似度矩阵,最后预测建议。
协同推荐系统之前必须首先获得用户的消费,评估,浏览信息,项目属性信息,对这些数据进行数据预处理,获取一个矩阵user-item评级。米代表用户的数量,n代表物品的数量,代表用户的评级价值我为项目j。通常,评级值范围从1到5,其中1表示非常不喜欢和5。如果项目没有评价,分数值为0。行评级矩阵代表用户的评分向量,和列代表新闻评价向量。如果没有得分设置在系统的前端,但用户日志信息,这些日志包含用户浏览、评估、出版、和其他行为信息;然后这些行为类型可以有不同的权重;例如,浏览行为被标记为1点,这种行为被标记为2分,和出版行为被标记为2点,实现用户对新闻的最后得分。
余弦相似度作为用户评分矩阵向量n维项空间。如果用户不率项,评分值设置为0。余弦相似度方法通常应用于文本对象。的角度值向量用于指示相似。在计算用户之间的相似性,评级矩阵中的数据被认为是一个矢量,和余弦函数值是两个用户之间的相似度值和用户相似性值成正比。余弦相似度计算公式如下:
其中,和 ,分别代表的具体分数值矩阵中相应的位置。余弦相似度的值设置用户的未分级的项目为0,这有效地提高了计算效率。但事实上,用户的偏爱未分级的项目不能为零。因此,在稀疏数据的情况下,余弦相似度不能正确地计算用户之间的相似性或物品。余弦相似度的另一个问题是,用户的评定量表不考虑。修改后的余弦相似性可以解决这个问题。
2.4。协同过滤的瓶颈问题和解决方案
推荐系统的不断扩大使得用户和产品的数量急剧上升,协同过滤带来了很多棘手的问题,如稀疏性、冷启动和可伸缩性问题。这三个瓶颈和他们的解决方案是在下面详细描述。
推荐系统是变得越来越大,用户和项目的数量增加,这使得新闻用户之间重叠的可能性变得越来越小,导致数据稀疏的问题。一般来说,评级的数量的比例数量的用户和产品之间可能的评级是用来测量系统的数据稀疏。计算后,数据稀疏Movielens是4.5%,和数据稀疏的Netflix是1.2%。事实上,这些已经相对密集的数据集,数据稀疏的美味是0.046%。
冷启动的问题是经常遇到的推荐系统。它主要分为项目冷启动和用户冷启动。项目意味着,当一个新项目冷启动问题是第一个添加到推荐系统,没有用户评价。协同过滤推荐算法分析和建议项目基于用户的历史评级信息。因此,如果没有用户评价它,那么它将很难得到建议。用户冷启动主要指的是,在早期阶段的推荐系统,系统中没有user-item评级信息,协同过滤推荐算法不能用于完成推荐。的工作原理图中所示的基于协同过滤的推荐系统图3。
推荐系统的规模变得越来越大,用户和项目的数量也增加。所有用户和项目需要找到邻居,相似度计算的数量也急剧上升。也有许多问题在计算最相似的一组用户或项目这样一个巨大的数据集和实时推荐任何目标用户,比如如何同时保证推荐算法的可伸缩性和快速、准确地计算出预测值,提高系统的实时性能。因此,它也是一个研究焦点,来改善系统的可伸缩性和实时性能而不影响推荐精度。降维技术可用于解决可伸缩性问题,和推荐系统的大小可以减少降维,从而提高系统的可伸缩性。此外,分类和聚类技术通常用于解决这个问题。分类技术主要使用分类器训练数据集。一旦创建好分类器,它可用于新项目进行分类。
3所示。改进的协同过滤算法
3.1。填写评分数据
针对协同过滤算法的缺点,本文采用以下方法改进:首先,在样本处理阶段,项目之间的相似性和目标用户的得分项可用来预测目标用户的评分,然后用户item-rating矩阵,从而可以缓解user-item评级的稀疏矩阵算法,提高推荐质量;二是结合项目标签和评级时间与用户评级因素和时间因素引入标签。提高性能度量公式,这样的目标用户的最近邻居集可以更好地模拟用户首选项;第三是结合二分k - means聚类算法的协同过滤算法。使用协同过滤算法之前,您使用二分k - means聚类算法。意味着聚类算法确定目标用户所属用户集群,然后使用它作为最近邻搜索范围设置,以避免的协同过滤算法搜索在整个用户集,和二进制k - means算法能保持良好的性能在大型数据集,那么它将显示在推荐系统中。由于改进的协同过滤算法只考虑集群用户集群在确定最近的邻居集,当客户端推荐系统架构采用用户集群信息可以安排在本地客户端,简化协作推荐的策略。
与商品项目的增加,传统的基于用户的协同过滤推荐算法的操作效果的推荐系统受到影响。这是由于推荐系统中的用户数量远小于商品项的数量,导致严重稀疏user-item评价矩阵。这个时候,如果直接计算用户之间的相似度,推荐系统的推荐质量将受到影响,由于用户共同评分的减项。
为了解决这个问题,本研究首先需要填补user-item评级矩阵来减轻它的稀少。预测项目的具体操作是用户和用户b没有得分Ia和b,减少user-item评分矩阵的稀疏分数设置用户之间通过扩大公共项目。填充的原则是使用项目之间的相似度,计算目标用户和项目没有被评估的目标用户预测评分un-evaluated物品。例如,用户一个取得了四个项目我1,我2,我3,我4所示。如果你想知道用户的预测评分一个在项目我5,你必须首先计算项目之间的相似性我5项我1,我2,我3,我4所示。然后,您可以预测用户一个可能速度项我5:
其中,国家统计局我是项目的集合相似性最高的用户吗u的评价项目和项目我,项目之间的相似性我和项目j,是用户u的评分项目j,是用户u为项目的预测评分我。
3.2。预测时间刻度值
传统的协同过滤算法提出建议时,只考虑用户的评级项目的,忽略用户偏好会随着时间改变,这也将影响到推荐系统的推荐效果。为此,本研究引入了时间因素,考虑用户偏好随时间的变化来提高推荐系统的推荐质量。
通过填写user-item评级矩阵,可以显著减少评级矩阵的稀疏。然而,目前尚不清楚是否填充数据真实、有效,并自评分预测生成的数据,是不可能知道得分时发生。由于这个原因,有必要预测的发生时间填充数据通过设置一个时间窗口和判断填写的信息是真实和有效的。
根据基本假设目标用户的兴趣偏好在短时间内不会改变,本文时间预测填充分数目标用户的数据。首先,我们确定时间跨度T的目标用户u根据得分的分数设置的目标用户u然后把时间跨度T成我根据时间跨度时间窗长度相等T。具体公式如下:
其中, ,在哪里n是一种天然的数量大于0,所以项目集吗 ,我在每一个时间窗口能代表用户的偏好u在这个时间跨度。然后,通过计算项目之间的相似性预测和项目集在每一个时间窗口 ,的主要思想如下:项目j需要预测更类似于项目的时间窗口 ,说明项目的得分j更有可能发生在这个时间窗口。我们使用以下公式计算整个项目之间的相似性j和一组项目的时间窗口。具体公式如下:
其中,代表物品的数量 。上述公式表明,该项目j需要预测时间尺度值属于时间窗口是根据项目之间的平均相似度决定的j在每个时间窗和一组项目。
为了判断评分数据是真实、有效的,我们需要设置一个阈值δ测量整体预测项目之间的相似性和时间窗口。我们之间的相似性预测项目和时间窗口获得获得一组数据最大的相似性,然后法官的大小和阈值δ。如果 ,这意味着这次的得分数据将出现在窗口,我们将时间窗口的中间刻度值分配给得分数据;如果 ,这意味着得分数据不能在这个时间窗口。时间窗口出现时,数据需要消除。阈值的设置δ根据不同的推荐系统需要改变,和阈值的大小δ在不同的推荐系统也可能不同。有必要确定阈值的大小δ通过反复实验。如果阈值δ设置太大,将在很大程度上消除预测评分数据,和user-item评分矩阵仍有严重的稀疏问题,这将影响推荐系统的推荐精度;如果阈值δ设置过小,将导致大量的不准确预测分数填到user-item得分矩阵,这将影响推荐系统的推荐质量。
3.3。执行由两部分构成的k - means聚类
为了更好地模拟用户首选项,改进的协同过滤算法不再使用user-item得分矩阵作为搜索范围的目标用户的最近邻居集,但使用标记因素与时间因素相结合的方法,构建用户和用户的分数。user-tag得分矩阵的施工过程在下面给出。
通过填写评分数据和预测时间尺度值,我们可以得到一个接近user-item评分矩阵。考虑品牌因素的引入协同过滤算法,需要获得用户的偏好得分为每个标签。与此同时,用户的偏好不是常数;它会改变根据时间的变化,因此有必要使用以下公式来获得每个分数代表的时间因素标签的重量分数。具体公式如下:
其中,t代表了标准化的时差,和标准化的方法
其中,t马克斯和t最小值代表用户的最近和最早的得分,分别tl代表的时间需要标准化。因为用户的偏好会随着时间改变,离最近的得分,分数是更具代表性。例如,用户在今年1月和6月。在这个时候,有必要预测用户的分数在某项在7月。在这个时候,用户的偏好必须更加类似于6月。标准化可以的时间tl离最近的评级时间接近0标准化后,和时间因素f(t)也接近1,这表明用户首选项的评级更具代表性;之后的时间tl是标准化的,越接近t1,时间因素吗f(t)为0,这意味着分数不能适合用户的偏好。
我们使用以下公式得到用户的得分为每个标签偏好:
其中,代表用户的评分我在j项目相匹配的标签lf (tj)代表的时间因素jth项相匹配,n代表物品的数量相匹配的标签l,E我,我代表用户的加权平均分数我为标签l。
传统的双边的k - means聚类算法可以减少最近邻搜索空间,但它有以下的缺点:首先,该算法使用欧氏距离来计算指向质心的距离,但是用户标号评分的得分矩阵通常需要一个值;如果使用欧氏距离作为度量指标,结果的差异不明显;其次,算法采用平方误差的总和(SSE)作为指标来衡量聚类效果,并希望总体误差在每个部门将变得越来越小。但由于用户评级的小值矩阵,上交所的差距并不大,这将影响最终的聚类效果。
针对传统的二分k - means聚类算法,利用欧氏距离作为度量指标,本文做出了改进,并使用皮尔逊相关系数的测量指标。后采用皮尔逊相关系数作为集群的标准,有必要修改集群效应的测量指标。每个部门后,提高整体相似集群中心。也就是说,下面的公式是用作衡量聚类效果:
其中,代表了集群中心我th集群, 代表用户之间的相似性j和它所属集群中心D代表的整体相似样本划分。
后使用二分k - means算法实现用户集群相匹配的目标用户,您可以直接找到目标用户的最近邻居集集群用户,而不是搜索在整个user-item评级矩阵,减少了最近邻搜索空间。
改进的协同过滤算法的流程图如图4。
4所示。仿真实验与分析
4.1。相似性方法选择实验
由于本文使用三种相似性度量方法,对大规模数据,只有一个更好的测量方法需要选择。因此,首先我们测试大规模数据更好地看到哪些相似性指数。
评估的标准相似指数是相似就可以更好的区分用户之间的区别。如果用户之间相似性分布得到一定的相似性指数相对分散,相似之处是,指标相对较好。
如果计算用户之间的相似度值的某些相似性指数非常接近,甚至很多相同的情况下,很难选择当选择邻居用户的相似,但如果某种相似性指数是用来计算两个用户之间的相似度,得到相似度值不同;很容易选择用户的相似邻居根据相似性。
为了测试相似性指数,本文首先随机选择一个用户,不妨选择第一个用户,然后计算用户之间的相似性和所有用户在三个不同的相似性度量方法。
数据5- - - - - -7分别显示用户之间相似性的分布在三个相似性测量方法。图中的纵坐标代表用户之间的相似性,横坐标代表用户,每个点代表第一个用户和用户之间的相似度相对应的横坐标点。
它可以清楚地看到从上面的实验,计算用户之间相似性分布根据修改后的余弦和Jaccard指标过于密集,这并不有利于选择区分用户之间的差异,并基于余弦相似度指数可以区分更好。所以在随后的实验中,本文选择了余弦指标来计算用户之间的相似性。
4.2。传统UBCF算法测试实验
实验分为两类:模拟数据和真实数据。验证算法的性能通过推荐的平均绝对误差,推荐的准确率,和推荐的召回率,传统算法的结果进行了比较和分析。本文改进算法的有效性。
模拟数据分为两个子目录:传统算法实验,本文改进算法实验。图8记录的平均绝对误差的建议获得时,传统的基于用户的协同过滤推荐算法UBCF推荐使用两个用户在模拟数据。图中横坐标表示最近的邻居资讯的数量,和纵坐标代表推荐的平均绝对误差美。图中的每个点代表误差计算根据相应的相似性指数相应数量的邻居。
(一)
(b)
其中,第一个数据代表的平均绝对误差根据余弦相似性计算当邻居资讯的数量是2,第二个数据代表了错误时获得的资讯是3,等等。
从实验结果可以看出,模拟数据集,根据获得的误差修正余弦相似度指数相对较大。这个结果的主要原因是,修改后的余弦相似性是专门为热点新闻推荐系统,和它的目的是减少热点新闻的影响的建议。获得的错误使用Jaccard相似性度量指标非常接近使用余弦相似性测量方法获得的结果,但结果基于Jaccard指数获得更好的整体。基于综合考虑,发现传统的算法更有效,当K是4。
4.3。本文的算法测试实验
图9显示推荐的平均绝对误差的结果建议基于非负矩阵分解的协同过滤推荐算法在模拟两个用户数据集。实验给出了统计结果的平均绝对误差本文算法获得的在不同数量的邻居资讯和不同的相似度计算方法。资讯的值是2,3,4,5,6,7,8,9,10。
(一)
(b)
它可以看到从比较实验数据8和9,本文的算法比传统的算法在用户的推荐情况,因为本文算法获得的平均绝对误差要小得多。该算法基于修改的余弦相似性指数差推荐错误结果,结果非常不稳定,而获得的结果通过后两个指标波动较小。从上面的实验,可以看出美基于Jaccard相似性测量方法更小。模拟数据集,该算法比传统的UBCF算法。
数据10和11显示获得的推荐准确率和召回率时,本文算法在生成推荐给用户。结果在图10表明,模拟数据集,余弦相似性指数的结果很差。这主要是因为余弦相似性的目的是建议减少受欢迎的新闻的影响,但这并不存在于这个模拟数据集。由于相对较小的用户数量在模拟数据集和新闻,余弦相似性指数可能并不适合这些数据。本文中的算法使用Jaccard和修改余弦相似性指数获得的平均绝对误差对邻居资讯的数量不是很敏感,和由两个相对相似的结果。实验数据10和11清楚地表明,本文提出的算法可以获得高推荐准确率和召回率。
上述实验结果表明,基于非负矩阵分解的协同过滤推荐算法提出了可以获得更高的推荐准确率和召回率和更低的平均绝对误差,这表明,该算法比传统的基于用户的协同过滤算法。模拟数据集,本文算法和传统算法有更好的实验结果的情况下Jaccard相似。
5。结论
本文主要提高了缺陷两个阶段的协同过滤算法。在数据预处理阶段,一个是填补user-item评级矩阵,以缓解其稀疏;另一因素和时间因素引入标签使构建的用户偏好模型有更好的表达效果。寻找最近邻的阶段,一个是结合二分k - means算法的协同过滤算法,并选择相匹配的用户集群目标用户最近邻居集的搜索范围;第二是提高相似性度量公式。本文测试改进算法模拟数据集和真实数据集和验证算法的有效性提出了从三个方面:的平均绝对误差的建议,推荐准确率,建议召回率。比较的基础上,基于用户的协同过滤推荐算法,实验证明,本文提出的算法可以有效地解决数据稀疏的问题,提高算法的推荐效果。
在后续的研究中,你可以试着把其他的聚类方法聚类算法和协同过滤算法,这可能会产生更好的推荐结果。另一方面,与传统的协同过滤算法相比,改进的协同过滤算法考虑了标签因素和时间因素,使最近邻集合的划分更加准确,但这种方法是基于用户的最近邻居集合。它可能不适合目标用户的偏好准确。在未来,用户可以使用自己的数据训练神经网络,建立用户的为每个用户自己的偏好模型,从而使推荐的结果更准确。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突有关。
引用
- a . Chakraborty s Ghosh、n . Ganguly和k . p . Gummadi”优化recency-relevance-diversity权衡在非个性化新闻推荐,“信息检索期刊,22卷,不。5,447 - 475年,2019页。视图:出版商的网站|谷歌学术搜索
- m .他,吴x和j .张“UP-TreeRec:构建动态新闻推荐,用户配置文件树”中国通信,16卷,不。4、219 - 233年,2019页。视图:谷歌学术搜索
- c . f . Wu吴,麻省理工学院,“个性化新闻推荐基于深度学习,”南京新禧Gongcheng大学学报,11卷,不。3、278 - 285年,2019页。视图:谷歌学术搜索
- 和j·l·张,p . Liu a . Gulla”动态attention-integrated神经网络基于会话的新闻推荐,“机器学习,卷108,不。10日,1851 - 1875年,2019页。视图:出版商的网站|谷歌学术搜索
- m . Asenova和c . Chrysoulas“个性化微观服务推荐系统为在线新闻,“Procedia计算机科学卷,160年,第615 - 610页,2019年。视图:出版商的网站|谷歌学术搜索
- b . k .你们、y . j . t .你和t . p .梁“个性化内容推荐的混合动力系统,”电子商务研究杂志》上,20卷,不。2、91 - 104年,2019页。视图:谷歌学术搜索
- 彭译葶。林和H.-S。陈,“个性化频道直播平台上的建议,”多媒体工具和应用程序,卷78,不。2、1999 - 2015年,2019页。视图:出版商的网站|谷歌学术搜索
- l .呗,l·刘,美国歌曲,“NCR-KG:新闻社区推荐知识图”,CCF交易普适计算和交互,1卷,不。4、250 - 259年,2019页。视图:出版商的网站|谷歌学术搜索
- z . a .徐、z风扇和w·江”联结主义建议在野外:神经网络的效用和scrutability个性化课程指导,”用户建模和User-Adapted交互卷,29号2、487 - 525年,2019页。视图:出版商的网站|谷歌学术搜索
- p . Lv、孟x和y,“孔:适应读者消费行为不稳定新闻推荐,“ACM交易信息系统(钢铁洪流),38卷,不。1,1-33,2019页。视图:谷歌学术搜索
- 博多,“消息卖给观众新兴的算法逻辑定性调查新闻欧洲质量的个性化新闻媒体,”数字新闻,7卷,不。8,1054 - 1075年,2019页。视图:出版商的网站|谷歌学术搜索
- A . Darvishy h·易卜拉欣,f .黑人和A·穆斯塔法”一个定制的非排他性新闻推荐系统聚类算法,”《巴比伦纯粹与应用科学大学,27卷,不。1,第379 - 368页,2019。视图:出版商的网站|谷歌学术搜索
- g s p . Perumal Sannasi, k . Arputharaj“智能模糊规则在线学习推荐系统对于动态用户利益,”《华尔街日报》的超级计算,卷75,不。8,5145 - 5160年,2019页。视图:谷歌学术搜索
- y的歌:Sahoo大肠Ofek,“何时以及如何丰富multicategory实用新型个性化内容推荐,“管理科学,卷65,不。8,3737 - 3757年,2019页。视图:出版商的网站|谷歌学术搜索
- y, k .郭r·张t . Xu j . Ma和t .太极,“ICFR:一个有效的增量基于协同过滤的推荐个性化的网站架构,”万维网,23卷,不。2、1319 - 1340年,2020页。视图:出版商的网站|谷歌学术搜索
- c . x Wang高,j .叮,y,和d·金”CMBPR: category-aided多渠道贝叶斯短片推荐个性化的排名,”IEEE访问7卷,第48223 - 48209页,2019年。视图:出版商的网站|谷歌学术搜索
- y钱”,应用协同过滤算法在用户个性化信息推荐的数学表达式,”国际期刊的计算智能系统,12卷,不。2、1446 - 1453年,2019页。视图:谷歌学术搜索
- z, h .π,w·魏Xiong, m·沃兹尼亚克和r . Damasevicius”推荐基于审查文本和社会:一个混合模型,”IEEE访问7卷,第40427 - 40416页,2019年。视图:出版商的网站|谷歌学术搜索
- m . Svrcek m . Kompan和m . Bielikova”对理解个性化建议:混合解释,“计算机科学和信息系统,16卷,不。1,第203 - 179页,2019。视图:出版商的网站|谷歌学术搜索
- g . Alexandridis a . Chrysanthi g . e . Tsekouras和g . Caridakis“个性化的文化遗产和内容自适应路径推荐:一个应用程序查脱户耶克Gournia和考古遗址,”用户建模和User-Adapted交互卷,29号1,第238 - 201页,2019。视图:出版商的网站|谷歌学术搜索
版权
版权©2020 Kunni汉。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。