复杂性
复杂性
1099 - 0526
1076 - 2787
Hindawi
10.1155 / 2019/9476981
9476981
研究文章
一个Time-Aware CNN-Based个性化推荐系统
https://orcid.org/0000 - 0002 - 3817 - 7333
杨
丹
1
张
京
1
https://orcid.org/0000 - 0003 - 4244 - 4091
王
家
2
张
XueDong
1
元
元
1
计算机科学和软件工程学院
辽宁科技大学
鞍山
辽宁114051
中国
ustl.edu.cn
2
信息科学与工程学院
曲阜师范大学
日照
276826年山东
中国
qfnu.edu.cn
2019年
18
12
2019年
2019年
12
10
2019年
17
11
2019年
28
11
2019年
18
12
2019年
2019年
版权©2019丹杨et al。
这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。
推荐系统已经收到了极大的关注和研究学者近年来由于其广泛应用在不同的领域。深度学习的深入研究和应用算法,深层神经网络正逐渐在推荐系统中使用。现代的成功推荐系统主要取决于上下文的理解和应用的推荐请求。然而,当利用深度学习算法的推荐,推荐等上下文信息的影响时间和地点往往是被忽视的。摘要time-aware卷积神经网络(CNN)——基于个性化推荐系统
TC-PR 提出了。
TC-PR 积极推荐产品,满足用户的利益通过分析用户的功能,物品的特性,用户的评级,以及用户的时间上下文。此外,我们使用Tensorflow分布式开源框架来实现该time-aware CNN-based推荐算法可以有效地解决大数据量的问题,推荐系统的大型模型,速度慢。MovieLens-1m真实数据集上的实验结果表明,提出的
TC-PR 能有效解决本身的问题,大大提高数据处理的速度和准确性的建议。
辽宁省自然科学基金
20170540471
中国辽宁省的一般科学研究项目
2019年lnjc07
辽宁科技大学
601011507 - 22
1。介绍
信息的爆炸式增长人们的选择带来了巨大的麻烦。作为一个有效的工具来处理“信息过载”,推荐系统(
1 一直吸引了研究者的注意。和推荐系统已广泛应用于变量字段和医学等领域的建议(
2 ),引用推荐(
3 ),服务推荐
4 - - - - - -
7 ),和大数据分析
8 ]。当前的推荐算法主要包括两种,一个是传统的推荐技术,另一个是受欢迎的深度学习(
9 )推荐技术。传统的推荐技术主要包括基于内容(
10 ),关联规则(
11 ),协同过滤(CF) [
12 ),和混合
13 )推荐算法。基于内容的推荐推荐相同类型的产品根据用户的特殊利益集团。然而,它不能为用户发现新的有趣的产品,这不是个性化。关联规则推荐算法可以找到新的兴趣点的用户。然而,算法的第一步。,the discovery of association rules, is the most critical and time-consuming, which has been the bottleneck of the algorithm. CF is the most classical and widely used recommendation algorithm, which mainly calculates the similarity among users according to users’ historical records, then finds nearest neighbors for the target user, and finally uses the preferences of neighbors to recommend for the target user. CF is the most advantageous personalized recommendation algorithm in traditional recommendation techniques. It has a high degree of automation; however, there are some problems such as sparsity [
14 和本身
15 ]。混合推荐算法结合了多种推荐算法的优点,可以改善单一算法的性能。然而,它不是有效的所有问题和不同的应用程序。作为目前最热门的研究领域,基于深度学习推荐算法可以处理大数据,和他们的速度高于传统的推荐技术。深入学习算法主要使用领域的建议包括CNN算法(
16 )和递归神经网络(RNN)算法(
17 ]。RNN主要任务顺序信息,即。前输入与后者输出。例如,当我们理解句子的含义,它孤立地理解每个单词是不够的。我们需要处理整个序列通过这些词连接。CNN是深前馈人工神经网络,延伸在空间利用共享的权重。CNN遵循普通神经网络的结构,即,多层感知器。CNN的基本结构包括输入层、卷积层,激活层、汇聚层、连接层,输出层。通过这些层,CNN算法实现。CNN-based推荐算法的流程图如图
1 。
图1
CNN-based推荐算法的流程图。
如图
1 ,推荐算法基于CNN建议项目的目标用户主要包括以下步骤。首先,我们输入数据预处理中的属性数据的输入层。然后嵌入层可以被描述为预处理特征提取的数据,它可以生成每个属性特征向量。然后完整连接操作后实现嵌入操作连接属性特性和生成用户特性和项特性的完整连接层。之后,我们使用用户特性和项特性来获得预测评级。最后,Top-k项目预测高评级,而不是被用户选择的建议。
CNN是一个多层感知器。其成功的关键在于它使用本地连接的方式和股票权重。一方面,它减少了权重的数量,使网络容易优化。另一方面,它能避免过度拟合的风险,考虑到人们常常忽视时间的建议要求,如推荐,推荐的场景,以及其他时间上下文特性,当使用深层神经网络的建议。解决上述问题,本文提出一种time-aware CNN-based TC-PR个性化推荐系统。通过使用本地感知和权重分享CNN,神经网络的参数的数量大大减少,时间减少,提高推荐的准确性。
本文的主要贡献可以概括为
(我)
我们探讨一个比较研究各种现有time-aware推荐系统和CNN-based推荐算法。
(2)
我们提出一个time-aware CNN-based个性化推荐系统TC-PR通过将时间上下文信息纳入不仅CNN模型捕获的时间动态用户的兴趣随着时间的推移,而且用户的推荐时间上下文。TC-PR提高CNN-based推荐算法的质量。在计算目标用户的相似的邻居,我们用户的时间上下文信息引入到CNN。此外,我们建议time-aware项评级预测函数。
(3)
我们做大量真实数据集的实验报告比较性能分析提出的与其他基线TC-PR。
本文的其余部分的结构如下。部分
2 在文献中讨论相关工作报告。部分
3 介绍了TC-PR框架的概述。部分
4 详细介绍了我们提出time-aware CNN-based个性化推荐算法。并给出了实验结果
5 ,部分
6 总结了纸。
2。相关工作
在本节中,我们首先介绍相关工作time-aware推荐系统然后CNN-based推荐算法。
Time-aware推荐系统越来越关注个性化推荐领域的最近[
18 ]。早期研究推荐系统侧重于静态的推荐系统,建立长期有效的推荐模型没有考虑用户的历史行为的时间上下文。然而,在现实生活中,用户的利益和偏好密切相关,环境因素和用户的口味随时间变化。因此,语境因素的理解和应用的推荐请求对推荐系统的成功有重要的影响。相关工作(
19 认为时间扮演着一个重要的角色在兴趣点(POI)建议,和大多数用户往往在一天中不同的时间去不同的地方,例如,访问一个餐馆中午和晚上去酒吧。因此,time-aware POI的建议提出了建议,用户没有去过的地方对于一个给定的用户在指定的时间在一天。相关工作(
20. )考虑用户兴趣漂移和项流行变化在很长一段时间,和一个time-aware协同过滤推荐算法。相关工作(
21 )提出了一种概率框架,利用时间相关性影响的工作日和周末time-aware位置的建议,不仅用户推荐的位置,但这也表明,当用户访问应该推荐的位置。相关工作(
22 )利用产品图嵌入模型做time-aware产品推荐。相关工作(
23 ]研究个性化头n个顺序推荐使用卷积序列嵌入推荐模型问题。
CNN-based推荐算法有一些传统的推荐技术没有的优势,如良好的容错性,并行处理和自学习能力。他们可以处理复杂环境信息的问题,不清楚背景知识,不清楚推理规则。他们允许样品有较大的缺陷和扭曲。他们跑得快,有良好的适应性能和高分辨率。他们将特征提取函数集成到多层感知器通过重组结构和减少体重和省略复杂的图像特征提取之前识别的过程。CNN的泛化能力是比其他方法更好。相关工作(
24 )提出了一种自动CNN推荐系统对图像分类任务,就是能评估分类任务的复杂性和CNN模型精确的分类能力。相关工作(
25 ]CNN-based方法专家提出的建议,这将减少提问者的等待时间,提高答案的质量。相关工作(
26 )提出了一个潜在的集团推荐(LGR)基于动态概率矩阵分解模型与卷积神经网络集成(DPMFM-CNN),这需要全面考虑用户之间的关系,团体和服务,提高了推荐精度。
大多数现有的相关研究往往忽略时间上下文因素对推荐系统的影响在使用CNN推荐或时间上下文因素纳入模型作为共同的特征。然而,时间上下文因素产生重要影响的成功推荐系统在真实的应用程序中,并将时间上下文到CNN模型可以有效地提高推荐系统的准确性和用户的满意度。
3所示。TC-PR Time-Aware个性化推荐系统
在本节中,我们首先给出一些相关预赛time-aware个性化推荐算法,然后现在我们提出的框架time-aware CNN-based TC-PR个性化推荐系统。
3.1。初步
3.1.1。User-Item评级矩阵与时间戳<斜体> R < /斜体> <一口> <斜体> t < /斜体> < /一口>
与
米 用户
U = {
u 1 、…
u
米 },
n 项目
我 = {
我 1 、…
我
n },用户评级行为项目,例如,
米 ×
N user-item矩阵与时间戳
R
t ,定义如下:
(1)
R
米
n
t
=
工作日,
如果
u
米
,
我
n
互动是观察到的
,
周末,
否则,
在工作日的价值
R
t 代表时间戳的交互
t (周一至周五)用户和项目之间,例如,一个用户星期二观看电影和评级。同样价值的周末意味着交互时间戳
t (星期六和星期天)。
矩阵中的每个值
R
t 可以被视为4-tuple表单的<
u ,
我 ,
r ,
t >,
u 是用户,
我 项,
r 代表用户
u 的评级
我 ,
t 代表了时间戳的意见。例如,<用户1 、项目1 周二3 >代表评级被用户1 为项目1 周二是3。推荐任务可以被定义为一个旨在推断预测问题的价值互动标签user-item对<
u ,
我 >。
3.2。TC-PR概述
拟议的框架time-aware CNN-based个性化推荐系统
TC-PR 如图
2 。它认为的时间上下文信息用户的行为在CNN模型提高预测精度的个性化推荐。时态功能通过分析用户的行为,项目功能,和用户的评级项目在一个特定时间的背景下,
TC - - - - - -
公关 可以为目标用户推荐更准确的结果,同时提高处理速度,推荐精度。
图2
个性化推荐系统的框架time-aware CNN-based TC-PR。
4所示。Time-Aware CNN-Based个性化推荐
CNN-based推荐算法可以推荐项目,满足用户的利益通过分析用户的特性,产品的特性,用户的评级信息。推荐使用CNN模型时,往往忽略了用户的上下文因素或包含时间上下文因素模型作为一个共同特征。然而,推荐系统的成功往往取决于其理解和应用程序上下文的推荐请求。因此,时间上下文因素产生重大影响的效率的建议。
TC - - - - - -
公关 有效地缓解本身问题,提高数据处理的速度和准确性的推荐通过引入离散时间参数捕捉真实的时间动态信息的建议。在本节中,我们首先给出一个简短的描述模型的设计
TC - - - - - -
公关 节
4.1 。然后在节
4.2 ,我们给的详细算法描述time-aware CNN-based个性化推荐算法。
4.1。模型设计
在本节中,我们首先给出一个简短的描述time-aware CNN-based推荐模型中使用
TC - - - - - -
公关 节
以下4.4.1 然后解释time-aware项评级预测和建议部分
4.1.2 。
以下4.4.1。Time-Aware CNN-Based推荐模型
关键的想法
TC - - - - - -
公关 是计算预测评级的目标用户和推荐有趣的项目目标用户通过分析颞下动态特性和项目特性用户的时间上下文。也就是说,类似的用户上下文将有共同的喜好。因此,它是非常重要的对于time-aware CNN-based推荐性能选择类似的用户为目标用户准确地同时上下文。
首先,
TC - - - - - -
公关 抓住了时间信息,即。,t我米e context associated with the users’ behaviors. Then feed the user features, item features, and temporal information to the input layer of CNN as input data and obtain the original matrix. And extract features of the matrix by the convolution layer; the formula for calculating the output results is shown in formula (
2 )。之后,得到的输出结果,因为计算相邻层之间的神经网络可以通过线性模拟,但只有线性操作,多个卷积层相当于一个卷积层的操作,因此有必要使用活化层的激活函数进行非线性操作,使神经网络来模拟更复杂的模型。主要有两个激活函数中使用传统的神经网络中,例如,
σ
x
和
双曲正切
x
。两个激活函数是指数操作,效率低下。在使用的过程中这两个激活功能,有小的区间范围和梯度的消失的问题。为了解决这两个问题,Relu功能主要用于,见公式(
3 ),它是一个线性操作,效率高。和池层是用于采样下来,稀疏特性数据的处理来降低计算的数据量。典型的池方法包括平均池和马克斯池。池公式所示的公式(
4 )。为了减少损失的特征信息,采用完整的连接方法来改装在CNN的尾巴。最后,由输出层输出的结果。
(2)
N
2
=
N
1
+
2
P
−
F
步
+
1
,
在哪里
N 2 输出的大小,
N 1 输入数据的大小,
F 卷积核的大小,跨步卷积的滑步内核,然后呢
P 填写输入数据以大于1时可分割的一步。
(3)
f
x
=
马克斯
0
,
x
,
在实际数量需要梯度小于0时0,和实际数量是梯度大于0时,避免了梯度的消失的问题。
(4)
N
2
=
N
1
−
F
步
+
1
,
4.1.2。Time-Aware项评级预测
首先,每个处理信息表的属性,和字段的属性类别转换为数字,而这些数字是用作嵌入式矩阵的指数。然后嵌入层是用于网络的第一层。之后,利用嵌入式层的输出特性,特性转移到完整连接层,这一层的输出输入完整连接层。最后,用户特性和产品特性。预测评级项目的训练获得的用户特征向量和项目特征向量,与Top-k项目更高的评级,而不是被目标用户选择根据评级的排名,也就是说,推荐列表
RL 推荐给用户。
4.2。算法描述
的流程图time-aware CNN-based个性化推荐算法如图
3 。首先,原始数据集进行预处理。然后输入处理数据和时间信息,训练网络通过构造神经网络(NN)和计算图表,并获取训练样本的数量。在那之后,训练参数保存到一个文件中。和评估模型训练的神经网络采用均方误差(MSE)的值,可以最小化均方误差值通过不断调整参数,和模型的性能是最好的。最后,用户获得的特性和产品特性模型。我们采用模型计算预测评级,并选择Top-k物品与更高的评级,而不是被目标用户推荐给目标用户。
图3
流程图time-aware CNN-based个性化推荐算法。
算法的伪代码time-aware CNN-based个性化推荐算法所示
1 。
<大胆>算法1:< /大胆> Time-aware CNN-based个性化推荐算法。
输入 :用户。dat,项目。dat,评级。datwith timestamp
R
t ,目标用户
u 、用户
u 的时间上下文
t
输出 :推荐项目列表
u RL
步骤1 :过程数据和处理过的数据保存到preprocess.p;
步骤2 :打开进行预处理。p和设置参数;
步骤3 :构造神经网络和生成用户的特性和产品特性;
步骤4 :构造图来计算预测评级由用户相似性计算,根据MSE更新参数设置;
步骤5 :随机将数据集分为训练集和测试集,然后训练神经网络;
步骤6 :保存训练模型和参数;
步骤7 :加载保存模型为目标用户推荐
u 根据
t ;
步骤8 :产生推荐列表
RL 从time-aware CNN-based个性化推荐算法;
步骤9 :
返回RL。
5。实验
在本节中,我们首先介绍实验数据集
5。1 ,然后引入信息检索和数据预处理部分
5。2 ,给一个简短的描述实验设置部分
5。3 。评价方法和参数的影响
TC - - - - - -
公关 所示部分
5。4 和
5。5 ,分别。最后,实验结果和不同方法的性能比较部分所示
5。6 。
5.1。实验数据集
在本文中,我们使用MovieLens-1m (
https://grouplens.org/datasets/movielens/lm/ )收集的实验数据集GroupLens明尼苏达大学研究项目作为实验数据,其中包括1000000评级从6040用户3952个不同的电影。实验数据集主要包含以下信息,用户数据在图所示
4 (a),其中包括一些属性,例如,UserID, Gender, Age, Occupation, and Zip-code, where Gender is represented by M, F, Age is divided into several age groups, and Zip-code is of no use. The rating statistics are shown in Figure
4 (b),其中包括四个属性,即。,UserID, MovieID, Rating, and Timestamp. And the movie statistics are shown in Figure
4 (c),其中包括三个属性,即。MovieID,标题,和流派。
图4
实验数据集的样本。
(一)
(b)
(c)
如图
4 (b),用户的评级范围从1到5。评级越高,用户的偏好。如图
4 (c),一部电影可能有一个以上的类型,例如,犯罪和冒险,在同一时间。表
1 列出了总结实验数据集的信息。
表1
实验数据集的统计数据。
数据集
#用户
#电影
#评级
离散时间(天)
稀疏(%)
MovieLens-1m
6040年
3952年
1000209年
周末,工作日
4.1
5.2。信息检索和数据预处理的时间
为了处理数据更快更顺利的在以后的阶段,我们首先进行预处理数据,数据格式标准和更适合操作。我们处理用户信息表、电影信息表,分别和user-item评级信息表。
算法的数据预处理算法
2 主要包括三个过程。用户信息表的属性
users.dat ,我们需要把性别价值观“F”和“M”数字0和1,代表几个年龄组段连续数字0∼6。电影里的属性信息表
电影 。
dat ,电影标题和电影类型都是类别字段,而且他们也需要被转换成数字。电影类型的属性,首先电影类型属性的值转换成字符串和存储在一个数字字典,然后相应的电影每部电影的类型的值转换为一个数字列表,因为大多数电影有多个类型。电影标题属性,核心思想是一样的电影类型的属性。它只是创建一个文本数字字典,然后电影标题的描述转换成一个数字列表,并删除从电影标题。属性user-item评级信息表,时间戳属性需要转换成特定的时间信息。
<大胆>算法2:< /大胆>数据预处理算法。
(1)
过程
users.dat
(2)
读users.dat。
(3)
在users.dat性别和年龄属性。
(4)
更新性别= {" F ": 0,“M”: 1}。
(5)
foreach 年龄
在 列举(设置(用户(“年龄”))
(6)
["年龄"]=用户(“年龄”). map(年龄)
(7)
foreach结束
(8)
结束程序
(9)
过程
movies.dat
(10)
读movies.dat。
(11)
在movies.dat得到电影类型属性。
(12)
genres_set =组()
(13)
foreach 类型
在 电影(“流派”).str.split (“|”)
(14)
genres_set.update(类型)
(15)
foreach结束
(16)
foreach genreint
在 列举(genres_set)
(17)
在列举genres_map = {genreint(设置(电影(“流派”)))}
(18)
foreach结束
(19)
结束程序
(20)
过程
ratings.dat
(21)
读ratings.dat。
(22)
在ratings.dat获取时间戳属性。
(23)
foreach 时间戳
在 评级
(24)
时间戳= datetime.fromtimestamp (int(时间戳)).weekday ()
(25)
foreach结束
(26)
结束程序
5.3。实验装置
TC - - - - - -
公关 实现与Tensorflow [
27 )框架,建立在Windows pip 10.0.1和python 3.5。Tensorflow不仅可以实现并行计算在许多cpu或gpu在单个机器上,而且分布式计算(
28 ,
29日 )从而大大提高了算法的运行速度。进行的实验是在1.8 GHz四核处理器的Windows机器上有4 GB内存和700 GB硬盘。
5.4。评价指标
我们评估
TC-PR 与均方误差均方误差(公式(
5 ))和均方根误差均方根误差(公式(
6 )在CNN流行指标如下:
(5)
均方误差
=
∑
u
,
我
∈
T
r
u
我
−
r
^
u
我
2
T
,
(6)
RMSE
=
1
T
∑
u
,
我
∈
T
r
u
我
−
r
^
u
我
2
,
在哪里
u
表示用户,
我
表示项目,
r
u
我
表示用户
u 真正的评级项目
我,
r
^
u
我
表示用户
u 的预测评级项目
我 ,
T
代表项目的总数。小美值或一个较小的RMSE值意味着一个更好的推荐算法的性能。
5.5。参数的影响
在本节中,我们将展示关键参数的影响,例如,f我lter_number (the size of convolution kernel), stride (the size of the sliding window), learning_rate (learning rate), and batch_size (batch size) in
TC - - - - - -
公关 基于Tensorflow框架。培训的价值损失和损失测试图所示
5 。
图5
培训损失和损失与不同的参数设置进行测试。
5.5.1。参数设置TC-PR
如图
5 ,我们可以观察到培训损失和测试损失变化参数设置。根据最小化均方误差达到调整参数
TC - - - - - -
公关 。表
2 给出了具体的参数设置和均方误差值。
表2
参数设置的信息。
Filter_number
步
Batch_size
Learning_rate
均方误差
8
2、3、4、5
256年
0.0001
0.740
5.6。实验结果和分析
5.6.1。性能的TC <斜体> < /斜体> - <斜体>公关< /斜体>
在本节中,电影评级计算和预测的电影推荐给目标用户
TC - - - - - -
公关 。表
3 给我们提出的推荐电影列表的例子
TC - - - - - -
公关 和表
4 给推荐的电影列表的例子一般CNN算法。在我们的实验中,我们使用两个类别的时间间隔,即。工作日和周末。我们分析表中推荐的电影列表的例子
3 和
4 并绘制饼图(图
6 根据表中的数据)。
表3
推荐的TC-PR电影列表的例子。
用户ID
的推荐列表
推荐电影标题
时间间隔
推荐电影流派
234年
1
Tigrero:电影是从来没有(1994)
工作日
纪录片|戏剧
2
《马耳他之鹰》(1941)
神秘黑色|
3
《天安门》(1995)
纪录片
4
辛德勒的名单(1993)
戏剧|战争
5
错误的裤子(1993)
动画|喜剧
6
说话的天使(1998)
戏剧
7
日落大街。(也称为日落大道)(1950)
黑色电影
8
让我的音乐(1946)
动画儿童| |音乐剧
9
肖申克的救赎(1994)
戏剧
10
夺宝奇兵(1981)
冒险行动|
234年
1
星战前传iv新希望(1977)
周末
冒险行动| | |科幻幻想
2
《卡萨布兰卡》(1942年)
浪漫戏剧| |战争
3
《现代启示录》(1979年)
戏剧|战争
4
拯救大兵瑞恩(1998)
戏剧行动| |战争
5
辛德勒的名单(1993)
戏剧|战争
6
Hangmen也死(1943)
戏剧|战争
7
救生艇(1944)
戏剧|惊悚片|战争
8
站在我身边(1986)
冒险| |喜剧上演
9
外星人(1986)
动作惊悚科幻| | |战争
10
中国东北人候选人》(1962)
黑色|惊悚片
表4
推荐的电影列表的例子一般CNN-based推荐算法。
用户id
的推荐列表
推荐电影标题
时间间隔
推荐电影流派
234年
1
城市的灯光(1931)
没有部门
浪漫喜剧戏剧| |
2
《后窗》(1954)
神秘|惊悚片
3
辛德勒的名单(1993)
戏剧|战争
4
《教父》(1972)
犯罪行动| |戏剧
5
通常的嫌疑人(1995)
|犯罪惊悚片
6
臭名昭著的(1946)
黑色浪漫| |惊悚片
7
大逃亡(1963)
战争冒险|
8
夺宝奇兵(1981)
冒险行动|
9
七武士(七宗罪)(Shichinin没有武士)(1954)
行动|戏剧
10
撒迦利亚(1971)
西方
图6
推荐电影列表不同的算法。(一)TC-PR推荐的电影流派。(b)推荐的电影流派一般CNN-based推荐算法。
(一)
(b)
在实验中,我们使用
TC - - - - - -
公关 用Tensorflow实现框架,和一般CNN-based推荐和更高的预测算法推荐Top-k电影评级,而不是被目标用户为目标用户。推荐结果的目标用户ID是234中描述表
3 和
4 ,分别。如表所示
3 ,时间分为两个分散的时间间隔,即。工作日和周末。十大电影推荐给目标用户根据不同的时间间隔,分别。然而,表
4 为目标用户推荐十大电影没有分裂的时间间隔。我们可以清楚地注意到分裂的时间间隔有明显影响推荐电影的流派为目标用户通过观察表。
推荐的电影清单表
3 和
4 由饼状图,如图
6 。
从图
6 ,我们可以观察到
TC - - - - - -
公关 和普通CNN-based推荐算法的推荐电影为目标用户的用户ID是234年推荐电影的类型有明显的区别。实验结果的数据
6(一) 和
6 (b) 详细分析如下:
(我)
推荐的电影的流派
TC - - - - - -
公关 :流派的电影推荐图所示
6(一) 。在time-aware CNN-based算法,我们把时间分成两种时间间隔,即。工作日和周末。图的左半部分
6(一) 显示了体裁的电影推荐给目标用户在工作日期间,而正确的图的一半
6(一) 展示了电影的流派周末推荐给目标用户。在图的左半部分
6(一) ,我们可以看到,20%的10与恐怖类型电影推荐,这是最大的比例,和恐怖的电影,冒险,神秘明显超过电影喜剧和戏剧。正确的图的一半
6(一) ,我们可以看到10的比例推荐电影与戏剧和战争体裁是最大的,这是39%。我们可以发现电影喜剧和戏剧流派显然超过恐怖和冒险的电影流派通过观察。总之,我们可以看到从图
6(一) 那
TC - - - - - -
公关 可以推荐更准确的物品(电影)为目标用户。
(2)
推荐的电影流派一般CNN推荐算法:流派的电影推荐图所示
6 (b) 。一般的CNN推荐算法为目标用户推荐电影直接不考虑目标用户的上下文信息。图
6 (b) 显示了类型的电影推荐给目标用户。在图
6 (b) 中,我们可以看到十电影推荐,电影的类型相对较宽,比例不是明显不同。很难推荐电影,满足用户的偏好。
TC - - - - - -
公关 可以更准确地推荐电影,满足用户的偏好。在用户评分矩阵稀疏的情况下,它可以避免低的缺点传统CF算法的推荐精度。在大量数据的情况下,它可以并行处理,大大提高操作的速度。
5.6.2。性能比较
我们比较TC-PR提出以下基线在同一数据集:
(我)
Baseline1:基于用户的CF
(2)
Baseline2: time-aware CF
(3)
Baseline3: CNN-based推荐算法
TC-PR和三个基线的详细比较结果如图所示
7 。
图7
四个推荐算法的性能比较。
它可以观察到,在所有的方法相比,TC-PR达到最佳性能,精度最高和最好的推荐效果。
5.6.3。进一步讨论
我们讨论挑战和机遇提出time-aware CNN-based个性化推荐系统。目前,
TC - - - - - -
公关 只有意识到与Tensorflow框架但没有分布式实现。计算边缘的快速发展和研究(
30. ),一个实时和分布式time-aware CNN-based个性化推荐系统在边缘计算环境可以大大提高性能,使其更适用。
6。结论和未来的工作
本文提出一种time-aware CNN-based个性化推荐系统基于Tensorflow TC-PR框架。TC-PR使我们能够捕捉用户的历史行为的时间信息,提高推荐精度。与传统推荐算法相比,当使用TC-PR建议,数据集越大,稳定性越高的训练,和推荐的准确性就越高。TC-PR克服了传统方法的局限性,提高了系统的性能。MovieLens-1m真实数据集上的实验结果表明,该TC-PR能有效缓解本身问题,极大地提高建议处理的速度和准确性。对于未来的工作,我们将继续探索更精确的时间划分模型和考虑其他深度学习模型实现time-aware个性化推荐系统。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
这项研究是在辽宁省自然科学基金的支持下,中国(批准号20170540471),中国辽宁省的一般科学研究项目(批准号2019 lnjc07),辽宁科技大学人才项目(批准号601011507 - 22)。
[
]1
越南盾
J。
李
X。
方
B。
基于多属性的推荐系统
学报》2016年第九届国际会议服务的科学
2016年10月
中国重庆
IEEE计算机协会
10.1109 / ICSS.2016.30
2 - s2.0 - 85034247364
[
]2
王
M。
刘
M。
刘
J。
王
年代。
通过医学知识图嵌入安全医学建议
2017年
https://arxiv.org/abs/1710.05980
[
]3
刘
H。
口
H。
杨ydF4y2Ba
C。
气
l
链接预测在论文引用网络构建关联图
EURASIP无线通讯和网络》杂志上
2019年
2019年
1
233年
10.1186 / s13638 - 019 - 1561 - 7
2 - s2.0 - 85073630078
[
]4
气
l
张
X。
窦
W。
倪
Q。
一个分布式locality-sensitive hashing-based方法从多源数据云服务的建议
IEEE在选定地区通讯》杂志上
2017年
35
11
2616年
2624年
10.1109 / jsac.2017.2760458
2 - s2.0 - 85031776244
[
]5
气
l
周
Z。
余
J。
刘
Q。
Data-sparsity宽容web服务基于改进的协同过滤推荐方法
IEICE交易信息和系统
2017年
E100.D
9
2092年
2099年
10.1587 / transinf.2016edp7490
2 - s2.0 - 85029409851
[
]6
龚
W。
气
l
徐
Y。
Privacy-aware多维移动服务在分布式雾环境质量预测和建议
无线通信和移动计算
2018年
2018年
8
3075849
10.1155 / 2018/3075849
2 - s2.0 - 85046682540
[
]7
气
l
张
X。
窦
W。
胡
C。
杨
C。
陈
J。
基于两级locality-sensitive散列方法保护隐私跨平台边缘环境中移动服务的建议
未来一代计算机系统
2018年
88年
636年
638年
10.1016 / j.future.2018.02.050
2 - s2.0 - 85048165651
[
]8
张
X。
窦
W。
他
Q。
LSHiForest:基于一个通用的框架,用于快速树隔离合奏异常分析
4
美国第33 IEEE国际会议数据工程,ICDE 2017
2017年4月
圣地亚哥,加州,美国
10.1109 / ICDE.2017.145
2 - s2.0 - 85021224328
[
]9
黄
l·W。
江
b . T。
Lv
s Y。
基于深度学习推荐系统研究的总结
中国日报的计算机
2018年
41
427年
191年
219年
[
]10
Cantador
我。
Vallet
D。
基于内容的推荐在社会标签系统
学报2010年ACM关于推荐系统的会议
2010年9月
西班牙巴塞罗那
[
]11
李
C。
梁
W。
吴
Z。
一个高效的分布式计算框架association-rule-based建议
学报2018年IEEE国际会议上的Web服务(ICWS)
2018年7月
旧金山,加州,美国
IEEE
339年
342年
10.1109 / ICWS.2018.00056
2 - s2.0 - 85054010989
[
]12
庞
Y。
京ydF4y2Ba
Y。
张
Y。
朱
T。
协同过滤推荐蕴藏的应用程序
计算机应用在工程教育
2017年
25
1
120年
128年
10.1002 / cae.21785
2 - s2.0 - 85010451170
[
]13
陆
p Y。
吴
X X。
腾
d . N。
混合推荐算法对电子商务的网站
《2015国际研讨会上计算智能与设计
2015年12月
杭州,中国
IEEE
10.1109 / ISCID.2015.140
2 - s2.0 - 84978148601
[
]14
雪
a . Y。
气
J。
谢
X。
张
R。
黄
J。
李
Y。
在目的地预测解决数据稀疏问题
VLDB日报
2015年
24
2
219年
243年
10.1007 / s00778 - 014 - 0369 - 7
2 - s2.0 - 84925291122
[
]15
郭
y . H。
邓
g S。
项目本身的混合推荐算法协同过滤系统
计算机工程
2008年
34
23
11
13
[
]16
萨利希
s . s . M。
Erdogmus
D。
Gholipour
一个。
Auto-context卷积神经网络(Auto-Net)磁共振成像的大脑提取
IEEE医学成像
2017年
36
11
2319年
2330年
10.1109 / TMI.2017.2721362
2 - s2.0 - 85023777340
[
]17
吴
年代。
任
W。
余
C。
个人推荐使用网易深度递归神经网络
学报2016年IEEE第32数据工程国际会议(ICDE)
2016年5月
芬兰赫尔辛基
IEEE计算机协会
10.1109 / ICDE.2016.7498326
2 - s2.0 - 84980329183
[
]18
李
w·J。
研究Time-Aware推荐算法
2017年
成都,中国
中国电子科技大学
[
]19
元
Q。
琮
G。
马
Z。
Time-aware兴趣点建议
学报》国际市立图书馆会议信息检索的研究与发展
2013年7月
爱尔兰都柏林
ACM
[
]20.
魏
年代。
叶
N。
张
Q。
Time-aware协同过滤推荐系统
《中国会议模式识别
2012年9月
中国,北京
施普林格
10.1007 / 978 - 3 - 642 - 33506 - 8 - _81
2 - s2.0 - 84867122625
[
]21
张
j . D。
周润发
c . Y。
TICRec:概率框架利用时间相关性影响time-aware位置的建议
IEEE服务计算
2017年
9
4
633年
646年
10.1109 / TSC.2015.2413783
2 - s2.0 - 84982149273
[
]22
李
Y。
陈
W。
杨ydF4y2Ba
H。
学习基于嵌入time-aware产品推荐
学报2017 ACM会议信息和知识管理
2017年11月
新加坡
ACM
2163年
2166年
10.1145/3132847.3133060
2 - s2.0 - 85037366554
[
]23
唐
J。
王
K。
通过卷积序列嵌入个性化头n个顺序推荐
学报》第11届ACM国际会议网络搜索和数据挖掘
2018年2月
玛丽安德尔湾、钙、美国
ACM
565年
573年
10.1145/3159652.3159656
2 - s2.0 - 85046907121
[
]24
王
年代。
太阳
l
方ydF4y2Ba
W。
一个自动化的CNN推荐系统对图像分类任务
学报2017年IEEE国际会议多媒体和世博会(ICME)
2017年7月
中国香港
IEEE计算机协会
10.1109 / ICME.2017.8019347
2 - s2.0 - 85030239940
[
]25
王
J。
太阳
J。
林
H。
越南盾
H。
张
年代。
卷积神经网络专家推荐的社区问答
中国科学信息科学
2017年
60
11
19
27
10.1007 / s11432 - 016 - 9197 - 0
2 - s2.0 - 85031903623
[
]26
王
h . Y。
越南盾
m·W。
潜在的集团推荐基于动态概率矩阵分解模型集成与CNN
计算机研究与发展》杂志上
2017年
54
8
1853年
1863年
[
]27
Abadi
M。
阿加瓦尔
一个。
巴勒
P。
Tensorflow:大规模机器学习在异构分布式系统
2016年
https://arxiv.org/abs/1603.04467
[
]28
徐
X。
张
X。
高
H。
元
X。
气
l
窦
W。
成为:blockchain-enabled计算卸载移动边界计算的物联网
IEEE工业信息
2019年
10.1109 / TII.2019.2936869
[
]29日
徐
X。
刘
Q。
张
X。
张
J。
气
l
窦
W。
一个blockchain-powered众包在移动环境下隐私保护方法
IEEE计算社会系统
2019年
6
6
1407年
1419年
10.1109 / TCSS.2019.2909137
[
]30.
徐
X。
他
C。
徐
Z。
气
l
王ydF4y2Ba
年代。
下榻的饭店
m . z。
联合优化卸载工具和隐私边缘计算使物联网
IEEE物联网
2019年
10.1109 / JIOT.2019.2944007