文摘

影视文学的建议是一个人工智能算法,建议根据用户偏好和记录相关内容。广泛应用于各种应用程序和网站为用户提供了极大的方便。本文旨在研究物联网和机器学习技术,结合深入学习,强化学习,和推荐算法,实现准确的推荐影视文学。本文提出了使用ConvMF-KNN推荐模型验证和分析及的四种模式,ConvM, ConvMF-word2vec和ConvMF-KNN,分别在公共数据集。使用两偶图中的顶点之间的路径信息,考虑顶点的度,项目之间的相似度计算,邻居项目集的物品。实验结果表明,ConvMF-KNN模型结合资讯理念有效地提高了推荐精度。相比之下,及模型的准确性MovieLens 100 k, MovieLens 1 M, AIV数据集,ConvMF模型的准确性上面的三个数据集是5.26%,6.31%,和26.71%,分别增长2.26%,1.22%,7.96%。这个模型具有重要意义。

1。介绍

快速增长的在线影视文学资源,如何快速获取有效信息和最新的信息从大量的数据和信息,以及如何提高信息检索的精度和质量,满足不同用户的需求推动的信息,已成为迫切需要解决的问题。多元化的信息需求是影视文学的关键的建议。一般来说,用户可以搜索他们需要的信息从大量的网络资源信息和信息推拉。信息将意味着用户主动搜索他们所需要的信息资源在互联网上根据他们自己的需要。一个典型的例子是一个搜索引擎;信息推送是指网站、软件应用等,推动信息资源需要由用户根据用户需求。中国物联网技术开始的同时,世界上其他国家,和物联网产业发展迅速在短时间内。

影视软件的不断普及,在影视文学的信息量将保持快速增长势头在未来一段时间,和信息过载的负面影响也将变得更加严重。因此,影视文学的研究和应用推荐系统和基于物联网的推荐算法和机器学习在资源共享和解决信息超载产生深远意义。

相比之下,影视文学的研究与应用的建议基于物联网(物联网)和机器学习,有许多研究在电子商务推荐系统和推荐算法。因此,朴等人提出了一个entropy-based推荐算法来解决这一问题的实验。结果表明,该算法具有较高的精度,适用于使用。然而,使用这种方法更为复杂,导致结果的错误(1]。实现安全的物联网网络时,你将面临一些问题,如内部异质性系统和设备的数量,需要解决。分类算法包括神经网络(NN)和支持向量机(SVM),可用于检测在媒体访问控制层DoS攻击。为此,Canedo Skjellum使用机器学习在物联网网关,以帮助保护系统中,他们研究了利用人工神经网络(ann)网关检测异常从边缘设备发送的数据。这种方法可以提高物联网的安全系统(2]。

本文的创新如下。(1)一个引人注目的评分预测的协同过滤算法来解决这个问题所导致的系统质量退化的用户数量的增加。(2)ConvMF-KNN推荐模型提出了推荐影视文学。针对噪声样本的支持向量的影响,本文提出了一个方法来处理噪声通过使用向量在每个集群标准。

2.1。机器学习

神经网络和支持向量机训练模型是基于两个变量:冲突率和到达率(3,4]。在神经网络中,如果检测DoS攻击的可能性大于设定的阈值,就认为一个DoS攻击发生。SVM将DoS攻击分为两个层次,低或高,检测是否攻击发生在从低到高顺序5]。对于物联网的安全问题,结合机器学习,物联网的安全已经大大提高,有效地减少故障和预防隐私泄露。监督学习是推断模型的识别和判断未来的能力训练数据的标签。每个样本包含一个输入和一个输出对象。

2.2。物联网安全

物联网安全技术包括几个关键技术:网络安全;身份授权;加密;安全的侧信道攻击;安全威胁分析和预测;接口保护;交付机制;和系统开发6,7]。物联网一般包括三个层次:感知层、网络层和应用程序层。如下图所示,传感层位于底层,它包含各种数据采集终端,如传感器、射频识别阅读器,标签,和相机8]。物联网的体系结构如图1。在电影推荐算法,基于协同过滤算法,本文使用内容过滤的过滤掉电影不同于用户的利益,以提高协同过滤,提高电影推荐的准确性。

在收集各种数据,有必要通过一个分类器来实现数据分类。不同的分类算法有不同的精度、速度、健壮性等。分类算法的特点,确定最终的推荐的准确性。以下介绍三种基本分类算法和综合比较它们的性能。

2.2.1。决策树

决策树分类算法是基于实例样本进行分类。它将无序实例样本和推断从他们的决策树表示形式的分类规则。通过自顶向下的递归方法,内部节点(非叶节点)比较属性值一个接一个地完成分支,最后做决定的最后决策树(叶子节点)。决策树生成过程如图2

2.2.2。人工神经网络

人工神经网络(ANN)可以抽象、简化和模拟人类大脑的结构和功能。人工神经网络通常可以分为前馈网络和反馈网络。在实际应用程序中,应用最广泛的神经网络前馈网络,及其网络结构如图3

尽管这些建议可能引起新的当前用户的利益,这显然是有风险的,把电影的电影类型,用户从未下令在顶部位置。因此,应该做的是保留但减少他们的排名在推荐列表中。的三层BP神经网络作为一个例子,在每一层神经元的数目是不确定的。假设在输入层神经元的个数,输出层和隐层n、米和k分别,我们得到

通过分权和增加透明度和可信度来保护用户的隐私和关键信息,提出了一种新的解决方案方向解决物联网的安全。在上面的公式中, jth输入样本;在隐藏层, 输入向量和吗 是输出向量;在输出层, 输入向量和吗 是输出向量;和 是激活函数。学习和培训是使误差平方和达到最小,而且误差函数

全球误差的公式如下:

2.2.3。支持向量机

支持向量机(SVM)是最常用的分类算法在分类算法。它是开发基于进化的线性可分的最优分类面。本质是将点的空间划分为两类。

对于线性可分的情况,有必要找到分类超平面H:

然后,H超平面可以区分两种类型的样本点,从任何角度和距离公式xH

2.3。推荐算法

基于内存的协同过滤算法提出了很长一段时间,已经有很长的研究历史。算法的实现步骤一般分为两个步骤:第一步是计算目标用户和其他用户之间的相似度,第二步是找到目标用户的最近的数据集根据相似性,然后使用这个数据集来预测目标用户的评分的得分项(9]。此外,它还可以计算目标项目之间的相似性和其他物品10]。推荐算法的分类如图4

基于项目的协同过滤更多关注用户的现有的爱好。一般来说,电影符合用户的历史偏好推荐。电影推荐算法将过程划分为三个部分,即特征提取部分,马尔可夫决策过程建模,模型训练的一部分。这部电影推荐算法的详细图如图5

基于内存的算法步骤算法主要分为以下3个步骤。

2.3.1。建立一个User-Item评级矩阵

推荐系统通常包括两个用户反馈机制:一是用户评价商品,系统保存评级信息在关系数据库中。在×j矩阵,有用户和n物品。矩阵中对应的值是用户的评级在项目j,零意味着没有评级行为。另一个是收集用户行为,例如用户喜欢和最爱。当构建user-item行为矩阵,这种行为通常是用二进制表示的。在×j矩阵,有用户和j物品,指示用户是否执行某些行为项吗j;0表示行为尚未发生,1表示行为发生。

评级的用户和项目之间组成的矩阵如表所示1,用户之间和矩阵组成的评级和行为表所示2

2.3.2。计算用户之间的相似性和物品

它计算类似的项目根据用户的兴趣和偏好。在一个基于内存的算法,需要计算用户之间的相似性和物品。常用的相似度计算公式包括Jaccard相似系数(11],皮尔森相似[12],余弦相似度(13),等等。

皮尔森相似。欧氏距离是一种常用的数学方法找到两个点之间的距离。能找到绝对的两个向量之间的距离,也是一种计算相似度的方法。欧氏距离非常常用的数学。之间的欧几里得距离向量的数学表达式XY如下:

余弦相似性计算两个向量之间夹角的余弦值,可以用来判断相似的方向向量。如果两个向量是垂直的,相似度是0;相反,如果两个向量是平行的,相似度是1。两个向量的余弦相似度的数学形式N定义如下:

皮尔森相似性计算两者之间的相对距离。皮尔森相似的值范围(−1,+ 1)−1意味着不同的,+ 1的意思是类似的,范围从−1 + 1意味着相似。两者之间的不同或相似度如下: 老地方代表相似,代表之间的相似程度,项目, 代表用户u的评级的物品n分别 代表用户评价两项n, 代表用户的平均分数 为项目, 代表用户的平均分数 为项目n

Jaccard系数。它等于十字路口的数量的比例的样本集数量的工会和用于测量两组的相似性。这个指数的计算公式所示(4)。 在哪里 代表用户之间的相似性和用户jN(),N(j),分别代表物品的数量被用户和用户j(14]。

余弦相似度。这法官相似度计算两个向量之间的夹角的余弦值内积空间,和它的余弦值范围是[−1,1]。余弦相似度的关键是看矢量方向的差异,没有长度或距离的差异15]。这个指数的计算下列公式所示:

后计算上述评分矩阵或行为的相似性矩阵,根据相似性数据筛选找到最近的邻居或用户设定的目标项目。通常有两种方法来筛查和生成最近邻集合:一个是最近邻分类算法(16),另一个是阈值法(17]。最近邻分类算法,预测数据应该与训练样本找到最相似的K训练样本,和标签出现在这些K最训练样本作为最终的预测标签。常用的算法主要是资讯的算法。

2.3.3。基于最近邻集生成推荐结果

生成最近邻设置后,我们可以预测其他未分级的项目和电影的评级基于目标用户的评级的物品和电影,然后选择顶部N预测分数最高的电影,并推荐给用户。预测计分公式如下:

3所示。实验设计

3.1。数据预处理

这部电影介绍信息包含大量的无效信息,比如标点符号和空格不能用作CNN输入结构。因此,有必要进行预处理电影介绍信息。首先,去掉标点符号,空格,介词和其他角色在电影信息。每个配置文件中的所有文字的最大数量是max_length。如果长度超过这个长度,直接将被截断,只有这句话之前max_length概要文件将被处理。然后,把所有的词在电影中引入一个列表l,这句话从高到低进行排序,并选择vocab_size单词频率和最高不超过阈值max_df形成Voc列表。执行词向量转换词l。出现的单词l但不是在挥发性有机化合物,所有词向量的平均值Voc用于向量化。它模拟生物神经元的处理方法。处理后的信号达到一定条件时,将信号传递给下一层。

3.2。CNN模型和Hyperparameters

CNN的具体设计网络结构如图6。图6细节的设计和特定的配置每一层在CNN网络结构。本文优化基于协同过滤的推荐系统的推荐系统更个性化的和准确的。

卷积层包含三个卷积核的大小300∗∗4,300和300∗5。卷积的输入层嵌入的输出层。每次卷积层后,有一个池层,和三个池层100年得到输出结果的大小,分别。并行连接这三个池层作为输入完全连接层的1。每个模型都有一个相应的hyperparameter,每个hyperparameter将产生不同的影响模型的准确性。特别是在深度学习技术,参数训练和选择非常重要,需要大量的时间和精力。

3.3。ConvMF-Word2vec

原始数据是随机打乱,然后切片,分为训练集,验证集和测试集8:1:1。使用训练集训练ConvMF-word2vec模型,并验证用于验证模型训练的结果。最后,ConvMF-word2vec模型的性能测试在测试集来获取最终的RMSE。谷歌引擎数据库使用训练集作为初始嵌入层ConvMF-word2vec CNN的实验过程。

3.4。ConvMF-KNN

原始数据是随机打乱,然后切片,分为训练集,验证集和测试集8:1:1。火车上的ConvMF-KNN模型训练集、验证模型在训练集上训练后获得的验证集,最后法官ConvMF-KNN的性能模型在测试集上得到最终的RMSE。ConvMF-KNN实验过程中,然而,是用于纠正每个评分项ConvMF预测。

4所示。实验结果和分析

4.1。实验结果和分析ConvMF MovieLens 100 k

传统的前提下被动入侵检测系统,网络中的每个节点的接收信号强度是用来检测入侵的信号。为了优化ConvMF模型,通过网格搜索,MovieLines 100 k数据集,当学习速率= 0.00001,50 D =, = 100 = 1,此时ConvMF RMSE获得最小值为0.9258。个性化的电影推荐系统通常是积极的建议。通过分析用户的信息和行为,它可以挖掘用户的偏好,然后推荐电影给用户。具体来说,RMSE MovieLens 100 k的影响如表所示3

4.2。实验结果和分析ConvMF-KNN MovieLens 100 k

数据集ml - 100 k,推荐的准确性(RMSE) ConvMF-KNN影响的价值k。从图可以看出7时的价值k逐渐从10增加,RMSE1逐渐减少。当K= 100,RMSE达到最小值,推荐的准确性是最准确的。时的值k大于100,RMSE1没有显著变化。从数据集,我们可以计算电影被每个用户的平均数量约为100。因此,当K= 100,推荐精度是最准确的,这意味着每个用户关注的电影得到了充分的考虑。当K大于100,RMSE1显然很少变化,如图7。基于内容的推荐算法主要使用内容过滤技术过滤项类似于用户的兴趣大量物品,以便推荐给用户。

4.3。改进的模型和实验结果和数据分析及和ConvMF MovieLens 100 K和MovieLens 1 M

每个模型的实验结果的比较如表所示4

解释和分析表4:(1)改进模型ConvMF-word2vec和ConvMF-KNN改善精度数据集MovieLens 100 k, MovieLens 1 M,分别和AIV。(2)后ConvMF-word2vec使用谷歌引擎数据库pretraining向量集,推荐精度MovieLens 100 k和MovieLens 1 M的数据集是ConvMF相比略有改善,但效果不明显,只有1%。(3)ConvMF-KNN模型结合资讯理念对推荐的准确性有更大的影响。模型的准确性及MovieLens 100 k, MovieLens 1 m, AIV数据集已经增长了5.26%,6.31%,和26.71%,分别。与ConvMF模型相比,其准确性增加了2.26%,1.22%,和7.96%,分别。

5。结论

物联网安全技术、机器学习、和推荐算法发展迅速,影视文学的建议是越来越受欢迎。人们通常开始在互联网上寻找他们喜欢的电影和文学作品。电影行业发展多年来,大量的电影在世界上已经存在,和大量的新电影将每年发布,和电影信息过载的现象会越来越严重。面对大量的视频,推荐算法的应用电影和视频行业提高了用户体验。传统的协同过滤算法发挥了不可替代的作用,但是随着时代的发展和深度学习和其他技术的成熟,传统的推荐算法逐渐与深度学习和其他技术相结合,并逐渐产生了一系列的新算法。本文介绍常见的推荐算法和关注的推荐算法基于得分矩阵和概率矩阵分解的推荐算法和推荐算法基于深度学习,ConvMF,加上资讯的想法改善ConvMF算法。一个新的算法,ConvMF-KNN,提高推荐精度的数据集。的推荐算法在影视文学中的应用将越来越广泛。

数据可用性

的数据支持本研究的发现可以从相应的作者在合理的请求。

的利益冲突

作者宣称他们没有潜在的利益冲突的研究,本文的作者,和/或出版。

确认

本研究支持的教育研究基金(SGH20Y1529)研究人文通识教育课程的教学地位私立大学和改革策略:一个案例研究的五个私立大学在陕西。本研究也支持了教育研究基金(ybkt - 1801)陕西教育局。