计算智能与神经科学

PDF
计算智能与神经科学/2019/文章
特殊的问题

最近的神经工程自然启发算法的进展

浏览特刊

研究文章|开放获取

体积 2019 |文章的ID 4589060 | https://doi.org/10.1155/2019/4589060

Muhammad Ibrahim,Imran Sarwar Bajwa,Riaz Ul-Amin,Bakhtiar Kasi 神经网络启发的改进和真实的电影推荐方法”,计算智能与神经科学 卷。2019 文章的ID4589060 19 页面 2019 https://doi.org/10.1155/2019/4589060

神经网络启发的改进和真实的电影推荐方法

客座编辑:里卡多·索托
已收到 2019年4月15日
修改后的 2019年5月28日
公认 2019年6月17日
发表 04 2019年8月0日

摘要

近十年来,社交媒体中微博的情感分析、意见挖掘和主体性问题引起了研究者的广泛关注。电影推荐系统是为用户提供有价值服务的工具。由于用户或观众的在线活动日益增多,网络上可用的数据也在逐渐增加。正因为如此,大数据、分析和计算问题出现了。因此,我们必须在传统的基础上改进推荐服务,使推荐系统更有意义、更高效。本文提供了这些问题的解决方案,通过使用多个外部资源(由web机器人获取并由Apache Hadoop框架以分布式方式管理)的电影的多变量(评分、投票、Twitter喜欢和评论)生成重要而高效的推荐服务。通过基于递归神经网络(RNN/LSTM attention)和用户电影注意力(UMA)的深度语义分析器对评论进行分析。推荐者根据用户在手机应用上的喜好,对多种变量进行评估,并高效地生成更有意义的电影推荐列表。

1.介绍

“推荐系统”是使用人工智能(AI)和自然语言处理(NLP)技术的服务,为各种应用程序框架和服务提供建议的经验解决方案[1].推荐系统使移动应用程序和Web应用程序能够智能地对不同项目的选择进行智能化,电影[2),酒店(3.], 食物 [4.,旅游5.)、书籍(6.,电视节目[7.]、YouTube视频[8.], 健康 [9.]等社区趋势朝向音乐,电影或视频的极化。对于音乐或电影或视频,在线提供大量的流,但其中一个人将被观看仍然是一个不断增加的问题。音乐或电影推荐系统仍然具有播放列表,幅度,安全性,隐私,推荐和会话等挑战。因此,MRSS成为音乐信息检索的域名(MIR)[10-13].现在,社会发生了变化,社区趋势高度取决于移动应用程序的使用情况。通过移动应用程序的使用丰富了几种产品。因此,移动应用程序推荐系统对于适用的推荐项目是必不可少的[14-16].大多数推荐系统都是单变量和使用评级和评论或推文[17],其他少数是二元变量(情绪得分和喜好)[18-20.].这项工作是现有技术,并使用多变量矩阵,这使得使用动态方法来根据用户的相对味道来建议电影的决定。术语“多变量”意味着涉及许多变量,如定性变量(语义得分)和三部电影网站的电影的定性变量(语义得分)和数量变量(Twitter喜欢,评级和投票),以获得重要推荐[21].我们的工作是电影评论的极端分组,一篇自以为是的报道被标记为微博文本或评论和情绪的语义情绪[22]使用基于递归神经网络(RNN/LSTM)的语义解析器[2324].缺点是用户对电影的审查的改变可能会影响用户的偏好。通过选择单词的评论的性质使用多语言词典。一些推荐系统使用链接的电影数据库,包括Trovacinema,Google Lode和Netflix,Wikipedia提供有关电影的描述的链接数据和本体[25-27].使用浅层机器学习模型来解决NLP问题是手工制作和耗时的。与传统的机器学习逻辑回归、支持向量机和KNN相比,单词嵌入、基于神经网络的模型获得了成功和流行。

人工神经网络是受人类神经网络启发而建立的数学模型。它们有三个简单的层:输入层、输出层和隐藏层,有时也只有两层:输入层和输出层。输入层通过瘦权连接到隐藏层。隐层输出通过激活函数进行组合 在人工神经网络中,像生物神经网络一样,神经元是节点,而摘要是边缘。在人工神经网络中,每个人工神经元都有一个激活函数。激活函数有sigmoid,范围为0 ~ 1,双曲函数,范围为−1 ~ 1,softmax函数,输出为分类分布,ReLu函数为前馈神经网络。神经网络不是一种算法;它是一个框架,几个机器学习算法来解决一个复杂的工作。因此,我们可以说它是一个神经元集合或神经元网络(https://en.wikipedia.org/wiki/Artical_neural_Network.).递归神经网络(RNN/LSTM)对序列进行语义处理,是深度神经网络的基本结构。RNNs/LSTM的注意力可以完成多个NLP任务。在本文中,我们使用基于LSTM注意的层次神经网络(HNN),通过单词和句子级别的注意来穿透全局用户和电影信息来进行文档表示。将用户在单词和句子层面的评论和电影特征作为评论的语义分析,在真推荐过程中起到重要作用。全局用户信息表示个人行为,电影特征表示电影类型或电影简介或链接数据,这些数据对电影评论的语义提取很有用[28].在自然语言(词序)中,每个词或句子都与另一个词或句子相关,需要从语义上理解。网络机器人、网络代理或爬虫可以获取大量的网络内容数据(评分、评论、喜欢、投票、笑脸、图片和星星),这些都是可以互换使用的相同术语。网络内容(评分、评论、赞、投票、笑脸、图片和星级)对推荐服务很有用。这些内容被评估并对用户进行感知,项目对他人进行推荐[2930.].通过在NoSQL中使用Map-Dealts和Apache Mahout来管理计算复杂性的大数据的热门问题[3132]通过聚类和水平缩放而不是赋权的单机来减少计算复杂性的分布式环境[33].由于用户频率和数据量逐渐增加,因此难以通过单个机器管理这些巨大数据。可以通过分解来减少稀疏性[34].电影推荐系统使用基于内容的过滤算法为用户提供服务[35]、协同过滤[36],以及一些组合形式,形成一个混合过滤算法[37].我们使用隐式评级来处理冷启动问题[38],由服务器管理的多变量电影推荐器管理的含义为用户提供了根据其个人资料或历史记录观看电影(先前观看或额定值)。因此,需要改进推荐系统以获得重要推荐服务。我们为这些问题开发了一个试点版本,由移动应用程序,Web刮刀和多变量推荐组成,以便以有效的方式为电影建议提供重要的服务。

这项工作如下:相关工程在部分中讨论2,经常性多变量电影推荐系统模型在部分中解释3.,经常性多变量电影推荐系统实现在一节中给出4.,实验和结果将在本节中讨论5.并且系统的评估是在一节中完成的6..本文的结论是介绍的7.以及在章节中更多参数的后续工作8.

2.文献综述

情感分析处理用户的评论,评论,符合性,评级等,以检索用户的情绪和意见。微博文本情绪分析基于NLP方法,用于检索适合的YouTube视频和电影和电影,用于吸烟停止,药物文,选举,披萨广告,新闻探究和公共卫生流感预防的竞争39-45].CNN和RNN是两大类深神经网络(DNN)。顺序和层次结构分别处理RNN和CNN。CNN和RNN都可以监督,半质量和无监督。深度学习算法还涉及传播和权衡更新活动。RNN基于多层:输入,隐藏和输出图层,而CNNS具有输入,隐藏和池池。CNN在层次数据分类中是有效的模式识别。然而,RNN涉及在NLP中进行语义分析和分类的线性数据;在CNN中,窗口大小是有限的,因此如果来自微博的审查非常大的评论,RNN非常有用[4647].建议框架作为第二类代理提出,其特征是“……使个人能够根据其他个人的结论作出决定”。“(48].早期的数据共享框架在初级类中占有一席之地,并依赖于基于文本的分类或分离,这种分类或分离通过按照许多文学流行语选择重要的东西来工作[49].推荐人框架提出“对客户依赖于其明确和可验证倾向,不同客户以及客户和事物特征的重要事项。”[50].推荐系统通过相似度筛选事实,根据顾客的口味找到合适的产品[51].建议利用社区社区的评估来帮助那个社区中的人们更充分地区分热情的内容,可能是一个可能的压倒性决定[52].除了他们的人事文件的特征,根据他们的人事文件的特征组成的人口统计数据的建议在依赖于统计数据的课程创造了提案。一个早期的先例是一种泛化的Grundy系统,它已经在图书馆中搜索的Bolster Book [53].该建议依赖于计算用户实用容量的每个项目的实用程序(http://www.eqo.info).知识建议提出了依赖于用户倾向的合法诱导的事物。一个学习描绘或关于如何符合特定客户需求的规则是重要的(http://www.findme.com.ph).通过应用基于偏好的协同过滤,推荐系统打算预测大多数相似度的估计,其中少数用户可能提供不显眼的观点[54].推荐系统有两种架构类型:一种是集中式的,位于特定位置[55].另一个在地理上分布并位于不同的位置[56].系统将启动三种类型的推荐模式:第一个是推送模式,其中在通过电子邮件与系统与系统与系统与系统相关联时建议[48].第二个是拉动模式,其中产生建议,但是当他允许或明确地要求它时显示给用户[57].推和拉模式是启动推荐程序的主动模式。第三种是被动模式,建议是作为习惯框架活动的一个特征产生的,例如,一个参考用户喜好的项目建议[58].用户可以通过使用线性自适应函数多利用工具理论(MAUT)来确定物品的偏好[59].由余弦矢量比较确定的余弦相似性是众所周知的洞察力测量之一,因为它概念仅考虑两个矢量没有尺寸的边缘。可以通过向量的角度来衡量搜索项目和用户评级的其他项目之间的协作;如果角度为90°,则余弦相似度的值为零,这意味着该项目是无关的。如果余弦向量之间的角度差约左键,则余弦相似度的值是一个,这意味着产品是相关的(https://en.wikipedia.org/wiki/Cosine_similarity)[60].协同过滤主要分为三类:(1)协同过滤(CF),其中需要用户和项目的个人资料数据来做出推荐决策[61],(2)基于内容的过滤,对项目内容描述和用户偏好信息(明示或暗示)进行推荐[62],(3)结合各种过滤技术,处理推荐系统的可扩展性、稀疏性、冷启动等大数据问题,获得更好的结果[[63].

3.多元电影推荐模型

多元方法是(参见图)1)基于三个模块:移动应用程序,多变量推荐和Web刮刀。用户可以通过移动应用程序获取推荐服务。移动应用程序模块向推荐模块提供诸如用户的查询,配置文件和历史的信息。该建议是针对移动应用程序的注册和未注册用户进行的。推荐模块基于深度学习NLP模块和计算模块。NLP模块使用令终止器,SEWMER和PERTAGER预处理微博的获取定性数据(用户评论),然后在语义上分析了评论并提取了关于电影的语义情绪。语义解析器工作基于深度机器学习算法经常发生的神经网络(RNN / LSTM注意)与用户电影关注(UMA)。语义情绪被分为五个主要课程:(i)非常有利,(ii)有利,(iii)平均有利,(iv)不利,(v)对其相对语义评分的基础是不利的。虽然计算模块归一化定量数据(Twitter喜欢,投票和评级),但评估规范化分数和语义情绪分数以生成推荐的电影列表。推荐的电影列表由五枚奖牌及其受欢迎程度组成,如铂金:“非常受欢迎,”黄金:“流行,”银色:“平均受欢迎,”铜牌:“不受欢迎”和铜:“高度不受欢迎。” The recommended movie list is generated according to users’ taste and preference. A web scraper fetched data (reviews, Twitter likes, votes, and ratings) from external data source sites (CinemaBlend, Moviefone, Rotten Tomatoes, and Twitter) and stored them in the NoSQL database for computation. Users’ feedback about a movie and app is useful for generating the recommended list and evaluation of system reliability.

3.1.NLP模块

NLP具有理解自然语言的能力。用户分享他们的意见和评论,从MicroBlog中有助于做出决定。阳性,消极性和中立性通过意见开采提取,而情绪是通过语义分析提取的。在我们的工作中,NLP模块通过LSTM-Indersion机器学习算法确定电影的语义情绪。该语义是用于提出建议的多功能因素中的参数之一。该语义方法描述如下:(一世)该模块获取与电影,MovieFone和腐烂的西红柿如电影相关的微博的评论(ii)该模块使用句子分割器、标记器和词干/词干分析器对微博文本或评论进行预处理(3)模块确定使用Senticnet强度引发情绪的单词的感觉(iv)基于注意的语义解析来构建解析树以将句法树识别为句子的情绪(v)RNN / LSTM-User Movie Prepsion(UMA)机器学习算法用于对评论进行分类

3.2.预处理

据估计,超过80%的数据是非结构化的,没有组织的方式。文本预处理是对文本/评论的清理或规范化。为了减少稀疏性和缩小特征空间,对特征进行词干化或引理化和标记化。语义分析必须面对一些挑战,如短文本、拼写错误、语法错误、俚语、不寻常的术语、标签、空白、噪音和表情符号。文本是单词的序列,而单词是有意义的字符序列。然而,问题是如何找出词语的界限。在英语中,单词是通过空格或标点符号来识别的。然而,一个复合词是一组单词没有空间在德国,例如,(“难忘的童年记忆描述事件”)⟶(“Kindheitserinnerungen使用说明书进行unvergesslichen Ereignisses”),尽管没有空间在日本这样的(“childhoodmemoriesdescriptionofanunforgettableevent”)。

3.2.1之上。标记

将文本流分割成单元的过程称为标记化。单位是指令牌。例如,“This movie is so riddled”是一个字符串,它被标记为[This] [movie] [is] [so] [riddled]。将输入序列分割为令牌存在一些问题。用空格分隔有一个问题,即不同的标记被标记为相似的单词,而相同的单词可能具有相似的含义(https://NLTK.Tokenize.WhiteSpaceTokenizer).用标点符号分裂,其中一些标点符号不有意义就像“撇号问题”(https://NLTK.Tokenize.WordPunctTokenizer).拆分出现了一组规则,它会产生更加含义的结果(https://nltk.tokenize.treeBankwordTokenizer).

3.2.2。阻止(词元化)

Sewermer源于像Porter Sewermer那样的话,它源于英语单词“看起来”作为“看”,以与形态制作规则为例,例如[(SSES⟶SS“):(”Caresses⟶抚摸“)],[(“ies⟶i”):(“Ponies⟶poni”)],[(“ss⟶ss”):(“抚摸⟶access”)],和[(“s⟶s”):(“猫⟶猫“)”,但由于源于非词汇,相同的多个词可以源于单数和不规则的形式。这些是如(狼⟶Wolv),(脚⟶英尺)。查找Wordnet数据库以解决此类问题。它解决了一些特定的问题,但并非所有的问题,如(狼狼)和(脚脚脚)(https://NLTK.Stem.WordNetlemmatizer).

3.2.3。POS-Tag代

POS标签由TreeBank Postagger确定所有令牌。TreeBank项目1代表36个POS标签(http://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html).例如,“Unwatchable I made it through 20 minutes I think”的帖子是[Unwatchable/VB] [I/PRP] [made/VBD] [it/PRP] [through/IN] [20/CD] [minutes/NNS] [I/PRP] [think/VBP]。

3.2.4。词义消歧(WSD)

WSD是决定单词“感觉”的问题。词典控制一个词及其可想象的院系。Bar-Hillel,1960年,展示了这个例子[“小John正在寻找他的玩具盒。最后,他找到了它。盒子里在笔里。约翰很开心。“]。在前一个字符串中,单词“笔”根据WordNet具有不同的感官。“笔”字定义了“从点写入的墨水流”;在这里,笔被定义为“牛的竞技场”,作为“鸟的家庭”。在评估电影的评论中,Senticnet被利用来表明它们的极性,对抗和公正性。 The SenticNet score of the terms and its recurrence are determined to get the general supposition of the reviews (https://sentic.net)[64].

3.3.解析

在NLP中,解析是通过基于底层语法分析其基本单词来确定句子的结构的过程。斯坦福解析器用于构造解析树,该解析树确定相对于语法(语言)的句法结构。解析可以参考各种各样的东西。浅析或分块是将单词分组为名词短语(NP)的过程。使用语法(S⟶NP│VP),(NP⟶rednoun),(NP⟶rebernoun)和(vp⟶barmənp),也可以将其分组成VP(动词短语)和PP(介词短语)。相比之下,依赖性解析确定单词与其类型之间的依赖关系。例如,SPACY +解析和渲染的使者用于产生更多的语义结果。

3.3.1。rnn / lstm.

神经网络由RNN/LSTM细胞表示[65].通常,在Birdseye中,RNN / LSTM是同一静态网络的几个副本的链,如图所示2.从输入来看,网络的拷贝序列在一个单一的时间步长内工作。此外,网络通过它们的隐藏状态相互连接H.所以我们可以说每个复制网络都有它自己的输入当复制网络展开或展开时。令序列表示为X1X2X3.......XN每个时间步长表示为XT. ∈ X1......XN.在步伐T.HT.是隐藏层和F用于计算隐藏状态:HT. = FHT.-1XT.).一个字由长序列中的一个时间步长表示。例如,给定的字符串以数学形式表示为一个序列:“it is a good movie”⟶[“it,”“is,”“a,”“good,”“movie”]。时间步长(T.= 0, 1, 2, ....)的字符串" it "表示为X0.,“是”X1,“一个”X2,“好”X3.和“电影”一样X4..如果T. = 1, thenXT.= " is "⟶"当前时间步长事件"和XT.-1= "它"⟶"事件的前一个时间戳":

输入门,决定应记住哪些信息或由sigmoid函数进行 它产生0或1值:0表示忘记,而1表示在单元格状态中记住。输入门处的Sigmoid函数取决于应更新哪个值,并且新的候选值信息由 功能 输出门s型函数决定应该产生哪一部分信息,然后tanh函数产生1到−1之间的值。

在经常性神经网络的隐藏状态中保留了顺序语义信息。在隐藏的状态(HT.),则保留输入序列的语义信息。当体验到一个新的输入并再次传递给后续的输入时,语义信息就会发生改变。将信息从一个网络传递到另一个网络,有助于从序列中找出单词之间的相关性,这被表示为长期依赖。

3.3.2。LSTM-Based序列标签

标记来自给定输入序列的谓词,并标识与每个谓词对应的标签参数。例如,在给定的句子“I watched the movie”中,标记了谓词(watched),与谓词对应的标签分别是作为代理的“I”、“the”和“movie”,分别是null和theme。一个句子中可能会出现多个谓词,对于每个谓词,同一个单词可能会被标记为不同的标签。连接预先训练过的词(Word2vec)生成每个词的向量。1位标志表示特定训练单元中的谓词,以确认网络分别处理每个谓词,并将其服务到词上下文的LSTM层。使用谓词,任何一个单词都被标记为取其隐藏状态的点积。在它上面应用了softmax函数。句子的概率计算如下: 这里是角色标签R.通过使用Relu函数和谓词引理的重量矩阵参数和通过将载体的点乘积嵌入来计算。

3.3.3。神经情感分类(NSC)

文档级情感分类通过神经情感分类(NSC)进行度量,神经情感分类基于层次LSTM注意和用户电影注意(UMA)(见图)3.),由用户的全局信息和电影特征表示[28].让评论 用句子,每个句子 特定审查 一个用户 和电影 查看语料库(用户及其电影集)。而且, 长度是 -句子,而且 词语 根据文本信息预测文档的语义等级。首先,在词级的低维语义空间,每个词 映射到它的嵌入 一个句子中去。每一步都有一个输入字 当前的细胞状态 隐藏状态 可以用前面的单元格状态更新 然后,隐藏的状态 是代表。文档表示体系结构如下:

s型激活函数和门激活函数表示为 分别表示元素乘法的表示为 训练所需的训练参数表示为 饲料隐藏状态 代表到平庸的汇集层,以获取表示的表示 句子。句子是嵌入在句子层次上的 进入LSTM;之后,文件表示 是通过一个普通的池化层获得的,方法类似如下: 这里,训练所需的训练参数表示为 饲料隐藏状态 代表到平庸的汇集层以获取 文件表示。

3.3.4。用户电影注意(UMA)

在不同层次上,利用用户电影注意力(UMA)提取必要成分进行情感分类。UMA应用于词级构造句子,句子级生成文档。显然,句子的意思可能不是由多个用户和电影的所有单词来表示的。尽管将单词层面的隐藏状态提供给平均池化层,但用户电影注意(UMA)被用来提取用户/电影相关的单词,这些单词对句子意义至关重要。信息性词汇被聚集在一起产生句子的表征。形式上,加权隐藏状态生成增强句如下:

意义的重要性 单词是通过 对于当前的用户和电影。每个用户 和电影 嵌入的是连续的实值向量吗 虽然用户和电影嵌入式表示为 尺寸分别。而且,对于每个隐藏的状态,注意力重量 如下所述:

对于句子水平,

呈现句子表示的词语以及文档表示的重要性 评分功能如下:

对于句子水平, 在哪里 权向量和 代表它的转置,而 是重量矩阵。每份文件的含义因句子而异,句子提供了不同的用户和电影。所以在句子一级,注意力的使用 与之 用户和 词级的电影向量,用于选择信息句子来生成文档表示 如下所述:

在句子水平中, 的重量 隐藏状态的测量方法类似于词语注意力。文档的高级表示 是通过对文档中的单词和句子进行分层提取而生成的。因此,在对文档进行情感分类时,将其作为特征。在非线性层采用Tanh激活函数对目标空间中的当前文档进行表示 类:

Tanh激活函数用于绝对层以获得文档的情绪分发:

情感课程与情感课程预测概率 代表为 分别。在训练过程中,我们用Gold情绪分布与模型情绪分布之间的误差交叉熵来度量优化损失函数,如下所示: 在这里,黄金概率的情绪类 和培训文件表示为 分别,虽然基于现实的真实性是一个,其他人是零。

表中给出了数学模型中使用的一些术语1


命名法 描述

文件/评论
句子
单词
评论文集
电影
句子
隐藏状态
总部电影网站
偏见
Twitter喜欢
步伐
j-现场的电影情绪
j-现场的电影情绪
j-现场的电影情绪
j- 在网站上的电影评级
j- 在网站上的电影评级
j- 在网站上的电影评级
j-第一部电影的总定量得分
最终推荐得分
汇总加权平均情绪
多变量 多元最后得分
输入门
输出门
忘记门
激活功能
偏见
重量矢量
矢量转换
步伐
乘法
HT. 隐藏的状态at.T.步伐
HT.-1 隐藏的状态at.T.−1(前)的步伐
W. 用于输入到隐藏层的权重矩阵T.步伐
Tanh是一个激活功能
在时间戳输入(T.
j- 在网站上的电影投票
j- 在网站上的电影投票
j- 在网站上的电影投票
损失
作为 聚合情绪
加权平均的情绪

表格2展示情感课。


语义分 情绪阶级

0.5 <和≤1.00 非常有利的
0.00 <和≤0.5 有利
-0.5 <和≤0.00 平均的
-1.00 <和≤-0.50 不利的
≤-1.00. 非常不利的

3.4.计算和分类

情感分析决定了评论的情绪。首先,每个站点的每个文档的聚合情绪得分j-th电影被计算。然后计算Twitter点赞的定性评分和聚合质量评分,得到推荐电影的最终评分,并生成相对于最终评分的人气类: 在哪里

该数学制定用于使用多变量模型来确定最终的普及分数。情绪值被拉伸到10刻度,通过该尺度确定了普及状态。每部电影都标有奖牌,根据人气分数,以及通过代表普及分数使用模糊逻辑来查找电影人气的奖牌来标识奖牌的算法如下所示:(1)如果多变量≥08,那么:铂金:“高度流行”(2)否则如果多变量≥06,那么:黄金:“流行”(3)ELSE IF多元值≥04,THEN:银:“平均流行”(4)否则如果多变量值≥02,那么:青铜:“不受欢迎”(5)铜:“非常不受欢迎”

受欢迎程度评分范围及各奖项及受欢迎程度载于附表3.


声望分数 奖牌队伍 地位

0.8 - -1.0 非常受欢迎的
0.6 - -0.79 黄金 受欢迎的
0.4-0.59 平均流行
0.2 - -0.39 青铜 不受欢迎的
0.0-0.19. 非常不受欢迎的

电影类型代表的类别根据其功能对电影进行分类,电影推荐服务根据用户请求和配置文件历史记录,提出了具有其类别的前10名热门电影。

4.多变量电影推荐系统实现

4.1.系统组件交互

用户android应用程序是系统的前端(见图)4.),用户可以从系统获取web服务,和后端是NoSQL的电影推荐系统环境与Apache Mahout Hadoop提供web服务的用户和web刮刀系统获取数据。Web scraper根据查询词和电影内容的匹配,从外部数据源获取数据。

4.2.NoSQL环境实现
4.2.1。准备Hadoop架构

它是一个具有四个基本组件的框架:(1)HDFS将文件拆分为许多小文件,并将其存放在三个服务器上,以便以分布式文件系统方式作为副本作为副本。(2)地图减少编程标准用于处理和操纵大数据。(3)共同/核心持有参考文库和服务来支持Hadoop。(4)纱线执行资源和任务的管理,计算和调度。

4.2.2。Apache Mahout

通过Apache Mahout完成协同过滤,群集和分类的实现。在NoSQL环境中,Apache Mahout接口实现Hadoop框架并评估性能相似度和邻域度量。实现多变量Web刮刀,并生成大数据。

4.3.网络刮刀

我们的Web Scaper是一个脚本程序,它在W3上冲浪,从不同的电影网站获取数据以提取评论,投票,评分和Twitter喜欢,并将它们存储在存储库中。此外,它还使用Hadoop和Apache Mahout管理并处理NoSQL环境中的刮擦数据。Web刮刀(Web Bot)接收URL并将其与网页的关键字(Meta标签)匹配。如果匹配关键字,则下载网页;否则,丢弃不相关的页面。

4.4。NLP工具

斯坦福CoreNLP技术工具被用来处理像英语这样的自然语言。它们给出了单词、相对的词性和情感的识别。斯坦福CoreNLP框架集成了许多斯坦福的NLP工具,如POStagger、解析器、名为“实体识别器”的情感分析器,以及模式学习和信息提取工具https://stanfordnlp.github.io/corenlp.

4.5。移动应用程序使用
4.5.1。未注册的用户

未注册的用户可以通过搜索查询向我们的推荐系统请求电影,并且系统将通过内容过滤响应该查询,以从查询中提取电影的功能或内容。协作是在用户请求和系统生成的电影之间完成的。该系统为观看的窗口提供给未注册的用户来观看推荐的电影。未注册的用户通过其相似提供反馈,系统使用反馈进行准确测量。

4.5.2。注册用户

如果未注册的用户注册,那么他们可以登录并维护他们的个人资料或历史记录。对于注册用户,可以在查询和历史的基础上完成合作。注册用户可以通过它们的肖像向系统提供反馈,系统使用此反馈,以便在他们选择电影的建议和系统电影之间进行协作过滤,以及对多变量电影推荐系统的准确测量。.该应用程序还为注册用户提供了一个监视窗口,以观看推荐的电影。

4.6。冷启动问题处理

合作过滤(CF)是用于注册和未注册用户的电影建议;但在两种情况下,可能发生问题:(一世)案例1:如果注册用户请求电影,系统会使用系统电影协作所请求的电影,并代表用户历史推荐电影。在这里,出现一个问题:如果新注册的用户请求电影,那么系统会根据其他人喜欢其他人的电影来解决新注册用户的冷启动问题。(ii)案例2:如果有新电影收到注册或未注册的请求,系统会根据新电影预告片的配合推荐,这是最受欢迎的,解决了新上映电影的冷启动问题。

4.7。相似度测量

我们使用余弦相似度,其中有两个向量来测量角度值进行相似度操作。角度越小,相似度越大,相似度越大,如图所示5..它也称为基于载体的相似性。电影文档和搜索查询文档相关计算机在其中问:是搜索查询文档和D.是电影文档。相似度可由下式计算:

5.实验和结果

数据预处理之后的步骤是应用NLP程序对提取的数据进行情感分析,然后利用SenticNet计算情感得分,得到的结果如下。

表格4.呈现电影和类别的识别。


电影和类别id
电影ID. 电影标题 电影分类

罗宾汉(2018) 行动 (
墙上有钟的房子(2018) 冒险 (
掠夺者(2018) 幻想(
毒液(2018) 恐怖(
闪光 科幻小说 (

表格5.显示网站、电影、用户和评论的标识。


id表格
网站名称 网站ID. 电影ID. 用户名 用户ID 评论ID

CineMablend. Deplorable_me
雪短吻鳄
大卫咖喱
Smedley
直流恶棍
拍电影时 卫报彼得·布拉德肖报道
雪短吻鳄
放松广告迈克
jza smack.
克利福德·德·小海湾
烂番茄 詹妮弗·希顿
卡洛斯·迪亚兹雷耶斯
杰弗里·布鲁姆
Ugene Bernabe.
鹿。

表格6.介绍来自电影网站CinemaBlend的影评。


用户对电影的评论
电影ID. 用户名 评论ID 评论 语义情感

看不下去了,我想我坚持了20分钟。 平均的
我不喜欢它。以为这是不平衡,浪费了一些伟大的人才。不够好笑,太多幽默,认为它是美国的质量水平,效果更好。它值得为Blanchett看到。她确实偷了每场场景,当续集发生时 - 它已经为一个人做了足够的钱,我希望她是前沿和中心作为主角。她和黑人确实有很棒的化学。 平均的
《铁血战士1》和《铁血战士2》都是喜剧。Shane Black帮助编写了原稿(现在每个人都应该知道了)。《掠食者》是系列电影中最严肃的一部。 平均的
我今天去看看它具有公开期望(专业评论不好,观众评论好的),以为这是一个有趣的电影。它让我破解了几次。 非常有利的
闪电侠很好地将英雄漫画历史中的经典融合在一起 非常有利的

电影网站Moviefone和Rotten Tomatoes的电影评论也被取得了取得了挑选,并且计算了语义分数和情绪。

表格7.在电影网站CineMablemend,MovieFone和Rotten Tomatoes中展示电影审查标记和标记。


标签
用户ID 每份文件令牌 标签

9. Unplatchable / VB I / PRP制作/ VBD IT / PRP到20 / CD分钟/ NNS I / PRP Think / VBP
91 认为/RB它/PRP /VBD不平衡/JJ和/CC浪费/VBD一些/DT伟大/JJ天赋/NN ./。Not/RB funny/JJ enough/RB,/, too/RB much/JJ shit /VBD humor/NN,/, and/CC think/VBP it/PRP is/VBZ a/DT made/VBN for/IN USA/NNP level/NN of/IN quality/NN with/IN better/JJR effects/NNS ./它/PRP /VBZ值得/JJ看/VBG /在布兰切特/NNP ./。她/PRP /VBZ偷/VB /DT的每一个场景/NN,/,和/CC,当/WRB /DT的续作/NN发生/VBZ -/:和/CC它/PRP /VBZ /VBN /RBR比/在足够的/JJ钱/NN /在一个/CD -/:我/PRP /VBP她/PRP是/VBZ的前面/NN和/CC中心/NN /在/DT的主要/JJ角色/NN ./她/PRP和/CC Black/NNP /VBP有/VB a/DT梦幻/JJ化学/NN ./。
34 捕食者/NNP 1/CD &/CC 2/CD had/VBD comedy/NN in/ in it/PRP ./。Shane/NNP Black/NNP help /VBD写/VB the/DT original/NN - lrb -/- lrb - everyone/NN should/MD know/VB that/DT by/IN now/RB - rrb -/- rrb - ./《掠夺者》是美国最受欢迎的电影,也是美国最受欢迎的电影之一。
34 我/PRP去/VBD看/VB it/PRP today/NN with/IN open/JJ expectations/NNS - lrb -/- lrb - professional/JJ reviews/NNS bad/JJ,/, viewer/CD reviews/NNS good/JJ - rrb -/- rrb - and/CC thought/VBD it/PRP /VBD a/DT fun/NN movie/NN ./它/PRP crack /VBD me/PRP up/IN a/DT couple/NN times/NNS ./。
17 /DT Flash/NNP已经/VBZ done/VBN a/DT fantastic/JJ job/NN of/ VBG classic/NN from/ DT hero/NN’s/POS comic/JJ book/NN history/NN
- - -
- -

使用斯坦福解析器进行了从电影院,Moviefone和Rotten Tomatoes取出的电影评论的令牌。在这里,表格8.呈现CinemaBlend、Moviefone和烂番茄的影评情感评分。


聚合的语义分
电影ID. 评论ID CineMablend. 拍电影时 烂番茄

0.4 0.6 0.2
0.2 0.2 0.4
0.2 0.6 0.6
0.6 0.2 0.4
0.8 0.0 0.0

表格9.呈现归一化的Twitter从Twitter中获取电影。


Twitter喜欢
电影的名字 非规范 标准化

366 366
154 154
258. 258.
3. 3.
2196K. 2169

表格10介绍Cinemablend,Moviefone和Rotten Tomatoes的电影的正常化评级分数。


评级
电影ID. 非规范 标准化
CineMablend(%) MovieFone(%) 烂番茄 (%) CineMablend. 拍电影时 烂番茄

70 16 39 7. 1.60 3.90
80 55 60 4.0 5.50 6.00
70 25 49 3.5 2.50 4.90
40 39 2.0 3.90
73 69 93 7.3 6.90 9.30

表格11显示了来自CinemaBlend、Moviefone和烂番茄的归一化投票分数。


电影ID. 非规范 标准化
CineMablend. 拍电影时 烂番茄 CineMablend. 拍电影时 烂番茄

1.5K. 679. 4.5 k 1500 679. 4500
870. 760 6.5 k 870. 760 6500.
797 890. 94 797 890. 94
3.46K. 6.9 k 910 3460. 6900 910
67 76 8.3 k 670. 760 8300.

表格12在CinemaBlend, Moviefone,和烂番茄中呈现最终得分,电影类别,奖牌排名和电影类型。


电影ID. 最后得分 类型类别 奖牌队伍 电影推荐

1.30 行动 非常不受欢迎的
4.41 冒险 平均流行
3.63 幻想 青铜 不受欢迎的
4.59 恐怖 平均流行
4.47 科幻小说 平均流行

数字6.给出了CinemaBlend、Moviefone和烂番茄的多元电影排名推荐。

数字7.在CinemaBlend、Moviefone和烂番茄网站对这部电影的评分上存在差异。

数字8.在CineMablemend,Moviefone和Rotten Tomatoes中提出电影的投票差异。

数字9.从CineMablend,Moviefone和Rotten Tomatoes中呈现电影情绪的差异。

6.评估和讨论

我们对情感分类模型和推荐模型进行如下评价。

6.1.情感分类模型评价

对于情感,分类模型通过准确性和RMSE来评估,这衡量了情绪分类模型的整体性能和预测和真理地面情绪类之间的分歧。我们使用三个数据集IMDB,Yulp13和Yulp14进行比较几种基本情绪分类方法,该方法包含有关使用斯坦福州Corenlp的电影的评论。基线情绪分类模型的大多数是指由AN的培训中的文档情绪进行分类SVM具有unigram、双格ram和三格ram的分类器。文本特征提取包括字符N-gram和-word由SVM分类器完成。使用宽赦特征由通用分类表提取[66].文档表示由AvgWordvec获得,并将其转化为SVM。特征生成采用SSWE(情感特定词嵌入)[67].句子表示由RNTN(递归神经张量网络)[68].文档分类按段落向量:分布式内存模型(PVDM) [69]、主题建模和协同过滤JMARS (https://jmars.asu.edu/).采用向量表示和文本偏好矩阵对用户产品神经网络(UPNN)进行情感分类[70].

表格13介绍使用和不使用用户/产品/电影信息的不同情绪分类模型之间的比较。


分类模型 IMDB. Yelp 2013 Yelp 2014
准确性 RMSE. 准确性 RMSE. 准确性 RMSE.

不使用用户和产品信息
多数 0.196 2.495 0.411 1.060 0.392 1.097
0.399 1.783 0.569 0.814. 0.577 0.804
文本特征 0.402 1.793 0.556 0.845 0.572 0.800
avgwordvec + svm. 0.304 1.985 0.526 0.898 0.530 0.893
SSWE +支持向量机 0.312 1.973 0.549 0.849 0.557 0.851
段矢量 0.341 1.814 0.554 0.832 0.564 0.802
rntn +经常性 0.400 1.764 0.574 0.804 0.582 0.821
CNN和UPNN (UPNN) 0.405 1.629 0.577 0.812 0.585 0.808
国家安全委员会 0.443 1.465 0.627 0.701 0.637 0.686
国家安全委员会+LA. 0.487 1.381 0.631 0.706 0.630 0.715

使用用户和产品信息
Trigram + UPF. 0.404 1.764 0.570. 0.803 0.576 0.789
文本功能+ UPF 0.402 1.774 0.561 1.822 0.579 0.791
JMARS N/A 1.773 N/A 0.985 N/A 0.999
UPNN (CNN) 0.435 1.602 0.596 0.784 0.608 0.764
upnn(nsc) 0.471 1.443 0.631 0.702 N/A N/A
国家安全委员会+乌玛 0.533 1.281 0.650 0.692 0.667 0.654

在我们的方法中,核心实现是使用本地用户和电影信息的神经情感分类(NSC) [71,它提供了重要的结果,如表所示13,这代表了与所有基线方法相比显著的4%的改进/差异,这些基线方法使用关于用户和电影的本地文本信息。当使用关于用户和电影的全局信息时,UPNN获得了3%的改进,而我们的方法NSC-UMA获得了9%的改进。该方法采用向量嵌入用户信息和电影信息,适用于较大的数据集,而UPNN同时采用矩阵和向量。NSC-UMA对于从每个语义层捕获信息非常重要。因此,我们的模型以一种高效和有效的方式结合使用用户电影全局信息。

单词级注意和句子级关注是相当于以多个级别反映用户和电影特性的语义信息,这导致在情绪分类中引入用户电影关注(UMA)。此外,对用户品味或偏好的看法比电影属性更容易理解,因此用户和电影信息都必须在为影响电影排名的语义信息中注意文档来关注推荐。

6.2。推荐模型的比较分析

表格14给出了不同模型之间的比较。我们的工作作为一种新方法的主要区别在于,第一种是用于情感分类的LSTM-UMA,第二种是用于处理大数据问题的NoSQL分布式环境,第三个是由一个网络机器人从三个不同的可靠外部数据源获得的多元(定性和定量)评分,第四个是应用功能(电影类别和受欢迎程度)。


Ref。 NLP / RNN / LSTM 用户偏好 NoSQL 异构数据 定量评分(投票、喜欢和评分) 定性评分(评价分析) 多变量 多个数据源站点 人气奖牌 网络机器人 类别 用户应用程序

[15]
[72]
[73]
[74]
[21]
提出工作

在 [15]它只使用iclicate和催化评级,LSTM没有使用用户和生产注意,养护深度学习不用于确定来自微博的电影的用户的偏好和品味,所以我们可以说作者没有使用定性数据。它不会声明如何对数据进行获取,也不会因其流行度进行分类。在 [1572-74[没有使用多变量,研究[73]恰好基于微博,而研究74使用电影故事片评级。

6.3。实验结果

通过搜索结果除以实际电影(电影总数)得到的真实正(推荐的有趣电影)被称为精度:

真正的正面(推荐的有趣电影到用户),由预测电影(完全推荐的电影)除以预测的电影(完全推荐的电影)被称为remall:

数字10呈现电影推荐人的不同决策。

如果推荐精度提高,则召回将被拒绝:

表格15介绍多变量推荐系统和其他模型参数的比较。


决策参数 TP TN FP. FN.

作为 341. 237. 207. 215.
375 355 95 175
406. 347. 116 131
[74] 525 250. 90 135
[21] 442. 387 114 57
多变量系统 554 433. 8. 5.

表格16介绍了多变量推荐系统的其他参数评价和其他工作。


作为 [74] [21] 多变量系统

精确 0.6223 0.7979 0.7778 0.8537 0.7950 0.9858
回忆 0.6133 0.6818 0.7561 0.7955 0.8858 0.9911.
F分数 0.6178 0.7353 0.7668 0.8235 0.8379 0.9884.
准确性 0.5780 0.7300. 0.7530. 0.7750. 0.8290. 0.9870.

的结果F我们的系统中得分与其他预测参数以及其他推荐框架进行比较。多变量系统的准确性近于98.70%。多变量系统的真正阳性率为0.99106,这意味着系统推荐的电影真正对用户感兴趣的电影,假阳性率为0.01814,这意味着多变量系统没有推荐对用户不感兴趣的电影。

数字11在CinemaBlend、Moviefone、Rotten tomatoes等推荐模型中,不同的电影推荐决策参数(精度、召回率和准确率)存在差异。

数字11证明了我们的方法与其他研究的不同[2174].在 [21],只是发现这个术语的极性不足以评估审查的重大推荐,并在[74],LSTM用于确定用户和电影信息,同时我们使用NSC-UMA来评估评论的情绪评分,了解重要推荐。

7.结论

在许多电影推荐系统中,建议和排名只基于喜欢或评分。此外,大多数系统只从一个或两个站点提取数据。电影排名的语义学、评分或投票不可靠、无关紧要,因为它们不能提供更好的推荐服务,统计信息(评分、投票、喜欢)和电影网站的评论之间存在巨大差距;因此,从一个网站使用它们是不可靠的,因为一些网站产生的质量分数显示一个电影的高流行度,而其他网站显示同一电影的低流行度。在研究[21],不使用深度学习,只使用词频。单词频率并不是评价评论语义的更好方法。它只产生了这个词的极性。因此,利用LSTM-attention学习算法进行更好的语义分析,需要有效的重要值和语义信息,语义情感值增加了推荐系统的重要性。通过词和句水平的平均池化,利用用户在词和句水平上的电影注意力来改进文档的语义分类,提高评论或文档的语义和情感信息。与只在句子层面应用注意力相比,在单词层面应用注意力是为了改善文档的语义信息。采用NoSQL环境解决了大数据问题。

8.未来的工作

通过添加更多参数,如会话、播放列表、用户组、会话、smiley、标签、上下文、电影和视频内容的功能,可以改进这项工作。

数据可用性

用于支持本研究发现的数据可由通讯作者要求提供。

的利益冲突

作者声明他们没有利益冲突。

参考文献

  1. K. RatnaParkhi,基于自然语言处理和机器学习的餐厅食物推荐系统2018年,爱尔兰都柏林,国立爱尔兰学院。
  2. R. Mukherjee,P. S. Dutta和S. SEN,影片 - 在线电影推荐的新方法图尔萨大学数学与计算机科学系,图尔萨,OK,美国,2001。
  3. U.Fasahte,D.Gambhir,M. Monulingkar,A. Monde和A.Pokhare,“酒店推荐系统,信息技术,Atharva工程学院,印度,”帝国跨学科研究(IJIR),第3卷,第2期。11日,2017年。查看在:谷歌学者
  4. P. M. Chawan,K.Suvarna,Y.Goyal,J.Thakker和A. BandiWadekar,“Dining,Computer Engg和信息部的建议制度。技术。VJTI,孟买,马哈拉施特拉,印度,“工程研究与应用。,第8卷,第2期5,第48-52页,2018。查看在:谷歌学者
  5. J.Neidhardt,T.Kuflik和W.Wörndl,“旅游业推荐系统的特别部分”,信息技术与旅游第19卷第2期1-4,第83-85页,2018。查看在:出版商的网站|谷歌学者
  6. E. U. Owon,B. O. Eke和P. O. Asagba,使用协同过滤算法改进的在线书籍推荐系统,“国际计算机应用杂志,卷。179年,没有。46,pp。41-48,2018。查看在:出版商的网站|谷歌学者
  7. J.A.Xu和K.Araki,“电视节目的基于SVM的个人推荐系统”第12届国际多媒体建模会议的诉讼程序2006年1月,中国北京。查看在:谷歌学者
  8. S. Baluja, R. Seth, D. Sivakumar等人,“YouTube的视频建议和发现:在视图中随机行走”第17届万维网www ' 08国际会议论文集,中国北京,2008年4月。查看在:谷歌学者
  9. E. Aalipour和M. Ghazisaeedi,“癌症世界的请求推荐系统介绍”,国际社区医学和公共卫生杂志,第4卷,第4期。2, pp. 275-280, 2017。查看在:出版商的网站|谷歌学者
  10. M. Schedl, H. Zamani, C.-W。Chen, Y. Deldjoo,和M. Elahi,“目前音乐推荐系统研究的挑战和愿景,”国际多媒体信息检索杂志,第7卷,第5期2, pp. 95-116, 2017。查看在:出版商的网站|谷歌学者
  11. M. a . Casey, R. Veltkamp, M. Goto, M. Leman, C. Rhodes, M. Slaney,“基于内容的音乐信息检索:当前方向和未来挑战”,IEEE的诉讼程序,卷。96,没有。4,pp。668-696,2008。查看在:出版商的网站|谷歌学者
  12. J. Stan,F.Muhlenbach和C.Smallon,“推荐使用社交网络分析的系统:挑战和未来趋势,”社会网络分析和采矿的百科全书,第1-22页,施普林格,柏林,德国,2014。查看在:谷歌学者
  13. S. K.T.Lam,D. Frankowski,以及J. Riedl,你相信你的建议吗?建议系统中的安全和隐私问题探索, GroupLens研究计算机科学与工程,明尼苏达大学,明尼阿波利斯,美国,2006。
  14. K.-R。金,黄永发。李,黄永发。机构和N.-M。月亮,推荐系统使用移动服务中的电影类型相似性,信息技术应用技术系,GSV,湖西大学,韩国牙山,2010。
  15. M.-Y。谢长廷,W.-K。周,K.-C。李,“通过Hadoop上的链接数据,通过用户评级和APP使用情况,构建移动电影推荐服务。”多媒体工具及应用,第76卷,第76期3, pp. 3383-3401, 2017。查看在:出版商的网站|谷歌学者
  16. K.-R。Kim和N. Moon,“推荐系统设计使用电影类型相似性和智能手机的首选流派”,“多媒体工具及应用,卷。61,没有。1,pp。87-104,2012。查看在:出版商的网站|谷歌学者
  17. 高敏,张昕,来自推文数据的电影推荐器系统,2019年1月,http://cs229.stanford.edu/proj2015/299_report.pdf
  18. K. Badge和Jyoti Patil,“关于使用社交数据和微博信息的产品推荐系统的调查”,国际计算机与通信工程创新研究杂志,第12卷,第2期5, pp. 17513-17517, 2017。查看在:谷歌学者
  19. Y. Ishida, T. Uchiya和I. Takumi,《电影推荐系统的设计与评估》国际网络信息系统杂志,第13卷,第2期1, pp. 72-84, 2017。查看在:出版商的网站|谷歌学者
  20. I. Vagliano, D. Monti,和M. Morisio,“SemRevRec:基于用户评论和链接数据的推荐系统”recsys 2017海报的诉讼程序,科莫,意大利,2017年8月。查看在:谷歌学者
  21. M. Ibrahim和I. Bajwa,“使用apache hadoop框架的多变量专家系统的设计和应用”,可持续性,卷。10,没有。11,p。4280,2018。查看在:出版商的网站|谷歌学者
  22. 任峰,“基于语言的情感分析和识别在消费者满意度测量中的应用:情感计算的应用”,资讯科技及管理,第13卷,第2期4,pp。321-332,2012。查看在:出版商的网站|谷歌学者
  23. K. Wakil, R. Bakhtyar, K. Ali,和K. Aladdin,《基于情感的网络电影推荐系统改进》,国际高级计算机科学与应用杂志,卷。6,不。2015年2日。查看在:出版商的网站|谷歌学者
  24. Y. Tom,D. Hazarikaz,S. Poria和E. Cambria,“最近深入学习的自然语言处理趋势”,2018年,https://arxiv.org/pdf/1708.02709.查看在:谷歌学者
  25. S. Postmus和Bhulai,应用于Netflix电影数据的推荐系统技术,Vrije Universiteit Amsterdam,阿姆斯特丹,荷兰,2018年。
  26. P. T. Nguyen, P. Tomeo, T. Di Noia,和E. Di Sciascio,“通过DBpedia和Freebase的基于内容的推荐:音乐领域的案例研究”,意大利巴里理工大学SisInf实验室,巴里,2015。查看在:谷歌学者
  27. R. Mirizzi, T. Di Noia, A. Ragone, V. C. Ostuni,“DBpedia的电影推荐”,巴里理工大学,巴里,意大利,2012。查看在:谷歌学者
  28. x.-y.D.振武,C. Yin,S. Huang和J. Chen,“改善了与用户关注和产品关注的审查表演,为情绪分类,”2018年,https://arxiv.org/abs/1801.07861查看在:谷歌学者
  29. R.Ferreira,O. Holanda,J.Melo,I.Ibert,F.Freitas和E. Costa,基于agent的语义网络博客,阿拉戈斯联邦大学,Maceió,巴西,2012年。
  30. W. W. Cohena和W. Fan,《网络协同过滤:通过抓取网络推荐音乐》,计算机网络,卷。33,不。1-6,pp。685-698,2000。查看在:出版商的网站|谷歌学者
  31. A. V. Jose和K. M. Jini,“在hadoop上使用排名提升方法的个性化电影推荐系统”,国际科技创新研究杂志,卷。2,不。2015年2日。查看在:谷歌学者
  32. G. Godhani和M. Dhamecha,《使用并行地图缩减技术的电影推荐系统研究》,国际工程开发研究杂志,第5卷,第5期。1, 2018。查看在:谷歌学者
  33. 李斌,廖颖,郑青,“实时电影推荐系统的预估聚类”,应用数学学报,卷。2014年,第742341号,9页,2014年。查看在:出版商的网站|谷歌学者
  34. L. Zhao,Z. Lu,S. Jialin和Q. Y.Bo,“电影推荐矩阵分解+”第25届国际人工智能联合会议论文集(IJCAI-16)香港科技大学,香港南洋科技大学,纽约,纽约,美国,2016年7月。查看在:谷歌学者
  35. J. Nessel和B. Cimpa,“基于电影内容的电影推荐”IEEE / WIC / ACM国际会议关于网络情报和智能代理技术的诉讼程序,EdgeWorks Software Ltd.,Lyon,法国,2011年8月。查看在:出版商的网站|谷歌学者
  36. D.Sánchez-Moreno,B.Ana,G. Gil等人,使用艺术家和用户的播放系数的音乐推荐的协同过滤方法,计算和自动化部,萨拉曼卡大学,萨拉曼卡,西班牙,2016年。
  37. K. Soni, R. Goyal, B. Vadera, S. More,《三向混合电影推荐系统》国际计算机应用杂志号,第160卷。9,页29-32,2017。查看在:出版商的网站|谷歌学者
  38. H. Khalid和S. Wu,“用推荐系统中的数学集合理论通过显式信息减少冷启动问题”,国际工程与计算机科学杂志,第5卷,第5期。8, pp. 17613-17626, 2016。查看在:出版商的网站|谷歌学者
  39. A. Sarker,R.Ginn,A. Nikfarjam等,“利用社交媒体数据进行药剂检测:审查,”生物医学信息学杂志, vol. 54, pp. 202-212, 2015。查看在:出版商的网站|谷歌学者
  40. A. Tumasjan, T. O. Sprenger, P. G. Sandner, i.m. Welpe,《用Twitter预测选举:140个字符揭示的政治情绪》,ICWSM.,卷。10,pp。178-185,2010。查看在:谷歌学者
  41. W. He,S. Zha和L. Li,“社交媒体竞争分析和文本挖掘:披萨行业的案例研究”国际信息管理杂志,卷。33,不。3,pp。464-472,2013。查看在:出版商的网站|谷歌学者
  42. E. L. Murnane和S. Counts的《解禁与复发:在社交媒体中反映的戒烟》(Unraveling abstinandrelapse: smoking cessation reflect in social media)发表于第32届ACM年度会议论文集:计算系统中的人为因素,pp.1345-1354,ACM,多伦多,加拿大,2014年4月。查看在:谷歌学者
  43. N. Diakopoulos,M.Naaman和F. Kivran-Swaine,粗糙的钻石:社交媒体视觉分析,用于新闻咨询,“IEEE视觉分析科学与技术研讨会的诉讼程序, pp. 115-122, IEEE,美国犹他州盐湖城,2010年10月。查看在:谷歌学者
  44. T. Baldwin, P. Cook, M. lum, A. MacKinlay, and L. Wang,社交媒体文本有多嘈杂,社交媒体来源有多不同?墨尔本大学,墨尔本,澳大利亚,2013。
  45. C. Corley, D. Cook, A. Mikler和K. Singh,“网络和社交媒体中流感提及的文本和结构数据挖掘”,国际环境研究与公共卫生杂志,第7卷,第5期2,页596-615,2010。查看在:出版商的网站|谷歌学者
  46. Z. C.Lipton,J.Berkowitz和C. Elkan,“序列学习经常性神经网络的关键审查,”2015年,https://arxiv.org/abs/1506.00019查看在:谷歌学者
  47. W. Yiny,K. Kanny,Y.Mo和H.Schützey,“自然语言处理的CNN和RNN比较研究”,2017年,https://arxiv.org/abs/1702.01923查看在:谷歌学者
  48. D. Goldberg,D. Nichols,B. M. Oki和D. Terry,“使用协同过滤编织信息挂毯”,“ACM的通信第35期12,第61-70页,1992。查看在:出版商的网站|谷歌学者
  49. J. A. Konstan,“推荐系统的介绍:算法和评估”,信息系统上的ACM事务第22卷第2期1,页1 - 4,2004。查看在:出版商的网站|谷歌学者
  50. P. Resnick, N. Iacovou, M. Suchak, P. Bergstrom, and J. Riedl,“GroupLens:网络新闻协同过滤的开放架构”,刊于1994年ACM计算机支持合作工作会议论文集,第175-186页,ACM, Chapel Hill, NC, USA, 1994年10月。查看在:谷歌学者
  51. U. Shardanand和P. Maes,“社交信息过滤:自动化”口中“的算法,”计算系统中的人为因素SIGCHI会议论文集(CHI’95),第210-217页,ACM出版社/Addison-Wesley出版公司,丹佛,美国,1995年5月。查看在:谷歌学者
  52. A. Chang,J.F. Liao,P.C. chang,C.H.Teng和M. H. Chen,“人工免疫系统的应用结合了电影推荐系统中的协同滤波”2014 IEEE第18届计算机支持的设计协同工作国际会议论文集,页277-282,IEEE,新竹,台湾,2014年5月。查看在:谷歌学者
  53. E.Reich,“用户是个人:个性化用户模型”国际人机研究杂志,卷。18,不。3,PP。199-214,1983。查看在:出版商的网站|谷歌学者
  54. G. Adomavicius和A. Tuzhilin,“迈向下一代推荐系统:对最先进和可能的扩展的调查,”IEEE关于知识和数据工程的交易,卷。17,不。6,PP。734-749,2005。查看在:出版商的网站|谷歌学者
  55. 工程学系。Min和I. Han,“用于改进推荐系统的客户时变模式检测”,专家系统与应用第28卷第2期2,页189-199,2005。查看在:出版商的网站|谷歌学者
  56. B. N.米勒,J. A.康斯坦,J. Riedl,《PocketLens》,信息系统上的ACM事务第22卷第2期3,第437-476,2004。查看在:出版商的网站|谷歌学者
  57. J. A. Konstan, B. N. Miller, D. Maltz, J. L. Herlocker, L. R. Gordon,和J. Riedl,《群体镜头:对usenet新闻应用协同过滤》,ACM的通信,卷。40,不。3,pp。77-87,1997。查看在:出版商的网站|谷歌学者
  58. Y. H. Cho, J. K. Kim, S. H. Kim,“基于网络使用挖掘和决策树归纳的个性化推荐系统”,专家系统与应用,卷。23,不。3,pp。329-342,2002。查看在:出版商的网站|谷歌学者
  59. R. Schaefer,“使用多属性效用理论估计用户兴趣的规则”,在Abis Workshop,Adaptivitätundenutzermodellierung的Abis Workshop的诉讼程序,多特蒙德,德国,2001年10月。查看在:谷歌学者
  60. m·保罗,提供可操作的建议:一种具有解释能力的电影推荐算法, Joseph Eul Verlag, Siegburg,德国,2013。
  61. 张颖,张敏,刘颖,“基于文本评论的个性化推荐策略研究”,硕士论文第八届ACM Web搜索和数据挖掘国际会议论文集,PP。中国上海435-440,2015年2月。查看在:谷歌学者
  62. I. S. Bajwa和S. IQBAL,“使用DRT和马尔可夫逻辑的自然语言限制的半监督语义分析”科学国际第28卷第2期3,pp。2783-2790,2016。查看在:谷歌学者
  63. X. Su和T. M. Khoshgoftaar,协同过滤技术综述,佛罗里达大西洋大学计算机科学与工程系,博卡拉顿,佛罗兰州,美国,2009。
  64. E. Cambria, Ma Y., H. Peng, and E. Cambria,“通过将常识嵌入到注意的LSTM中,有针对性的基于方面的情感分析”第三十二届AAAI人工智能会议论文集(AAAI-18)2018年2月,美国洛杉矶,新奥尔良。查看在:谷歌学者
  65. S. Hochreitor和J. Schmidhuber,“长期内存,”神经计算,第9卷,第5期。8,第1735-1780页,1997。查看在:出版商的网站|谷歌学者
  66. I. Bajwa, H. Ismail, H. Bukhari,和R. Amin,“使用机器学习的自然语言文本的自动情感分析”,信徒大学研究杂志(科学系列),卷。48,不。2016年3日。查看在:谷歌学者
  67. D. Tang,F. Wei,N. Yang,M. Zhou,T. Liu和B. Qin,“学习情绪特定的词嵌入Twitter情绪分类”第五届计算语言学协会第52届年会的诉讼程序,第1555-1565页,马里兰州巴尔的摩,美国,2014年6月。查看在:出版商的网站|谷歌学者
  68. R. Socher,A. Perelygin,J. Y.Wu等人,“递归的深层模型,在情绪树木中,语义构思,”自然语言处理中实证方法的诉讼程序,第1642页,华盛顿州西雅图,美国,2013年10月。查看在:谷歌学者
  69. U. Ghani,I. Bajwa和A. Ashfaq,“一种用于衡量客户忠诚度和决策的模糊逻辑智能系统”,对称,卷。10,没有。12,p。761,2018。查看在:出版商的网站|谷歌学者
  70. K. Yoon,“句子分类的卷积神经网络”EMNLP的诉讼程序,多哈,卡塔尔,2014年10月。查看在:谷歌学者
  71. Z. Yang,D. Yang,C. Dyer,X. He,Alex Smola和E. Hovy,“文档分类的分层关注网络”计算机语言学协会北美分会2016年会议论文集:人类语言技术,圣地亚哥,加利福尼亚州,美国,2016年6月。查看在:谷歌学者
  72. Wang y, M. Wang, and W. Xu,“一种用于电影推荐的情感增强混合推荐系统:一个大数据分析框架,”无线通信和移动计算,卷。2018年,第8263704号,9页,2018年。查看在:出版商的网站|谷歌学者
  73. S. Kumar, S. S. Halder, K. De, P. P. Roy,“利用微博数据情感分析的电影推荐系统”,2018,https://arxiv.org/abs/1811.10804查看在:谷歌学者
  74. H T。郑,J.-Y.陈,N.梁,A.K.Sangaiah,Y.江,C.-z.赵,“利用音乐和用户元数据的深度时间神经音乐推荐模型”应用科学,第9卷,第5期。4,p。703,2019。查看在:谷歌学者

版权所有©2019 Muhammad Ibrahim等。这是分布下的开放式访问文章知识共享署名许可协议如果正确引用了原始工作,则允许在任何媒体中的不受限制使用,分发和再现。


更多相关文章

PDF 下载引用 引用
下载其他格式更多的
订单打印副本命令
的观点2836
下载841.
引用

相关文章