文摘
日复一日,博客用户和微博用户的数量正在增加。很容易说,博客已经捕获的其他web服务的一个重要部分。在过去的几年里,用户的数量成倍增加。用户的Facebook、Twitter和Instagram应用程序不是隐藏的任何人。在这样的平台上用户分享想法、经历、故事,观点,看法和希望与同一组的人的利益。根据用户的期望,有需求的两件事:内容管理和建议。内容管理算法会发现人民和他们的文章在个性化搜索结果。此外,推荐系统将有助于找到与最合适的匹配。在本文中,这两种方法相结合来显示用户的策划和推荐结果。本文关注的是混合模式命名S-ANFIS,和结果比较著名的方法像安,深层神经网络(款)和递归神经网络(RNN)。
1。介绍
在Web 2.0的伞下,博客是现在必不可少的工具之一。人们写博客分享自己的想法,与他人的想法,创造力,和文章。博客作家感到荣幸展示他们的观点在最近的趋势和新闻。许多博客是专门为了政治,博客分享他的想法对政府政策和讨论。相同的地面上,许多经济学家有自己的博客。基于用户的利益,用户创建他们的博客和巨大的全球使用web服务来共享信息。在巨大的世界的信息,博客已经创造了自己的世界叫博客。更多的人们分享他们的想法,更多的创意传播。博客有自己的兴趣和见解的东西,帮助各领域发展的解决方案,即:教育领域,技术,科学,文学,和更多。基本上,这是微博的核心概念1]。Instagram、Twitter和Facebook是众所周知的多媒体社交网络博客的例子。苏等人讨论了这类应用程序的用户想要从他们的位置与其他用户互动和类似的用户首选项(2]。每天,数以百万计的用户使用的服务平台和分享的帖子。平均每个用户相关联或紧随其后的是数以百计的其他用户或朋友。实际上,它是一个用户可以查看帖子由数以百计的连接所有用户共享?大多数的用户说,不。人们的时间花在社会博客不能考虑所有用户的所有更新。在这里,是个性化的角色(3,4]。
个性化是一个分类的文章基于用户的兴趣,尽管平台上的朋友和追随者连接已经选择的用户和他们的个人资料。然而,每个实例的成员值计算和评估显示个性化的结果给用户。这种方法可以帮助用户查看相关文章在最短时间最低在屏幕上滚动。每天在这个高速运转的世界,科学家正在研究让用户的生活更简单和友好的web。智能手机的日益普及和这样的博客界面新增加了协作环境(5]。每一天,一个新算法,优化用户的资源的使用,在最少的时间内给出了相关的结果。本文讨论的内容管理算法和应用博客文章。与神经网络实现模糊推理引擎,名叫S-ANFIS,显示比较结果。结果在三个场景,即。,when training data is 70% and testing data is 30%, when training data is 80% and testing data is 20%, and when training data is 90% and testing data is 10%.
2。文献调查
基于相关工作的研究,文献工作分为两个部分:首先是基于web服务和博客,其次是基于各种推荐系统的工作特性。
2.1。基于Web服务和博客的相关工作
Constanzo和卡萨斯讨论了web框架和web应用程序和工具如何帮助评估web 2.0和web 3.0。Web框架足够足够的区分在各种平台和发现的缺点和改进Web工具和服务,帮助用户找到高效、准确的结果。在文档中,作者采取了不同的例子网站相关的书籍、教程和视频,包括在线社区,如博客,论坛,和在线存储库github,堆栈溢出,wiki,聊天。框架做了分析,确定了基于可用性和质量的关键属性,参数和措施。他们提议的一组元素的可用性评价的支持和出版资源可用17 web框架的分析,认为在那些非常受欢迎,认可,和用于web开发社区6]。
Jiugen等人采取了中国教育社区的一个例子和共享的经验思维教育的学者。作者关注的是满足教育微博,这结合了现代教育以学生为中心和以人为本的思想。定义的微博Jiugen等人合作教育发展与移动学习活动(1]。作者的微博站点中提到他们的工作,是为非正式学习过程,这有助于信息传递,信息交换和信息共享。这是合作的非正式学习资源和Web 2.0服务。
考尔和辛格的特点博客和博客数据量的增加。博客网站和社会博客越来越受用户欢迎(7]。Breuch显示用户的示范分析两个案例研究进行了讨论。案例研究研究了Facebook和Twitter博客网站的回应。社交网络反馈的评论进行了探讨与网站的可用性。作者关注的是“观众参与”社交网络的反馈了解社会博客网站Twitter和facebook类型(8]。辛格等人讨论如何提高社交网络服务。作者做了案例研究在Facebook上的web应用程序和分析评论和文章。基于模型如图1,作者试图预测有多少评论的发布预计接收下一个来小时。这个过程包含了网络爬虫和信息提取器在第一阶段。之后,信息处理的信息处理器模块和知识发现模块。主要关心的是照顾执行预测的神经网络和决策树建模技术(9]。
福等人研究和探讨人员交互的概念和检测组在微博网站上:如何增加微博传播的范围,有助于人与人之间的通信网络的发展和信息技术是如何为人们提供不同的方式相互作用。微博信息传播的最佳方式和社会交互连接的人。人们使用微博来表达他们的思想,思想和感情。总结分析读者的博客和博客的追随者,一个类似的利益集团。这种分析有助于理解行为和社区内的进化趋势。在他们的论文中,作者关注的问题组检测在中国新浪微博命名。作者已经修改SimHash算法来分析和计算利息博客的追随者之间的相似性。的利益人博客文章后,每组文章中表达的观点研究了作者(12]。丁等人在类似的工作类别的中国博客,关注用户的语义分析的博客。分析了代表职位的模式和模式的标签。作者应用随机森林算法研究[13]。王等人讨论了微博网站的排名基于用户的标签。作者随机样本的帖子和组织团体的标签和提出了一种用户标签排序模式。分数决定基于标签之间的相关性和用户等级用户标签。数据集的实验结果被超过1.4亿的用户,给了一个优秀的性能(14]。
2.2。基于推荐系统相关工作
如今,我们可以看到到处都在使用web服务的建议。它要么是一个在线购物网站,在线预订网站,博客网站,社交网站,或谷歌学术搜索等搜索网站内容。郭等人写了篇关于协同过滤和预测推荐产品购买用户根据自己的配置文件。传统上,关联规则申请同样的目的,现在高端算法给予巨大的结果,和预测的值转换为购买产品的实际模式(15]。高,吴的框架设计在创造Mashup服务设置的建议。作者采取了各种方法和分析改善建议的范围。作者认为两个要点:首先是顶级服务具有相同的功能,其次是服务之间的关系。基于列表的不同方面,混搭组合模式建议,和实验评价了ProgrammableWeb数据集(16]。
Borhanifard Minaei-Bidgoli给一个想法的波斯语博客推荐系统。作者合作许多现有算法获取和筛选博客文章基于用户的利益和建议每当用户登录。摘要模型讨论了采用聚类算法和波斯语博客的个性化的搜索结果17]。Zulkefli和本Baharudin讨论建议在酒店领域的重要性。基于用户体验,建议给新用户。根据酒店的评级反馈和评论,建议将显示新用户寻求本酒店(18]。
张等人讨论了推荐算法是基于动态用户偏好和服务质量。作者关注的服务提供给用户和新服务将如何向用户推荐基于过去的经验。随着时间的移动,用户首选项和服务质量可能会发生变化。这意味着用户的需要也将改变。在他们的研究论文,推荐算法进行了讨论,认为用户的动态特性和动态服务的质量。时间的算法已经基本LDA(潜在狄利克雷分配)模型和服务质量属于用户。作者做了实验分析,结果显示基于真实数据集(19]。哈灵顿等人发表专利关于社会network-recommended内容和个性化的搜索结果。他们有精炼的方式解释了如何生成的web和建议用户如何受益于他们(10]。各种作品可使用混合模糊模型在不同的应用程序。所需的工作一个是博客文章和推荐相关职位的用户喜欢的建议(20.- - - - - -22)强调对用户的系统建议的反应,而与博客相关的工作(23,24]。
苏等人讨论了场景的朋友的建议是如何在社交网站上显示用户的屏幕上。作者采取了朋友的一个例子社交网站的概念,讨论了计算匹配指数基于相似用户首选项(2]。周给一个想法的博客推荐系统在早期的博客Web 2.0工具。作者提出的算法基于个性化用户兴趣和共享博客信息。他讨论了系统的工作流程模型和解释信息检索根据用户的利益。模型如图2强调所有博客推荐系统的相关模块25]。
阿拉伯茶,Kumar Ahlawat提出了一个个性化的教育合作的想法。这种合作使用LMS和受到电子领域。同样,多种技术的合作可以考虑更好的算法和结果26]。
2.3。缝隙观察
根据文献调查,很明显,推荐系统是web服务的骨干。推荐系统帮助人们探索新的信息基于用户的个性化的利益。有几种方法可以用来做一个推荐系统。许多论文讨论了聚类算法,和一些强调模糊逻辑推理规则映射用户的利益。神经网络及其变体也可以用来设计一个高效的推荐系统。本文讨论建议的模型和算法是基于神经网络和模糊推理规则的结合,即。自适应神经模糊推理系统(S-ANFIS)。
3所示。提出的模型
本文提出了一种智能内容管理算法,包括四个模块。尽管许多研究论文中定义的过程是不同的名字,Rajeswari Hariharan给他们的想法在他们自己的话(这四个步骤27]。
3.1。过滤
在提出的模型中,第一步是获取用户的数据形式的博客文章。关键词提取,过滤掉分类博客用户根据他们的博客行为。一些关键词语法检查,和一些专注于这个词的语义。
3.2。回顾分析
在前面的步骤中,形成的类和分工的博客用户就完成了。回顾分析了在类和用户躺在这些类。许多博客发布他们的想法和观点,至少与他们自己的利益。这种跨域信息分析在这一阶段,并为本节中创建一个不同的类。
3.3。相似
创建一个类的用户之间相似性指数,该指数计算值。
3.4。建议
博客用户的推荐通知只有那些携带最大的博客目标值计算基于相似性指数 。为一个特定的用户 , 的用户数量是过滤掉来自同一类 。相似的兴趣领域,关键术语是代表用户的帖子,获取并策划和精制条件被认为是。这些应用使用S-ANFIS规则和学习用户行为。的索引有助于计算绩效目标值的因素 。这里,简称ANFIS帮助找到目标价值,作为一种回归算法利用人工神经网络的学习能力;与推理规则和相似性指数映射,从而导致目标价值。
灌输所有模块在一个单一的模型、工作流将如图所示3。
的实验是在两个不同的数据集上进行演示的目的:首先是派克(可用http://pikes.fbk.eu/ke4ir.html),第二个是博客数据集UCI公共数据命名为匈牙利的博客。派克数据集多半使用信息检索和知识提取技术。发表于5月29日至6月2日2016年。文本查询存储在这个数据集,并适当地排名和查询的定义。最后,骨料。csv是主要的文件,所有的问题本文。另一个数据集被匈牙利博客UCI数据集的公共数据。这个数据集已经六个主要属性,用来检查该算法的性能。这是一个多变量数据集没有任何缺失的值。匈牙利的博客数据集的主要领域是教育; political caprice; topics; local media turnover; and local, political, and social spaces. The implementation and the results are shown in the next section.
4所示。实现和结果
该模型采用S-ANFIS模型建议,和博客文章的原始数据管理算法提取的内容相关的关键词有关的博客文章。出于演示目的,实验是在两个不同的数据集上进行:出于演示的目的,首先是派克,信息检索的数据集(http://pikes.fbk.eu/ke4ir.html),第二个是博客数据集UCI公共数据命名为匈牙利的博客。使用Python实现的算法与蟒蛇IDE。实验进行一个windows机器上用2.2 GHz的英特尔i5第11代处理器有16 GB的RAM。使用数据集three-proportion比率:训练数据比率:0.9,0.8,0.7。此外,三个隐藏层考虑安,款,CNN, 1000次迭代是固定的,和学习速率是0.001。
4.1。性能指标
准确度和精密度的性能参数性能分析的实验结果。(我)精度值(2)精度值(3)平均绝对误差
4.2。性能分析
S-ANFIS的性能分析比较现有方法如下所示。在所有方法中,S-ANFIS提供最相关的结果在这两个数据集在所有方面。表1显示了分析精度、准确性和平均绝对误差矩阵在安,款,RNN和S-ANFIS模型。数据4- - - - - -6显示结果离散数据集训练数据集比例对派克1000次迭代。
表2显示了分析精度、准确性和平均绝对误差矩阵在安,款,RNN和S-ANFIS模型。数据7- - - - - -9显示结果离散训练数据集比1000次迭代数据集在匈牙利的博客。
5。结论
提出了一种自适应算法和智能内容管理基于混合模型S-ANFIS命名。该算法应用在两个不同的数据集用于演示目的。根据实现的结果,很明显,该方法可用于实际的web应用程序像Facebook, Twitter, Instagram。范围并不局限于博客和微博网站。它也可以应用到其他领域,如电子商务网站,酒店预订网站,和电影评论网站。博客是最好的方式,以反映用户的思维的内在个性。所以博客文章的例子来实现算法和各种模型。所有的算法,S-SNFIS给出更好的结果比安,款,和RNN精度,精度,平均绝对误差指标。在未来,随之而来的算法可能改善现有的结果所示。还将试图寻找其他方法来提高对积极的一面更多性能指标的影响。
数据可用性
在工作期间,出于演示目的,派克数据集是可在使用http://pikes.fbk.eu/ke4ir.html。
的利益冲突
在工作期间,没有作者的利益冲突与其他作者或组织。