研究文章|开放获取
刘秀磊,侯守禄,佟强,刘旭红,秦志辉,俞俊阳, "移动边缘计算环境下的视频命中预测方法",安全和通信网络, 卷。2020, 文章的ID8857564, 6 页面, 2020. https://doi.org/10.1155/2020/8857564
移动边缘计算环境下的视频命中预测方法
摘要
智能设备用户将大部分碎片化时间花在视频和电影等娱乐应用程序上。视频副本的迁移和重构可以提高分布式移动边缘计算中的存储效率,而视频命中的预测是视频副本迁移的前提。本文提出了一种将相关分析与小波神经网络相结合的视频点击量预测方法。通过建立视频指标量化系统,分析待预测视频与已在线视频之间的相关性来实现这一目标。然后,选取相似视频作为视频点击量的影响因素。与自回归综合移动平均(ARIMA)和灰色预测相比,该方法具有更高的预测精度和更广泛的应用范围。
1.介绍
目前,智能设备用户70%以上的碎片化时间花在视频、电影等娱乐应用上。视频内容提供商(如Netflix)希望知道他们所有视频的未来视频浏览量,特别是新视频,以便为消费者提供更好的体验。在基于5g的移动边缘计算时代,视频资源的爆炸式增长要求在网络边缘放置多个副本以获得更好的性能[1- - - - - -3.].分布式模型给视频服务商带来了很多问题,比如如何保持存储效率,提高存储的能量效率[4,5].解决这些问题的关键是有效管理数据副本和数据节点[6- - - - - -8].当前流行的云存储平台通常使用静态存储机制,即设置副本之前的副本,例如Google文件系统[9Hadoop分布式文件系统(HDFS) [10,和亚马逊发电机[11].副本的静态放置易于实现,但它可能导致不平衡的访问。For example, it is found that 90.26% of the data in Yahoo’s Hadoop Cluster can only be accessed within two days after constructing, 89.61% of the data from the last access to deletion do not exceed 10 days, and 40% of the data have a dormant period (not accessed) for more than 20 days [12].
目前的研究[13]表明,视频副本迁移重建是提高存储效率的有效手段,而视频命中数的预测是视频副本迁移的前提。有很多数据预测和推荐方法[14,15];但是,它们不考虑每个视频副本的细粒度粒度,不能为视频副本的迁移和重建提供所需信息。此外,视频占据了高比例的存储空间,并且具有更丰富的属性,视频命中的趋势受到各种因素的影响,这很难准确地预测。基于相关分析和小波神经网络(Wnn)的组合,本文通过分析要预测的视频与已经在线视频的相关性,并选择与影响因素的类似视频的相关性来提出了一种新的预测方法。
2.相关工作
2.1.视频拷贝的特征分析
视频副本涵盖了新闻、教学、观看等多种属性,是存储在云上的最具代表性的数据副本类型。现有的命中预测是粗粒度的(参见图)1(一)),他们不考虑每个副本的细粒度命中,无法为视频副本的迁移和重建提供信息。提供视频副本命中的预测方法是一个紧迫的问题。
(一)
(b)
数字1(一)为2014年3月至2015年2月的长时间(以月为单位)趋势。2014年6月上映的《变形金刚4》刺激了之前的系列,甚至是相关的科幻系列。从图中对应的短时间尺度(以周为单位)1 (b),发现视频点击量具有一定的周期性和自相关性。这意味着视频的点击率受到其他类似视频的点击率的影响。因此,预测视频命中的一般方向是:时间序列数据的学习时间较短,可用参数较少。
2.2.现有的预测方法
随着新娱乐需求的增加,各种保证服务质量(QoS)的预测方法近年来受到越来越多的关注[16,17].张等人[18]通过邻域感知矩阵分解,提出了一种基于覆盖的Web服务的质量预测方法。Qi等人。[15]提出了一种基于经典位置敏感哈希技术的智慧城市工业环境隐私感知数据融合与预测方法。张等人[19]提出了一种具有隐私保护的边缘计算网络的分布式边缘QoS预测模型。但是这些作品都是从宏观的角度出发,不能适用于需要微观视角的视频拷贝的命中预测。
自回归综合移动平均(ARIMA)模型是基于时间序列的自相关,其特点是第一和时间序列是广泛和稳定的。另外,如果单个数据的值在序列均值上没有上下波动,ARIMA可以通过微分的方式对原始数据进行平滑处理。这样,即使数据有一定程度的波动,也可以通过平滑处理达到预测精度。因此,ARIMA适用于具有平坦趋势和线性宽平稳过程特征的数据的预测。它常用于网络流量预测[20.,21,而每个数据副本的流量具有更细粒度的粒度。
灰色预测是一种具有不完整或不确定数据的知识获取方法[22].通过分析系统因子变化的差异程度对原始数据进行处理,通过建立基于少量信息的灰色差分预测模型对未来数据进行预测。灰色预测模型适用于视频文案刚投放市场,原始数据很少的情况。这两种方法看似可行,但由于视频复制中的波动因素很多,我们从这些因素来分析这段视频。
本文考虑到每个视频的点击量与其相似视频的点击量密切相关。这是通过分析视频观看模式的源的主成分来实现的。例如,提出了一个系统的质量关联模型,描述了服务之间的三种不同类型的质量关联[23].从逻辑上讲,在网上观看某个视频后,会有一些相关的视频推荐,而相关视频的推荐和影响是视频点播的主要组成部分。通过对Storm网站的调查分析,在观看一个视频后,Storm推荐的前三名类似视频的平均观看率分别为47%、30%和25%。推荐结果的平均值来自Storm网站上随机抽样的200个视频。这意味着,当总观看人数保持稳定时,就有可能根据当前观看类似视频的人数来推断未来某个视频的潜在观看人数。过程中存在延迟,对智能分析至关重要。本文将小波神经网络应用于未来视频命中预测。基于小波的神经网络用小波函数代替隐藏节点的激活函数。近年来,一些研究将小波神经网络模型应用于网络流量预测[24,但视频拷贝的点击率预测是一个更微观的角度。解决这个问题的关键是根据要预测的视频,逆推作为预测相关参数的视频。
2.3.选择相关视频
本文中相关视频的选择分为两步:第一步是选择12个与待预测视频相似的视频;第二步进一步降低参数维数,从视频的相似度中选取相关度最高的四个。
2.3.1.类似的视频选择
类似的视频选择相同类型的视频通过建立向量空间模型(VSM)计算并选择的视频中,观众的程度,视频的类型,年龄的观众,生产者的影响,等等,然后细化和量化分数在0和100之间,如表所示1.
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
让米1和米2是要比较的视频对象,并且f1,f2、……fn成为每个对象的属性。之间的相似性米1和米2可以利用视频对象的属性进行计算。视频属性的值f我对应于米1和米2是用一个我和b我, 分别。通过使用支持向量机(SVM),之间的相似性米1和米2,表示 ,计算如下:
从方程(1),我们可以计算最相似的12个视频,以便进一步减少维度,以及从12个视频中选择最相关的视频作为预测参数。
2.3.2.关联度分析
表格2在10天内显示6个样本视频的命中x1为2014.10.26 ~ 2014.11.24,数据为x2……x5 .涵盖2014.10.20 - 2014.11.18的时间跨度。x1是要预测的视频,可以通过上一周其他视频的点击量得到。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
结合度的计算可以分为以下步骤。步骤1:对Table中的数据进行标准化2,在那里x,y分别表示纵向数据和横向数据。的样本均值 -视频是 (j = 1, 2, ……,n);通过它,我们可以计算样本方差 -th视频: (j = 1, 2, ……,n);标准化的形式是 .经过标准化计算,我们有 步骤2:计算相关矩阵 , , ;得到相关矩阵后,我们可以分析视频之间的相关性,如表所示3.,其中x1是需要预测的视频;x2,x3.x4,x5,x6是需要分析变化程度的类似视频。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
从12个类似的视频中,选择相关矩阵和x1个最接近四个视频用作预测视频;上面的矩阵是与视频进行比较的第一批x1;很明显x4,x5,x1与单击播放高度相关。通过这种方式,选择视频x3 -x5,使用当前的点击量来预测视频的点击量x1.
2.4.小波神经网络
神经网络常用于预测和分析非线性时间序列。从理论上讲,神经网络的预测精度可以任意实现。但在实际应用中,可能会遇到许多困难,如神经网络结构的描述,训练和学习过程太慢,在优化过程中陷入局部次优。小波神经网络结合了小波分析和神经网络的特点。将神经网络中的神经元替换为小波神经元,将神经网络中的Sigmoid替换为小波函数(作为激活函数),并通过仿射变换建立小波变换与网络系数之间的关系。小波神经网络具有以下特点:(1)学习能力强,函数逼近能力强,预测精度高。(2)作为网络的换档因子和缩放因子可以避免局部最佳最佳的事实是预先确定的。(3)以小波函数作为激活函数具有较高的学习和训练速度,易于实现。
小波神经网络分为输入层、隐含层和输出层,如图所示2.输出层采用线性输出。输入层的神经元为(x1,x2、……x米),隐藏层有神经元,输出层有神经元。在这种情况下,由于关联的视频数量为4,因此有4个相关参数作为预测的基础,输入神经元的选择为4。在一组每日访问中,我们发现访问是以天为单位记录的;访问周期为7天。然后,设置隐藏层中间使用的神经元数为7,输出层为7。这就是本案例使用4-7-7结构神经网络的原因。是小波基函数,而不是先前的激活函数sigmoid。
让表示层神经元的权值为层 , 表示 -神经元输入在层里 , 表示层的传递函数 ,和表示层的相应输出。
由于该案例是在三层网络中设计的,因此 , 是隐藏层中的传递函数。这种情况叫做Morlet小波,由
鉴于组的输入和输出样本,误差函数可以表示为 在哪里的预期输出是 -th节点和实际输出的是 -节点。 , ,和不断调整以最小化错误。当误差小于给定值时,程序将结束,并且可以计算适当的预测值。
对于一系列属性相似且稳定的视频,所提出的方法能够获得合理的预测结果。然而,对于某些视频的声誉比本系列中的其他视频差或好,所提出的方法可能会产生有偏的预测结果。这是因为一个潜在的不平衡的名声影响了最终的结果。
2.5.绩效评估
作为实际的视频副本,如果预测粒度太低,例如一天,它没有很大的意义,因为视频副本不可能用24小时时间单位进行频繁的评估迁移。如果预测粒度过长,例如在月单位,则无法及时捕获视频副本的每周趋势。因此,预计该实验将具有长期,数据收集基于日期,估计收集84天数据。要测试的目标数量是2014.10.26至2015.1.17,作为影响因素的视频数据来自2014.10.20至2015.1.11,双方的前56天被用作培训数据,以及最后28天的数据用作测试数据。该实验在64位Windows 7专业人员上运行,具有10 GB的RAM和2.1 GHz Intel Core I3处理器,并使用MATLAB R2014A进行仿真和数值分析。神经网络设计为4-7-7结构,输出为7节点数据。
从图3.,可以看出,ARIMA通过差分算法可以很好地拟合预测前的时间序列数据,但在把握数据趋势方面并不准确。数字4结果表明,灰色预测可以预测数据的总体趋势,但误差范围较大。在变化趋势和预测精度方面,所提方法的性能表现为最优结果,如图所示5.
如果一个星期后预测,它将成为一个训练集,然后预测下周的方式。每个预测的时间粒度不一样,分别为7天、14天和28天。从表中可以看出4如果预测的时间粒度为1周或4周,则提出的方法是最准确,远高于Arima和Gray的方法。如果预测的时间粒度是两周,则三种预测方法的精度是可比的。在所提出的方法中,类似视频的命中历史用作影响因素。因此,可以推断,基于相关分析和WnN的组合的预测方法比替代方案具有更好的实际效果。
|
||||||||||||||||||||||||||||
当将此方法应用于其他几种类型的视频时,结果与上述情况类似。该方法的平均预测精度比ARIMA算法提高了10%,比灰色预测算法提高了5-7%。
从以上分析可以看出,每种预测方法都有其优缺点。如果视频进入一定的生命周期,ARIMA具有一定的优势,具有相对平缓的变化趋势和线性宽平稳过程的特征。但是如果点击量的变化趋势是平缓的,那么对于视频拷贝的迁移就没有什么意义了。
3.结论
本文提出了一种基于相关分析和Wnn的组合的视频点击预测方法。这是通过建立视频索引量化系统来实现的,并分析要预测的视频与在线视频之间的相关性。然后,选取相似视频作为视频点击量的影响因素。与Arima和灰色预测相比,所提出的方法具有更高的预测准确性和更广泛的应用范围。
数据可用性
没有数据用于支持这项研究。
利益冲突
提交人声明有关本文的出版物没有利益冲突。
作者的贡献
Xiulei Liu和Junyang Yu提出了这份手稿的整体思想。Shoulu Hou和徐红刘设计了实验计划。羌塘和志辉秦写并修改了手稿。所有作者都为这项研究工作做出了贡献。所有作者都已经阅读并赞成最终的手稿。
致谢
国家重点研发计划项目(No. 2018YFC0830202);北京信息科技大学秦心人才培养计划(2020)资助;边缘计算创新科研平台建设项目(No. 2020KYNH105);数字出版技术国家重点实验室开放基金资助。
参考
- Xu X. Zhang X. Liu X. Jiang J. Qi L. and m.z. A. Bhuiyan, " Adaptive computation offloading with edge for 5g -畅想的互联网络,"IEEE智能交通系统汇刊, 2020年。查看在:出版商的网站|谷歌学术搜索
- “物联网边缘计算中的动态计算卸载,”IEEE物联网杂志,第6卷,第4卷。3, pp. 4242-4251, 2019。查看在:出版商的网站|谷歌学术搜索
- Huang, J. Liang, S. Ali,“一种基于仿真的边缘计算中可靠性感知服务组合优化方法,”IEEE访问,卷。8,pp。50355-50366,2020。查看在:出版商的网站|谷歌学术搜索
- “基于混合能源的异构移动边缘计算的联合任务调度与能量管理,”IEEE物联网杂志,第7卷,第2期。9, p. 8419, 2020。查看在:出版商的网站|谷歌学术搜索
- “一种基于多队列的传感器集线器高效任务调度方法,”电子学报第29卷第2期。2,pp。242-247,2020。查看在:出版商的网站|谷歌学术搜索
- Xu X., Mo R., Dai F., Lin W., Wan S., and W. Dou,“面向云数据密集型气象工作流的容错动态资源配置”,IEEE工业信息学汇刊,第16卷,第2期。9, 6172-6181页,2020。查看在:出版商的网站|谷歌学术搜索
- 李军,蔡涛,邓凯,“社会网络中的社区多元化影响最大化”,《社会科学》,2011年第3期。信息系统,卷。92,pp.1-12,2020。查看在:出版商的网站|谷歌学术搜索
- Xu X., Fu S., Li W., Dai F., Gao H., Chang V.,“基于NSGA-II的云基础设施工作流管理多目标数据放置”,IEEE计算智能新兴议题汇刊,第4卷,第4期。5, p. 605, 2020。查看在:出版商的网站|谷歌学术搜索
- g . GhemawatH。Gobioff和S. T. Leung,“谷歌文件系统”,在第十九届ACM操作系统原理研讨会论文集,第29-43页,2003年10月着陆纽约州美国。查看在:谷歌学术搜索
- K.Shvachko,H. Kuang,S. Radia和R. Chansler,“Hadoop分布式文件系统”2010年IEEE第26届海量存储系统与技术(MSST)研讨会论文集第1-10页,IEEE, Tahoe, NV, USA, 2010年5月。查看在:谷歌学术搜索
- G. Decandia,D. Hastorun,M.Jampani等,“Dynamo”,ACM SIGOPS操作系统审查,卷。41,没有。6,PP。205-220,2007。查看在:出版商的网站|谷歌学术搜索
- R.T.Kaushik和M.Bhandarkar,“GreenHDFS:迈向节能,储存 - 效率,Hybrid Hadoop计算机集群”USENIX年度技术会议记录,第109卷,第34页,波士顿,MA,美国,2010年6月。查看在:谷歌学术搜索
- A. Higai, A. Takefusa, H. Nakada,“HDFS节点删除时有效副本重建方案的研究”,载于2014年第14届IEEE / ACM集群,云和网格计算的INEEE / ACM国际研讨会。, pp. 512-521, IEEE,芝加哥,IL, USA, 2014年5月。查看在:谷歌学术搜索
- 何琪,陈芳,张晓,窦伟,倪琪,“基于数据驱动的web api推荐,”IEEE大数据汇刊, 2020年。查看在:出版商的网站|谷歌学术搜索
- 祁磊,胡超,张旭东等,“面向智慧城市工业环境的隐私感知数据融合与预测,”IEEE工业信息学汇刊,第1页,2020年。查看在:出版商的网站|谷歌学术搜索
- 陈勇,张娜,张勇,陈晓,吴伟,沈晓生,“移动边缘计算中移动设备能量效率的任务转移和频率缩放,”IEEE云计算汇刊, 2019年。查看在:出版商的网站|谷歌学术搜索
- 黄俊,李淑丽,陈勇,“面向移动边缘计算的物联网批量作业的收益优化调度与资源管理”,点对点网络和应用,第13卷,第1776-1787页,2020年。查看在:出版商的网站|谷歌学术搜索
- 张勇,王凯,何倩等,“基于覆盖的基于邻域感知矩阵分解的web服务质量预测”,IEEE服务计算汇刊, 2019年。查看在:出版商的网站|谷歌学术搜索
- Y. Zhang,J.Pan,L. Qi和Q. He,“保留了基于Edge的IoT服务的质量预测”,未来一代电脑系统,第114卷,336-348页,2021年。查看在:出版商的网站|谷歌学术搜索
- M.Lippi,M.Bertini和P. Frasconi,“短期交通流预测:时间序列分析和监督学习的实验比较”IEEE智能交通系统汇刊第14卷,第2期。2, pp. 871-882, 2013。查看在:出版商的网站|谷歌学术搜索
- Y. Yu,J. Wang,M.歌曲和J.歌曲,“网络流量预测基于季节性Arima和相关系数的网络流量预测和结果分析”2010智能系统设计与工程应用国际会议论文集,第1卷,第980-983页,IEEE,长沙,2010年10月。查看在:谷歌学术搜索
- 刘士林、胡敏、杰弗里、杨元庆,“灰色系统模型的研究进展”,《管理科学》,2006年第1期。航空航天大学交易第29卷第2期。2, pp. 103-111, 2012。查看在:谷歌学术搜索
- 张勇,崔国栋,邓树华,陈峰,王勇,何青,“服务组合质量相关性的高效查询,”IEEE服务计算汇刊,2018年。查看在:出版商的网站|谷歌学术搜索
- N. M. Hindoriya, S. N. Singh, S. K. Singh,“基于小波神经网络的电力市场能源价格预测”,IEEE电力系统汇刊(第23卷)3,页1423-1432,2008。查看在:出版商的网站|谷歌学术搜索
版权
版权所有:刘秀蕾等。这是一篇开放获取的文章知识共享署名许可如果正确引用了原始工作,则允许在任何媒体中的不受限制使用,分发和再现。