文摘

评价指标的关联度很低从当前用户感知评估模型和忽视多元化指标之间的非线性关系和用户体验在不同时间视频导致长时间运行和短视频的用户感知精度较低。为了解决这些问题,我们提出一个用户体验感知算法基于多元非线性回归的长和短视频(LSMNR)。首先,提高建模的效率和精度,算法包括预处理边缘服务器,将视频数据的视频基于他们的持续时间和受欢迎程度。然后,我们引入一个新的多维定量评价指标符合用户的主观经验和进一步分析多个评价指标之间的影响(视频滞后,黑屏,等)和用户的经验(体验质量)质量不同的视频类型。此外,数据的特征提取多个评价指标;用户使用视频质量主观评价实验设计专家组(VQEG)标准;样品和测试数据库建立。最后,最优模型参数训练通过应用非线性最小二乘方法和支持向量机(SVM),那么您交替确认样例数据。我们的仿真结果表明,提出的皮尔森相关系数LSMNR算法获得一个值为0.9810。与算法相比,基于多项式线性回归(高),线性支持向量机和神经网络(NN),该算法的知觉准确性提高了至少4.0%,它适用于更广泛的视频类型。

1。介绍

目前,由于用户的极其有限的注意力,视频流服务与短时间短和分享速度快和广阔的市场前景已经成为社交媒体的规范。快速发展的同时,短视频平台,如TikTok Bilibili, YouTube和激烈的竞争从服务提供者1,2),增强用户体验的需求增加了。尤其是大规模的好视频观看体验决定视频提供商和平台可以赢得新消费者以及保留现有消费者的忠诚度,从而提供一个竞争优势平台(3- - - - - -5]。因此,研究具有重要意义的长时间运行和短视频用户体验感知算法。

准确地描述用户的视频感知经验,国际电信联盟电信标准化(ITU-T)部门发布的经验(体验质量)的用户质量标准,使用意味着意见分数(MOS),以反映用户的主观视频体验(6]。在此基础上,大多数研究在视频用户感知依赖移动边缘计算(MEC)本地化处理大量数据的能力和高计算和存储的数据的优势,从而分析和处理大量的数据流中提取多个网络特征指标(如传输延迟、抖动等)。线性回归,他们用神经网络和其他方法来分析网络特征和体验质量之间的相关性(7- - - - - -9]。随后,建立了用户体验质量感知模型准确地感知视频质量。然而,随着提取指数类型的增加,新引入冗余索引展示与体验质量低的相关性,和线性多变量之间的关系指数和用户主观体验不明显。除了高复杂度的算法,无法实现预期的细粒度的知觉准确性使用传统的多元线性模型,用来解释多个指标和体验质量之间的关系。与此同时,大量的冗余新索引收集的数据从网络很难迅速处理和分析,从而导致算法复杂度的增加和其他问题。

此外,大多数当前的在线视频流媒体用户体验质量感知算法设计的长视频(10,11),不能直接应用于评估当前视频用户感知。相反研究用户体验质量之间的关系和评价指标,如图像质量和网络波动在一个贫穷的网络环境对3 d或长寿的视频数据,短视频数据更敏感的一些特性,比如滞后和黑色屏幕但不敏感图像质量和帧速率等指标。事实上,当用户在线观看短视频(16 s长度或更少),他们倾向于选择观看nonlagging流行视频对视频质量。因此,当前的感知算法局限于评估传统长视频的用户体验。因此,迫切需要进一步探索新的评估指标之间的关系和用户体验质量视频不同持续时间和受欢迎程度。

为了解决上述现有算法的局限性,本研究提出了一种用户体验感知算法基于多元非线性回归的长和短视频(LSMNR)。首先,提高建模的效率和准确性,原始视频数据挖掘和分析的视频进行分类是基于他们的持续时间和在边缘服务器。随后,一个新的多元定量评价指标拟合用户的主观经验介绍,分析用户体验感知之间的关系和关键质量指标(KQI;视频回放的成功率、平均延迟,等),服务质量(QoS)变量指标(视频播放缓冲时间,黑色屏幕时间,等等),和量化参数(抖动和丢包率等)对不同类型的视频。因此,多个评价指标的数据特征提取;用户主观实验设计;样品和测试数据库建立。此外,非线性最小二乘方法和支持向量机(SVM)是用来配合,那么您交替确认样本数据;训练得到的模型参数模型;和感知结果进一步优化。 Finally, the validity and accuracy of the perception model are verified using test data.

总结了本研究的主要贡献如下:(1)本研究将细分视频类型根据时间和受欢迎程度和建立一个原创视频数据库包含6个不同的视频类型以提高建模的精度和准确性。(2)本研究设计基于短期和长期的用户主观评价实验视频。20在这个实验中,实验者按照MOS得分他们观看的视频标准,和6000组样本数据和测试数据生成。视频质量和用户体验评价指标之间的关系在不同的时间和受欢迎程度进一步分析实现细粒度的长和短视频用户的知觉经验。(3)本研究提出了一种LSMNR算法和引入了一种新的多变量量化评价指标,符合用户的主观经验。在此基础上,结合用户感知数据在主观实验中,多个感知模型获得的不同的模型参数训练样本数据和测试数据不同的视频类型。然后,这些指标之间的非线性关系,分析了不同类型的视频用户体验。和非线性最小二乘法等方法和支持向量机训练样本数据来实现最优感知的结果。(4)我们的仿真结果显示,算法相比,基于多项式线性回归(高)、支持向量机、神经网络(NN),该算法更大的知觉准确性约4.0%,它适用于更广泛的视频类型。

本研究的其余部分组织如下。节2节中,我们将讨论一些相关工作,3,我们描述了系统模型和它的组成模块。节4,我们介绍的具体过程和参数设置用户的主观评价实验。节5,我们建议LSMNR算法,并介绍如何培养感知模型。节6,我们目前的仿真结果和讨论。最后,在节7,我们将讨论的意义研究成果和总结研究。

近年来,结合MEC技术,研究提出了各种数据分析方法研究评价指标,主要影响用户的体验质量(12- - - - - -14),建立用户体验感知的高精度视频业务模型。Garcia-Pineda et al。15)提出了一个算法高,高的知觉准确性,分析之间的关系延迟抖动和丢包率等评价指标和体验质量。石和黄16)提出了一种基于决策树的视频感知算法,综合考虑电网和视频参数之间的映射关系(如噪声标准差、歧义和块效应,等等)和用户的主观感受,设计了一种模糊逻辑系统给予客观的分数,这大大提高了用户体验感知的准确性。考虑到精度低,容易过度拟合的线性回归、决策树等传统方法,研究人员开始构建体验质量感知模型视频使用机器学习的方法。例如,郝和Qingbing [17)提出了一种新的视频质量感知评价方法基于卷积神经网络,提取空间和时间域信息的扭曲的视频,实现端到端视频质量的评价和解决训练样本不足的问题扭曲的视频,他们的训练时间长,难以收敛。Bulkan和Dagiuklas18)提出了一个linear-based支持向量机和神经网络算法。他们进行了一个主观调查用户的观看体验,建立了一个示例数据库,和体验质量指标与高度的相关性等从视频中提取总暂停时间和初始缓冲时间训练测试,有效地降低了建模时间和改善知觉准确性。此外,为了提高感知精度,一些研究人员试图提取编码数据的原始视频,比较和分析图像预处理逐帧的视频信息,客观地评价用户体验质量基于受损图像的特征。然而,重要的是要注意,有很多因素可以影响体验质量评价指标;这些众多因素的影响,往往有复杂的关系,比如一些功能和用户体验质量独立展示一个简单的线性关系,而一些有一个不规则的非线性关系。上述工作只考虑这些因素之间的线性关系,和直接的分析这些因素增加了模型训练时间大大限制了模型的准确性和其他问题。

此外,一些研究认为影响因素之间的相关性在不同类型的视频和体验质量是不一样的19,20.];因此,设计相应的模型可以有效地减少训练时间,提高感知的准确性。例如,通过细分视频类型(虚拟现实视频,视频等),特殊的感知模型可以设计来满足特定的需求(21,22]。古兹曼et al。23)提出了一种用户体验评估算法适合3 d视频流媒体服务测试性能的自适应编码为2 d和3 d视频和客观地评价3 d视频等参数根据不同的分辨率,持续时间、平均比特率,进一步提高模型评价的准确性。范et al。24]提出了一种虚拟现实(VR)全景视频的用户体验感知算法基于四项指标,即质量、身临其境的指数,nonrotation,和一个总分,主观评价,然后设计一个客观评价方法的输入参数比特率、延迟和丢包。仿真结果表明,它可以有效地提高感知的准确性。此外,Chen等人。25]提出了一种用户体验感知算法适合生活视频,使用多尺度时间关系推理发现命令帧之间的内在联系,捕捉短期和长期扭曲观念变化,体验质量和细粒度的估计从视频的角度理解。因此,上述工作分析不同因素之间的映射和基于视频的用户感知类型,不考虑时间和声望在体验质量的影响。因此,新的视频用户感知算法还应该把这两个参数的影响除了其他重要的因素,进一步分析其体验质量影响短期和长期的视频。

不同于现有的研究工作,本研究主要研究用户体验之间的非线性关系和新多个评价指标(视频滞后,黑色的屏幕、抖动、丢包率、等),满足用户在不同视频的主观经验类型如持续时间和受欢迎程度。提高建模的精度和准确性,主观用户感知实验设计和原创视频样本数据库,并建立测试数据库。与此同时,本研究提出了一种基于多元非线性回归用户体验感知算法对长时间运行和短视频,进一步分析新的评估指标之间的非线性关系和用户体验下不同类型的视频,并使用非线性最小二乘方法和支持向量机训练样本数据,从而实现最优感知的结果。

3所示。系统模型

在这项研究中,我们提出一个LSMNR算法。首先,我们建立一个长时间运行和短视频的用户体验感知系统模型基于多元非线性回归,如图1。在图中,模型主要由四个部分,包括边缘服务器、大数据预处理模块、特征提取模块和用户感知训练模块。边缘服务器负责提供和收集原始视频并生成视频数据库。大数据预处理模块负责预处理5 g的网络视频服务数据。特征提取模块提取关键信息,影响用户感知评估原始数据的准确性。用户感知模型的训练模块负责训练数据和客观的用户体验评估的原始视频。

在系统模型中,5 g网络视频服务数据预处理第一,紧随其后的是细分的视频类型基于时间和流行,随后,关键信息影响用户感知精度(KQI、QoS和量化指标)的原始数据被收集和处理。

此后,多个评价指标的特征值提取的视频服务,和sample数据库测试数据库生成基于主观测试的结果。然后,使用多元非线性回归算法,多个变量指标之间的非线性关系和用户体验质量建立了采用最小二乘和支持向量机的方法,拟合样本数据,交叉验证。最后,输出提出了短期和长期的用户体验感知评价结果视频。

3.1。大数据预处理模块

有必要考虑主观和客观因素,如网络延迟,缓冲延迟,等等,影响用户感知的准确性在长时间运行和短视频服务。在长期和短期的实际在线观看视频,传统抽象网络量化参数不能进一步精密主观用户体验的感知不同持续时间的视频(如短视频不到16 s和长视频超过30分钟)。相反,用户对视频质量的受欢迎的视频内容,不受欢迎的内容,和其他内容是完全不同的。因此,本研究认为采矿和视频业务大数据的分析,进一步精炼视频分类基于时间和在边缘服务器,并建立不同的样本数据库,进一步优化用户感知精度在发展中随后的培训模式。

3.2。特征提取模块

此外,本研究综合考虑多个索引变量的影响,如KQI QoS,感知精度的定量指标,并确保变量指数符合用户体验感知法提取特征信息的所有变量。首先,在视频业务,KQI主要反映用户的主观感受感知经验,包括视频回放的成功率和视频回放的平均数冻结。视频回放的成功率是视频时,可以成功地扮演的百分比相同类型的视频样本收集5 g网络。其表达式如下: 在哪里 表明成功的次数,用户可以观看相同类型的视频 表明用户请求的总次数相同类型的视频。

视频回放冻结的平均数量 代表了视频回放的时候冻结5 g网络中由于各种因素,及其表达式如下: 在哪里 代表的数量视频从开始到结束,停滞 代表成功的总数相同类型的视频。

视频服务的QoS指数可以反映用户的客观感知的经验在某种程度上,包括黑屏幕和缓冲时间。 指的是一个黑色的屏幕的时间在一个糟糕的网络环境相同类型的视频被收集在5 g网络。其表达式如下: 在哪里 显示黑屏时间和数量 表示每个黑屏的时间。

视频播放的缓冲时间 估计时间从用户点击视频链接到视频回放的开始时5 g网络收集相同类型的视频样本。表达式如下: 在哪里 代表足够的缓存数据的时候开始玩视频和传播 代表用户请求相同的视频的时候。此外,如果有一个广告视频中,广告的上场时间不计入

此外,网络层视频服务的QoS参数,如延迟抖动 和丢包率 ,也会影响用户的感知质量和可以使用Wireshark收集经验。

3.3。用户感知模型训练模块

由于提取KQI、QoS和量化参数,生成相应的数据库。然后,基于主观评价实验的后续工作,我们建立了样本和测试数据库。用户感知评估模型基于多元非线性回归算法建立进一步分析多元变量之间的非线性关系和用户体验的质量,从而使细粒度的知觉,高感知的用户体验。其中,用户感知的基本表达多元非线性回归算法的评价模型如下: 在哪里 模型参数, 是一个 - - - - - -维度模型向量, 代表模型中其他可能的干扰, 的数学期望 通常设置为0。

此外,它假定训练样本数据 ,在哪里 代表了i的输入参数j样本,和 代表j样本的输出结果。模型的基本表达式可以进一步简化如下: 在哪里 表示模型中的随机误差。此外,误差函数服从独立同分布。评估过程中的用户体验质量,六组模型参数根据不同的视频都是经过训练的类型建立不同的感知模型。

随后,认为非线性回归模型的参数估计问题主要是通过已知的输入数据估计模型参数的值观察。因此,有必要估计模型参数θ和标准偏差的平方之和如下: 在哪里 表示训练样本的总数。考虑到培训评估模型的目的是最小化 在训练样本集,函数 是连续可微的模型参数 ,并获得模型参数的偏导数

4所示。用户主观评价实验

评估的有效性和准确性提出了长视频用户感知模型,与此同时,我们认为目前没有公布的数据和相应的数据库长时间运行和短视频的主观实验。在这项研究中,300年的原始视频从TikTok Bilibili,和其他平台下载,视频数据库进一步建立了随后的用户体验质量主观评价实验。数据库包含150短视频的小于或等于16和150的视频超过30分钟。表1提出的具体参数设置长时间运行和短视频。

在每个数据库中,我们把视频分成三种类型:流行的,普遍的,和不受欢迎的视频内容根据视频播放的数量和喜欢的数量。视频的分辨率是1280×720,免版税。我们使用了首映式和MATLAB软件模拟缓冲的影响,拖延和黑色屏幕视频回放过程中,封装原始视频基于h标准而导出的视频。我们也使用了QNET软件模仿视频回放的效果差网络环境和设置不同的延迟抖动和丢包率处理原始视频。

在这项研究中,20从北京大学信息科学技术学科参加了主观评价实验。所有的科目都在20到30岁之间,正常的视力。进行主观评价实验根据环境和光线设置指定的视频质量专家组(VQEG) [26]。受试者认为他们看根据MOS标准的视频,展示在表2

此外,VQEG了均方根误差(RMSE)和皮尔逊相关系数(PCC)作为标准来衡量感知算法的有效性和准确性。其中,RMSE值之间的偏差反映了客观的评估值计算模型和用户的主观感知。值越接近于0,更准确的评估模型。表达式如下: 在哪里 原创视频样本和的总数吗 看后评估价值吗j -视频用户的主观实验。

此外,大多数算法使用PCC判断视频质量感知模型的准确性和使用之间的线性相关性评估价值和实际价值作为评价标准。PCC的大小(−1,1)之间,其值越接近1,评价模型的效果越好。PCC表达式如下: 在哪里 是用户的主观实验的平均值得分设置和 模型计算的平均值评价集。

5。LSMNR算法

在这项研究中,基于用户的主观实验结果来生成样本和测试数据库,长和短视频的用户体验感知算法提出了基于多元非线性回归(LSMNR)。在训练的过程中感知模型,我们建立一个独立的知觉模式,细分类型的视频。类似传统的多元线性回归,得到了最优感知模型的模型参数,将输入变量映射到高维空间和拟合他们通过应用非线性最小二乘方法和支持向量机方法,分别。

首先,感知模型的最优模型参数用非线性最小二乘法获得。在图2、视频样本数据编号从1到50选择。其中,我们假设每五视频是一组,和多元独立变量X这组视频样本和不同数量的所有其他变量保持不变,除了一个变量线性变化。然后观察多元独立变量之间的关系X和因变量Y。例如,在多元独立变量X的视频样本编号1 - 5(横坐标值),只有丢包率线性增加,和其余的多元独立变量不变。然而,相应的因变量Y(纵坐标MOS值)在图2不会增加线性、指数或对数。同样,在多元独立变量X的视频样本编号6到10(横坐标值),只有延迟抖动线性增加,而另一个多元独立变量不变。然而,相应的因变量Y(纵MOS值)不增加线性,指数或对数。因此,可以看出,多元独立变量之间的关系X和因变量Y不是指数或对数和不能直接表达的常见功能关系。此时,非线性最小二乘问题不能构建一个矩阵的线性方程组。因此,我们试图把它变成一阶泰勒展开式的线性最小二乘问题。模型训练的过程是解决以下问题: 在哪里 函数的一阶导数是什么 ,它也可以表示为jth雅可比矩阵的行 ,

此外,感知模型的最优模型参数得到了使用非线性支持向量机方法。我们引入合适的核函数将低维不可分割的空间矢量映射到高维特征空间,以便优化非线性问题解决方案获得培训后也转化为对偶问题的解决。让 分离超平面, 法向量, 是超平面拦截。模型训练过程需要解决以下问题: 在哪里 点球权衡因子和吗 为松弛变量,表示宽容温和的分类错误。让内核函数 ,在哪里 是一个径向基函数参数,通常采用0.125的价值。此后,(12可以转换成) 在哪里 拉格朗日乘子向量和吗 是惩罚因子。

总之,不同的模型参数计算基于上述两种方法。因此,在导入测试样品,和培训的有效性输出与主观评价结果根据不同类型的视频,如图3。通过选择精度高的模型参数,用户感知评估模型建立相应的视频类型实现细粒度感知紧随其后。

6。模拟和讨论

基于MATLAB平台,结合主观评价实验数据,本研究也进行模拟的知觉体验质量为用户长时间运行和短视频。与此同时,该算法中的感知模型的准确性是高钙相比,支持向量机,神经网络算法,不同的影响因素对用户体验的质量在不同的视频类型进行模拟和分析。

模拟比较用户体验的变化与不同类型的视频在不同评价模型,如图45。图的横轴4代表了流行的视频,常见的视频,和不受欢迎的视频。图的横轴5代表了视频长时间和短时间的视频。在数据45,纵轴代表了皮尔森相关系数(PCC)。从图可以看出4,用户感知的所有算法的准确性受欢迎的视频是远低于普通的和不受欢迎的视频。这是因为有许多因素影响感知用户体验在不同的流行视频,和之间的相关性评价指标中选择现有的算法和用户感知体验低。因此,当用户看流行的视频,他们期望更高的视频内容的质量和更低的容忍视频损伤,使得该算法很难准确评估实际用户的主观经验基于客观评价指标。从图可以看出5,用户感知精度的算法对长视频是高于短视频,同时为视频用户LSMNR算法的准确性高于高得多,支持向量机,神经网络和其他算法。这是因为当前在线视频流媒体感知算法设计长时间视频,和他们研究的评价指标有更高的相关性和更高的知觉准确性与用户感知的经历很长一段视频。然而,LSMNR算法提出了改进长和短视频不同的评价指标,介绍了评价指标与视频等高度相关滞后和黑色屏幕,可以训练不同模型参数根据不同的视频类型实现细粒度的用户感知的准确性。此外,我们可以看到从表3LSMNR的知觉准确性高,支持向量机,神经网络流行的视频是0.9645,0.9125,0.8962,和0.9140,分别为0.9851,0.9250,0.9594,0.9590,普通视频和0.9771,0.8957,0.9481,0.9432,不受欢迎的视频,分别。LSMNR,高钙、支持向量机和神经网络算法开发短视频展示感知精度为0.9870,0.9037,0.9459,和0.9401,分别。长时间视频,感知精度为0.9912,0.9912,0.9556,和0.9592,分别。总之,这个算法的平均感知精度为0.9810,提高了7.7%,4.2%,和4.0%,与其它算法相比。因此,可以推断,该算法具有较高的知觉准确性和适用于大范围的视频类型。

仿真比较了关联用户的主观评价和客观评价的感知模型,以及模型的性能,如图6。在图中,横轴代表MOS基准价值,纵轴代表了客观评价得分后感知算法模型的训练。紫色的离散点的距离黑对角线是知觉的准确性密切相关模型,即距离越小的离散点蓝色的对角线,相应模型的准确性就越高。从图可以看出6的感知模型LSMNR算法显示了更好的收敛性和评估性能比其他的知觉模型算法。这是因为高钙等算法,支持向量机,神经网络主要是基于单个长视频和感知网络波动指数显示的用户体验。这些指标之间的相关性和用户短视频的主观感受不同的流行视频很低,从而导致较低的模型的客观评价结果的准确性。黑屏等评价指标和拖延时间被LSMNR算法更适用于估算用户的主观感受,和这些指标的相关性较高;然而,通过细分视频类型,该算法建立了一个互相独立的感知模型细粒度用户长时间运行和短视频的看法和不同的流行视频,进一步扩展了知觉视频场景和改善知觉准确性。从图可以看出6的RMSE LSMNR算法0.28511,远小于0.41352,0.33093,和0.31514高,支持向量机和神经网络算法,分别。因此,证明了算法的评价误差和知觉准确性是最小和最大,分别。

我们的模拟比较不同影响参数之间的相关性和用户主观评价为不同类型的视频,如图7- - - - - -10。在这些数据中,横轴表示视频回放的成功率,视频播放延迟的平均数量,缓冲时间,和黑色的屏幕时间,分别,纵轴代表平均意见分(MOS)的用户。从数据可以看出78,MOS迅速增加的成功率增加视频回放和快速下降的平均次数的增加视频停滞。这是因为有一个高用户体验的质量之间的相关性和视频回放的成功率和回放的平均数量乘以选中。在这一点上,这些指标的变化可以影响用户的观看体验,这也进一步证明了合理性和有效性的这些评价参数的选择模型。从数据可以看出910,金属氧化物半导体随缓冲时间和黑色屏幕持续时间的增加,和振幅逐渐减小。这是因为用户敏感的缓冲和黑色屏幕。同时,实际用户观看视频的时候,他们更加注意屏幕缓冲区的次数或黑色和更少的关注持续时间,以便随时继续增加,长度和MOS下降的速度逐渐减慢。此外,从数据可以看出7- - - - - -10MOS曲线的流行视频很容易受到视频回放的成功率的影响,平均数量的视频播放延迟,和其他指标,而常见的金属氧化物半导体的波动曲线和不受欢迎的视频是相对较小。这是因为,当实际用户观看视频的时候,他们更加注重流行的视频与高度关注和更敏感的损伤程度的视频。然而,用户有一个低浓度为常见的和不受欢迎的视频,只能感知的视频与大型攻击但不能感知的视频小伤害。这也表明,用户有不同的感知评价标准不同类型的视频。本文算法在更广泛地适用于建立独立的感知模型通过精炼视频类型,和感知结果更理想。

7所示。结论

在这项研究中,一个用户体验感知算法基于多元非线性回归的长和短视频(LSMNR)提出。我们分析用户体验质量和多个评价指标之间的映射关系(视频停滞,黑色的屏幕、抖动、丢包率、等)在不同类型视频基于他们的持续时间和受欢迎程度。因此,多个评价指标是挖掘的数据特性,其次是样本的建立和测试数据库,结合用户的主观实验结果。随后,感知模型是非线性最小二乘法和SVM训练的方法来进一步研究多个评价指标之间的非线性关系和用户体验的质量的优化结果。我们的仿真结果表明,与高钙相比,支持向量机,LSMNR算法和神经网络算法,可以有效地提高知觉准确性和适用于大范围的视频。在未来的研究中,我们的目标是开发一个更精确的视频用户体验感知模型,提高边缘服务器的能力来分析和处理大量的视频数据特性,并为用户提供高精度和细粒度的观看体验。

数据可用性

的数据支持本研究的发现可以从相应的作者在合理的请求。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

这项工作是由北京科技项目(Z211100004421009)和中国国家自然科学基金(61971048)。