文摘
在特殊的运动镜头,有子帧。镜头是由多个帧。它将不清楚是否剪一个框架。视频截图的定义在于视频的质量。清晰的屏幕截图,我们需要找到清晰的视频。本文的目的是分析和评价运动视频图像的质量。通过语义分析和使用计算机语言程序设计的视频,视频图像与数据模型由研究、形成和运动视频图像的实时分析,从而达到运动的实时分析影响技术和战术。针对粗糙的图像分割的缺陷和高空间畸变率在当前体育视频图像评价方法,提出了一种运动视频图像评价方法基于BP神经网络的感知。结果表明,优化算法能够克服传统的权重算法的收敛速度慢和振荡误差变步长算法的收敛性。优化算法将大大减少神经网络的学习误差和网络质量的总体误差分类和大大提高评价的准确性。 Sanda motion video image quality evaluation method based on BP (back propagation) neural network perception has high spatial accuracy, good noise iteration performance, and low spatial distortion rate, so it can accurately evaluate Sanda motion video image quality.
1。介绍
网络评估问题,经常有许多定性因素点缀和融入复杂的评价问题,需要人们参与判断和决策的经验,知识和智慧(1]。在前面的决策评估过程,参与的人,这是不可避免的受到不良的影响等主观因素主观随意性,思维的不确定性,和认知的模糊性2]。为了更好地促进公共健康和促进学习和观看,也有各种各样的体育视频需要编辑、分割和集成。BP(反向传播)神经网络技术可以利用其现有的评估结果直接评估方案根据给定的新方案的特点,这不仅可以降低人类的不确定性和提高评价结果的准确性,而且大大减少了评价者的负担(3]。从网络的角度评估,神经网络可以获得人们的经验,知识和意见每个目标的重要性,通过学习现有的评价结果。数字电视技术的不断发展,视频图像质量评价变得越来越重要。本文的目的是分析和评价运动视频图像的质量,通过使用计算机语言的视频语义分析和程序设计,匹配的视频图像数据模型构造的研究,并形成体育视频图像的实时分析,从而达到运动的实时分析影响技术和战术。
传统的视频直接打过去没有网络传输,将丢失一些信息在视频压缩过程中,一定程度的失真。与视频没有网络传输相比,圣诞老人运动视频的质量将会损坏不仅在压缩还在传输过程中(4]。圣诞老人运动视频,传输网络的丢包,延迟,抖动,和其他问题将影响质量的圣诞老人运动视频,导致视频图像模糊,播放暂停,等等5]。图像分割和噪声检测的过程中,一些阈值参数需要优化改进的评价效果。由于参数之间的复杂非线性关系和评价效果,必须做大量的实验来找到最优参数,这不仅浪费了大量的时间,而且也没有理论基础(6]。大多数视频质量评估算法使用图像质量评价算法获得的质量分数每一帧图像,然后将所有帧的平均质量价值作为整个视频的质量值(7]。BP神经网络有能力接近任何非线性和多级映射通过学习(8]。当它应用于非线性系统的预测,它不能被限制的非线性模型。只有充分考虑到视频中对象的运动特征和判断物体的运动视频中我们可以更好地反映人民的真实感情看视频的时候。因此,基于基于结构相似度的图像质量评价算法,提出了一种基于运动估计的加权方法,扩展了图像质量评价算法,视频质量评价算法。
目前,大多数视频质量评估算法的平均图像质量所有帧的质量整体视频,但视频中的对象有视觉运动特征,并简单地将所有帧的平均质量不能准确反映这种特性(9]。视频图像质量评价需要细分目标对象的形象,确保编码目标对象的完整性。然而,传统的视频图像质量评价标准不能搜索视频内容,图像分割也有一定的困难。由于简单的计算,PSNR值是一个重要的方法来评估视频质量很长一段时间,但大量的事实证明,其评价结果与人民的真实感情不一致在许多情况下(10]。针对现有的BP神经网络算法,本文提出了一种优化方案基于可变步BP神经网络算法,它适用于圣诞老人运动视频图像的质量评价。在优化方案中,使用不同的策略来优化步长的上升和下降阶段。针对粗糙的图像分割的缺陷和高空间畸变率在当前体育视频图像评价方法,运动视频图像的基于BP神经网络的评价方法提出了看法。实验结果表明,该方法具有较高的空间精度、噪声迭代性能好,空间扭曲率低,可以准确地评估圣诞老人运动视频图像的质量。
2。相关工作
现有的文献部分改进的BP神经网络。文献[11提出了附加动量法和动态调整学习速率的方法。文献[12)提出了一个方法来解决这个问题,网络容易陷入局部最小值。文献[13]等提出的方法提高了传递函数,设计一个综合误差函数,并动态地调整不同的学习率层来提高网络的学习速度和抗干扰能力。文献[14)提出了一个SSIM算法基于结构相似性基于人类视觉系统的结构敏感性原则自然图像。在此基础上,原来的算法扩展到MSSIM通过重复的低通滤波和采样下来的图像,使其性能大大改善。文献[15使用小波进行图像分析,量化看得见的自然图像失真通过两个阈值和扩展到视频质量评价,并取得了良好的结果。文献[16)直接使用平面图像质量评价的方法在散打运动视频图像质量评价。因为这种方法没有考虑到独特的立体立体影像失真,失真类型和评价结果的准确性较低。文献[17)结合深度信息和平面图像质量评估评价散打运动视频图像质量。文献[18]散打运动视频图像质量评价分为两个部分:深度知觉评估和左右视点图像评估。文献[19)设计了一种颜色和深度立体视频质量评价方法通过提取的边缘信息深度图和相应的彩色地图信息。
由于其结构简单、稳定的工作状态,和简单的硬件实现中,BP网络已广泛应用于模式识别和分类、系统仿真、智能故障诊断、图像处理、拟合函数,最优预测。文献[20.)详细介绍了常用的无参考图像质量的客观评价方法。这些方法使用不同的拟合公式,但人眼的视觉特性非常复杂,和简单的拟合公式不能获得理想的结果。文献[21)使用GAP-RBF和BP网络对JPEG图像的质量进行评估。提取的特征参数包括边缘振幅,边缘长度、背景活动,和背景亮度和考虑人眼的视觉特性。文献[22)使用CBP网络实现JPEG图像的客观图像质量评价。提取的特征参数包括绝对值、协方差,对比,和熵的区别。文献[23)也使用CBP网络实现mpeg - 2压缩码流的质量评价。特征参数直接从压缩码流中提取,可实现实时图像质量监控。基于改进的BP神经网络算法,本文建立了散打运动视频图像质量评价模型,模型不断学习训练样本的固有模式。训练成功后,它可以通过不同的运动指标的输入和输出评估结果。
3所示。材料和方法
3.1。BP神经网络技术
人工神经元的主要结构单元信号输入,综合处理和输出,输出信号的强度反映了这个单位对相邻单元的影响。人工神经元相互连接形成一个网络,被称为人工神经网络。神经元之间的连接模式被称为连接模式,以及神经元之间的连接程度反映在人工神经网络的连接权重。改变了信息处理过程及其能力修改网络权重的过程。
BP(反向传播)网络是一种由误差反向传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型(24]。目前,仍然没有很好的理解的感性因素影响立体视觉在人类视觉特征,所以这是一个难点,研究各种知觉特征的影响在立体图像在散打运动视频的图像质量16]。
本研究6中的BP神经网络输入、输出1,和1个隐藏层。太多的隐藏层会导致训练速度慢,收敛效果差,更容易导致过度学习的问题,因此采用三层BP神经网络。实验表明,当隐藏节点的数量是9,培训的效果是最好的。逻辑结构图如图1。
在网络训练的过程中,所有的样品都带进网络培训。在培训过程中,隐藏层的权值不断调整通过转移函数。之后,这些样本带入网络训练一遍又一遍重复很多次这样的权重可以更接近期望值。在学习阶段的培训网络,N训练样本。首先,假设的输入和输出模式的一个样本p用于训练网络吗和 。的我th的隐层神经元的作用下样品p,输入如下: 在哪里输入节点的输入吗j当样品p应用,输入层神经元之间的连接权吗j和隐藏层神经元我,隐层神经元的阈值吗我,米是输入层。学习过程调整加权系数的方向,使得误差函数E下降最快的。神经元的权重系数增量公式在输出层和隐层当所有样本应用
后计算新的加权值,代入下一个样品。所有的样品替换后,重复以上样本以减少系统的均方误差,达到学习的目的。
3.2。圣诞老人运动视频质量特征提取
散打运动视频质量评价需要高实时性能,所以不应该处理视频数据视频播放后,但应该获得视频回放。特征参数的传输损伤,有必要存储每一帧视频图像的二维矩阵,矩阵的元素值是图像像素的亮度25]。当人们做出主观评价时,他们可以给视频图像的质量不使用原始的视频作为参考,甚至大多数视频图像从未见过的。这主要是因为人见过各种品质的视频。神经网络的监督学习的前提是有先验知识的视频质量,也就是说,需要主观评价视频质量的价值。摘要神经网络模型选择使用一个隐层,隐层采用乙状结肠转换函数,九个隐藏节点集,和输出层有一个节点,这是客观的评价结果。尽管输出层选择线性元素,隐藏层是非线性的,所以整个网络也是非线性的。神经网络训练过程中,80%的视频序列数据集作为训练样本,样本的训练序列是随机的。
特征参数作为系统的输入在机器学习和质量预测,所以在选择特征参数时,要求他们不仅反映了图像的失真,而且也有较高的一致性与主观评价价值(DMOS结构)。根据这一要求,五个特征参数选择,相位一致性(PC)、梯度相似性(GS)、亮度相似性(LS),对比相似(CS)和颜色相似(CLS)。采用相位一致性特性算法:
其中,E(x)是图像的局部能量,一个(x)是当地的图像的振幅。归一化相位一致性的电脑
其中,的相位一致性是参考图片,扭曲的图像的相位一致性,是一个常数。梯度图像的边缘信息,人眼对边缘更敏感的信息。首先down-sampled图像,然后使用Sobel算子来计算图像的梯度。图像的梯度信息振幅通用汽车可以被定义为
其中,和是计算水平和垂直方向的梯度值,分别。梯度相似性GS 在哪里是一幅参考图像的梯度信息,扭曲的图像的梯度幅值信息,然后呢是一个常数。亮度对比LS计算公式 在哪里参考图像块的平均值,扭曲的图像块的平均值,然后呢是一个常数。对比相似度的计算公式CS 在哪里是原始图像的方差,扭曲的图像的方差,是原始图像和失真图像的协方差,然后呢是一个常数。
人类对图像的认识主要是基于图像的底层特征。基于生理和心理的研究,发现图像特征被人类总是位于点相位一致性高。因此,相位一致性可以被视为一个简单而有效的方法来模拟图像特征的观察和感知由人类视觉系统,它是一个无量纲的方法来反映局部结构信息的重要性。对BP神经网络的训练集和输入功能,它能客观地评价输出视频质量训练后(16]。然后,BP神经网络的参数确定客观评价和主观评价之间的相似性。
3.3。散打运动基于BP神经网络的视频质量评价框架
是非常重要的选择当学习BP最初的重量。为了使误差尽可能小,需要合理地选择初始重量和抵消。当训练BP神经网络,以加快训练速度和保证结果的可靠性和稳定性,训练参数设置如下:培训时间是10000次,反向修正步长是0.05,培养目标是0.002。实验表明,该参数设置不仅可以保证精度,而且可以避免过拟合问题,和时间复杂度很低。当人们做出主观评价时,他们可以给视频图像的质量不使用原始图像作为参考,甚至大多数视频图像从未见过的。这主要是因为人见过各种品质的图像,这些图像有相似之处或者在某些特性。因此,对于客观图像质量评价没有参考,前提是图像质量的先验知识,以及先验知识的获取主要是一些图像的特性集的分类过程。散打运动视频质量评价体系的总体框架基于BP神经网络如图2。
在此系统中,首先,有必要设置人眼感兴趣的区域为每个选定的视频样本资料,然后提取感兴趣的区域的特征参数。同时,样品材料的主观评价结果也存储在数据库中。之后,BP网络是神经网络训练样本数据库,特征参数作为神经网络的输入,和相应的主观评价结果作为预期的输出。神经网络训练后,我们得到神经网络的重量。测试材料,相同的感兴趣的区域设置和过程进行特征提取得到特征参数。然后,特征参数作为神经网络的输入节点。根据训练神经网络权值,可获得客观评价结果输出节点的神经网络。
4所示。结果分析和讨论
评价标准仍按照VQEG(视频质量专家集团)检验标准客观质量评价。研究需要克服体重传统算法收敛速度缓慢的缺点和错误变步长算法的收敛振荡。四个性能指标被用来评估相应的模型,也就是说,PLCC(皮尔森相关系数线性),SROCC(斯皮尔曼相关系数),KROCC (Kendall订单相关系数),和RMSE(均方根误差)。高清图像的分辨率是1920×1080,数据量是5倍的标准清晰度的图像。此外,16:9显示使主观评估者无法通知所有全貌的位置,所以只有处理,人眼感兴趣的区域在一个图像。五个特征参数的有效性在散打运动中选择视频图像质量评价模型进行了测试,按顺序输入特征参数的数量减少,和模型训练了。结果如表所示1。
可以看出,减少输入特征参数,各项指标均呈下降趋势,这说明这五个特征参数都贡献在融合和有效的特征参数。同时,可以看出特征参数LC和RC贡献最多,这表明立体图像的质量是密切相关的畸变程度的左派和右派的观点。最后两组数据的索引是相似的,这主要是因为所选数据库是对称和扭曲,和左右视点图像的质量是相似的,所以结果是相似的。
图3散点图的客观评价和主观价值评估的价值散打运动视频图像质量评价模型。散射点越集中越好目标模型之间的一致性和主观感知。图中的曲线是非线性拟合的结果与五参数。
训练样本集的规模是非常重要的;太少的样本集学习毫无意义;太多的样本集训练速度影响,甚至导致无法收敛到预定的精度。如果块运动矢量预测的原始视频是完全不同于相应的块失真视频中,这意味着对象的框架是猛烈地移动。因此,框架的变形程度的感知非常小,并给出帧一个较小的重量。因为每个指数不同,每个向量的数量级在原样品是非常不同的,这可能使神经元处于饱和状态,从而失去学习能力。数据4和5分别显示了主观评价结果与客观评价结果的拟合图的训练样本和测试样本,分别和拟合程度达到98.45%和92.08%。
根据测试材料的测试结果,主观评价结果与客观评价结果之间的相关性为92.08%,取得了理想的结果。一些点在图5远离对角线,这主要是因为没有足够的材料在神经网络的训练样本数据库,因此有必要添加各种材料来提高训练样本数据库,以便得到更好的测试结果,使训练网络适合更多不同类型的测试材料。使用网络和其泛化能力训练,阈值参数优化改进的评估效果评价方法。经过训练的网络优化阈值参数和推广优化的数据根据大量的网络。网络培训/测试的SSE曲线如图6。
为了方便计算和防止一些神经元达到过饱和状态,是标准化的训练集和测试集,预测是标准化后的输出结果。为了使它更直观,antistandardization执行。BP神经网络优化后,图像分割拓扑大大优化,从而减少节点的数量。图像分割拓扑可靠性优化的仿真对比图所示7。
有小的灰度差异的区别不同的帧图像的背景,但不同的帧图像之间的灰度差异在前台必须大于背景。根据这个性质,灰度值可以被视为一个重要的属性在选择模糊属性。数据8和9显示了主观评价结果与客观评价结果的拟合图的训练样本和测试样本,分别拟合程度达到98.25%和92.07%。根据测试材料的测试结果,主观评价结果与客观评价结果之间的相关性是相似的,取得了理想的结果。
其中,停止迭代训练时,拟合程度达到98.25%,这表明,所选特征参数之间有很强的相关性和主观质量分数,同时,它避免了过度学习的训练。测试集的拟合程度是92.07%,这表明,这个模型的质量评价结果接近主观质量评分。在网络训练的过程中,误差范围应根据实际情况提前决定。误差阈值的选择是决定完全根据网络模型的收敛速度和学习特定样本的准确性。
5。结论
BP神经网络是一种有效的方法来研究非线性和不确定的问题。该模型克服了多元回归模型和灰色模型的缺点和不需要事先确定数学模型的数学表达形式,从而获得较高的拟合精度。本文主要介绍了散打运动视频图像质量的客观评价体系基于BP神经网络。在这个模型中,特性参数与主观评价相一致的值作为图像特征信息。首先,BP神经网络训练飞机数据库作为特征提取器提取图像特征参数,然后结合绝对差距图提取特征参数。然后,BP神经网络用于特征融合,建立一个模型来评估立体影像的质量。从网络的训练和测试结果,可以看出,该模型具有良好的拟合效果,预测精度也很理想,可为阈值参数的选择提供一定的参考。最后,网络的泛化能力是用来优化阈值参数,提高了评价的评价方法,节省了大量的测试时间。优化算法将大大减少神经网络的学习误差和网络质量的总体误差分类和大大提高评价的准确性。
散打运动视频图像质量评价模型基于BP网络可以推广和应用在很多方面。它的输入端可以各种运动指标,其输出端可以是一个综合评价的结果,它也可以在短时间内预测各种输入参数的变化。因为高清视频序列的样本数据库不是足够大,有必要不断添加更多的材料有不同的损伤类型,使网络更好的泛化能力。在下一步中,我们将考虑分别提取扭曲图像的特征参数,并建立一个未引用散打运动视频图像质量评价模型,进一步提高评价模型的性能。
数据可用性
使用的实验数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者声明,关于这项工作他们没有利益冲突。