文摘
在这篇文章中,排舞的基于机器视觉的运动目标检测技术研究提高目标检测。为此,改进的帧差的背景建模技术结合目标检测算法。移动目标提取,postmorphological处理是进行目标检测更准确。在此基础上,确定跟踪目标的时间轴移动目标跟踪阶段,目标在每一帧的位置,和最相似的目标是发现在视频序列的每一帧。建立了关联关系来确定一个移动对象模板或特性。通过一定的测量标准,均值漂移算法用于搜索最优候选目标在图像帧并进行相应的匹配实现移动对象的跟踪。该方法可以检测出移动目标的排舞在各领域通过实验分析,将不受影响的位置或距离,,总是有一个更准确的检测效果。
1。介绍
人类行为识别的发展可以概括为运动,行动,和活动。到目前为止,人类行为在行为识别的研究阶段,也就是说,从训练数据中提取一些特征,使用监督或无监督训练分类模型,提取特征的新数据,并将它们发送给模型得到的分类结果。人类行为识别开发了从人类行为识别视频图像中人体动作识别(1使用输入数据)。视频动作识别过程和分析原始图像或图像序列数据收集的传感器和学习和理解人类行为和行为。一般来说,基于运动检测和特征提取,通过分析人类的运动模式。视频内容之间的映射关系建立和操作类型描述,以便计算机能够理解的视频(2,3]。
近年来,视频动作识别,动作视频的主要类型包括日常人类活动如散步,跑步,挥舞着,鼓掌;体育行为,如潜水,滑冰,骑;和生活行为如洗切蔬菜和蔬菜。在众多研究人类行为识别,一些大学和研究机构的舞蹈动作。舞蹈是一种情感表达的方式向公众通过身体动作,更复杂的表达式和有各种各样的运动。有很多自己的特色舞蹈动作(4- - - - - -6]。因此,研究舞蹈动作仍在舞台的舞蹈动作分析。在大多数情况下,它是通过收集到的舞蹈动作的姿势分析,然后应用到动画角色的性能通过使用动画处理软件。各大高校和企业不断研究人类行为识别由于动作识别技术应用在许多领域。人类行为识别可以帮助公众生活更丰富多彩和促进人类的生产和能源显著(7]。
由于非物质文化遗产的消失(因为缺乏继承者),人类行为的关键信息可以通过动作识别技术来保存保护非物质文化遗产相关的行动。例如,舞蹈动作有民族特色在中国的许多领域。舞蹈动作的关键信息是通过动作识别技术获取和保存,这样可以减少中断的可能性的舞蹈继承(8]。对于舞蹈动作识别,锅等人使用零交叉的角速度运动实现视频序列分割(9]。郑等人开发了一个更复杂的技术和使用线性动态系统输出代表低段(原语)10]。高表明运动分割中隐含状态机或运动图表示(11]。然而,低级分割不能代表一个完整的动作序列。Talaat提出三种方法长段序列转化为行动子序列(12自动)。前两个方法在实践中应用视频中,这意味着该算法遍历所有帧从开始到结束,分割断点出现时创建的。第一个算法分配减少当地的内在维度模型时突然增加。第二个算法分配削减的姿势观察分布发生了变化。第三个算法是一个批量分割的过程,使用聚类方法形成一个简单的行动集群高斯混合模型的连续帧序列属于不同的元素。Moemen等人提出使用的时间结构建模的重要构成组(13]。相比之下,第三作者提出的方法(14)更灵活(速度变化,允许差距相邻的姿势更健壮的)。预计时间结构将学到的自动设计,而不是手动(14]。
机器视觉是一个新兴和快速发展的学科。这是一个广泛的领域,包括数字信号处理、图形和图像处理、人机交互、模式识别、数理统计、计算机科学等领域(15]。它已成为一个不可抗拒的趋势用机器视觉代替传统雷达、红外等手段获取外部信息通过图像和视频技术(16]。对象跟踪技术是机器视觉的一个重要研究方向,它在现实生活中具有较大的实用价值。运动目标跟踪技术主要用于处理视频的连续图像,其中包含关于移动对象的更多信息。通过分析场景的空间位置变化信息动态序列图像之间在时间轴上,移动的目标从背景中提取出来,然后被跟踪目标位置。目标行为可以进一步分析和理解计算目标运动信息,如质心位置、运动模式,和轨迹路线,实现更高层次的任务。运动目标检测和跟踪研究与现实生活密切相关,为人们的生活带来巨大便利。利用计算机代替人的眼睛和大脑,人没有操作电脑整天工作很容易和节省公司的人力和物力资源。这在智能交通技术具有较高的实用价值,重要单位、人口密集的公共场所,戒备森严的银行要求,监控和检测的博物馆、医学、军事、和其他方面。的持续改进科学技术和计算机技术的不断发展,视频图像采集和存储成本显著降低,处理速度是不断改善。这些平台支持视频跟踪技术的发展。 Video tracking technology is in line with the future trend of automation, information, and intelligence. On the other hand, the tracking technology based on machine vision can solve the complex work of processing many video information for a long time, saving workforce and material resources, and bringing convenience to people. Moving object tracking technology is closely related to people's lives, bringing comfort to people's lives. Moreover, target tracking technology is widely used in military science and technology, a broad field related to science and technology and people's livelihood [17]。随着科学技术的进步,为这一领域的研究将会更加成熟和完善。基于机器视觉,研究排舞和法官的移动物体检测该方法的检测和跟踪精度和效果。
本文的其余部分组织如下。节2,我们将讨论我们提出使用机器视觉的排舞运动物体检测。节3,我们全面评估拟议的工作。最后,本文的结论和未来的研究方向提供了部分4。
2。移动物体检测方法基于机器视觉的排舞
移动物体检测基于机器视觉的排舞有两个组成部分:背景减法的方法和自适应跟踪移动目标。首先我们讨论背景减法的方法在排舞运动反对检测部分2.1其次是自适应跟踪移动目标基于均值漂移的部分2.2。
2.1。背景减法在排舞运动目标检测方法
理解移动物体检测的基本方法后,分析了适用的场景和每个方法的优点和缺点,本文决定使用移动物体检测方法基于背景减法。深入研究了背景建模的各种方法,各种算法的优缺点进行了比较。考虑到系统的实时性和准确性,采用改进的帧差的背景建模方法。
2.1.1。改进的帧差背景建模方法
本文基于传统帧差的背景建模,提出了一种新的初始化方法,通过实验证明了模型的可行性。改进的帧差背景建模的步骤如下:
得到初始图像。这一步涉及以下方法获得最初的形象。
选择平均法。选择平均法的原理提出了基于原来的平均法。两个相邻图像选择。变量像素值的区域是移动目标地区和地区稳定的像素值是背景区域。传统的相邻帧差分法是用来区分背景区域和前台区域通过阈值的选择。移动物体的像素设置为0,和背景的像素保持不变。
阈值的选择通过实验可以选择。一般来说,背景像素的变化很小,但它不是完全不变。阈值可以根据实际情况通过实验。为了得到一个完整的背景图像,我们可以选择N帧视频和使用邻帧差分法比较两个图像前后连续背景的序列。选择平均法的过程如下:(1)背景帧差分法获得的序列。目标区域设置为0,和背景区域保持不变。 (2)数量 次的像素 在背景图像序列不为零。(3)背景的总和的平均值序列图像如下: (4)让迭代参数 。(5)帧差分法:
阈值的选择 : 手动确定,可以通过实际经验获得的。和是 - - - - - -th和 - - - - - -届图像,分别的区别是形象。
背景更新。后获得的初始背景图像是通过选择平均值的方法,背景区域和当前图像的运动目标区域根据帧差分法是有区别的。背景的一部分移动目标区域不需要更新,和之前的背景区域图像保持不变。通过添加权重更新背景区域的背景前一帧和当前帧的图像。 (1) ,返回到步骤(3),执行迭代操作。
选择平均法分段移动物体,然后平均背景区域,从而减少背景上的移动物体的影响,和提取的背景效果更准确。前几个视频序列是必要的。
获得的初始背景图像时,应选择适当数量的帧建模。如果选定的帧的数量太小,洞将出现在结果的平均法(18]。如果选择太多的框架,它不仅浪费资源,还会增加计算的负担。此外,如果时间太长,照明和环境变化等因素会影响结果的准确性。一般来说,它可以选择根据物体的速度和规模的目标,以便所有区域的视频图像可以显示背景(19]。
2.1.2。运动目标识别
移动物体识别的原则是,改进的帧差得到的背景图像的背景建模方法结合背景差分法获取移动物体,实现运动目标的检测。处理移动目标的二进制图像形态学操作来删除小目标无关的活动目标,填补目标中的漏洞,并连接破碎的部分目标阈值分割后的图像更加完整。移动目标识别的主要步骤如下:(1)改进的帧差背景建模方法获得背景图像 。(2)背景差异:当前帧图像之间的差异执行操作 和背景图像 。 (3)图像二值化:实验获得适当的阈值 ,设置“1”“如果大于阈值,并设置“0”“如果是小于阈值。 (4)二进制图像,去掉无关的像素形态操作,使目标更完整。移动目标识别的流程图如图1。
2.2。自适应跟踪基于均值漂移的移动目标
获取运动物体的图像后,为了实现运动目标检测和跟踪的排舞,均值漂移算法用来进行后续研究。近年来,均值漂移算法广泛应用于目标跟踪。一些学者使用Bhattacharyya系数之间的相似性度量目标模型和候选目标,并使用均值漂移算法搜索最优候选目标,来获得良好的跟踪效果。目标跟踪基于均值漂移是一个基于模板的跟踪方法(20.]。
2.2.1。意思是转变的基本原则
在机器视觉领域中,数据通常是在多维空间进行分析。估计的非参数密度多维采样数据集,它需要知道内核函数用于多维空间,即多元内核函数。
在 - - - - - -维空间,点 , 给出了; , 和一个正定带宽矩阵 ,内核的多变量核密度估计是
一般来说,带宽矩阵有两种形式:一种是对角矩阵,即 ;另一种是成比例的单位矩阵,即 。在这种情况下,(7)可以写成:
如果是中心对称的, 和定义的时间间隔 ;然后叫做轮廓函数的和是归一化常数系数。
引入轮廓函数后,核密度估计可以改写如下:
这个表达式中常用的均值漂移算法计算特征值的概率密度。如果想知道密度最高的位置数据的数据集,它可以评估标准的密度梯度。让 ,和计算误差协方差梯度。简化后,它可以得到均值漂移向量 。
2.2.2。实际应用的意思是移动目标跟踪的转变
在本节中,我们讨论的实际应用意味着移动目标跟踪的转变。我们主要关注本节目标模型的描述。
因为目标图像的直方图记录颜色出现的概率,不受形状变化的影响的目标,意味着转变选择颜色直方图作为目标的特征描述。假设目标区域的中心和目标在图像的像素位置的表示 。如果目标模型的直方图值,归一化的颜色分布可以表示为 在函数 图像的像素在哪里色指数,δ函数,是归一化系数。
根据上面的帧差分法,背景区域和当前图像的运动目标区域是有区别的,这附近的像素的中心目标模型比其他像素更可靠。因此,不同的权重可以给目标的像素在不同位置,附近的像素中心有一个大的重量,和像素远离中心有一个小的重量。通过引入内核密度函数估计到目标,目标模型的概率密度估计可以表示为 在哪里是内核的轮廓功能函数, 在功能上用于消除目标的不同大小的影响。使用的条件 ,它可以得到以下结果:
在后续帧,该地区可能包含移动目标称为候选地区和中心坐标 ,这也是内核函数的中心坐标。代表不同的像素在该地区 。候选人的描述区域称为目标候选模型。特征值的概率密度 候选模型如下: 在哪里 是归一化常数系数。
相似函数描述之间的相似程度,目标模型和候选目标,和两个模型的概率分布在理想情况下是完全相同的。均值漂移算法,Bhattacharyya系数选择的相似的功能。Bhattacharyya系数定义如下:
P是在0和1之间的值。更大的价值这两个模型,越相似。在当前帧中,候选模型计算通过计算不同的候选区域,所以该候选人地区最大的在当前帧目标的位置。
2.2.3。实现运动目标检测和跟踪的过程
最可能位置的当前帧中目标的候选区域最大值。为了最大化 ,这个职位目标中心的当前帧的前一帧的起始位置,并找到最佳匹配位置,其中心y。首先,模型的目标候选人计算和泰勒展开式的(15)执行 。Bhattacharyya系数可近似表示为 在哪里
它可以看到从(16只有第二项更改的) ,这
最大化 相当于最大化 。
通过分析(17),它可以看到,这个表达式类似于核密度估计函数,但也有更多的重量 ,它可以使通过改变迭代取最大值。具体步骤如下:(1)假设目标模型的分布和目标的位置估计 。(2)初始化当前帧的目标位置 ,计算的分布 ,和估计Bhattacharyya系数: 。(3)计算重量根据(17)。(4)计算目标的新职位根据均值漂移矢量: 。(5)更新和评估 。(6)当 , 。(7)如果 ,结束;否则 ,步骤1。
目标跟踪的过程是通过梯度下降法获得最大的Bhattacharyya系数均值漂移向量的搜索,以找到最佳匹配的目标在下一帧的位置。
3所示。实验结果和讨论
在某城市舞蹈团为研究对象,邀请10舞蹈团的舞蹈表演者配合实验。他们被要求进行舞蹈表演和舞蹈动作的使用摄像机采集图像。
背景效应通过该方法获得的价格相比传统的帧间差未被利用的背景建模。结果如图所示2。
(一)
(b)
图2(一个)是传统的背景帧差背景建模方法,和图吗2 (b)是改进的帧差的图像背景建模。可以看出,传统方法的初始图像包含目标信息,和运动物体的影子是显而易见的对背景建模时,建模是不准确的。改进的建模方法可以减少运动信息的影响,和背景效果理想。
选择一个简单的舞台背景;舞者被邀请做不同的舞蹈动作和需要在正常的位置,屏幕的边缘,位置靠近相机,分别以验证的效果的排舞运动目标检测和跟踪的方法。测试结果如图3。
(一)
(b)
(c)
从图可以看出3排舞的目标移动时,该方法可以预测目标的质心位置和搜索和匹配的目标在一个窗口附近预测下一帧。从图可以看出3(一个)本文的方法可以准确定位排舞的对象。从图可以看出3 (b)目标对象时,相机的视场边缘,目标对象的一部分仍然可以找到。从图可以看出3 (c),当移动物体接近相机和大小变化,检测和跟踪窗口也将改变。
在复杂背景的影响下,排舞的移动目标检测结果选择复杂的舞台背景,明亮的颜色。摄像头是固定的,该方法用于探测和跟踪每个舞者的排舞运动。结果如图所示4。
(一)
(b)
(c)
从图可以看出3该方法可以检测出运动物体的排舞在复杂背景和获得更准确的检测和跟踪结果。
实验结果表明,在困难的情况下,移动物体的检测和跟踪改进排舞。实验结果如图所示5。
(一)
(b)
(c)
从图可以看出5部分堵塞,当检测到对象,即使只有少数部分并不闭塞,移动物体检测排舞仍然可以实现。检测对象完全阻挡时,检测和跟踪框架将会减少到一个小点。一旦暴露,待检测目标的优势将会立即发现,这表明,该方法的检测效率高。
摘要RGB识别方法的识别率,流识别方法,以及该方法用于比较的不同部分的上半身,下半身,整个身体。从不同的方法得到的识别率,可以看出识别率的上半身或下半身相对较近,但识别率较低的身体略高。结合人体的识别率是最高的区域。人体的直接识别的识别率地区低于人体区域的结合。原因是上半身或下半身运动关系密切,和身体动作更低。全身的应用地区的人类,当运动只是上半身地区或下半身地区,这两个地区将影响对方,和舞蹈动作命名通常使用的上半身和下半身行动命名,分别单独训练可以提高识别的准确性。不同特性的识别效果从人类的不同区域中提取表所示1。
4所示。结论
本文主要研究了移动物体检测方法基于机器视觉的排舞。我们使用两种方法来实现这一目标。一种改进的帧差背景建模是用来实现移动物体检测、和均值漂移方法用于实现运动目标跟踪。我们把现实中的编排为例对我们的实验结果来验证我们的方法和证明我们的方法可以检测出运动物体在任何区域的镜头,而不是接受闭塞或距离相机的限制。可以看出,移动对象的方法可以获得良好的检测结果的排舞19,20.]。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
本研究项目支持的思想政治研究湖南大学课程:思想政治教学的研究和实践课程的“跳舞”,这项研究的结果湖南省教育科学规划项目:研究优化高校体育的影响下疫情(XJK20CGD012)。