文摘

近年来,人体运动的视觉分析已经成为计算机视觉领域的一个前沿方向。识别,识别和跟踪图像序列,以及理解和描述他们的行为。利用计算机视觉技术图像处理和模式识别领域的研究,以及从视频图像中提取和有效地识别人体运动功能,已成为一个热点话题的关注与信息技术的迅速发展和普及。本研究提出了一种方法,分析基于图像识别人体运动的特点,介绍了提取函数法,分析提取的特征函数来提高能力来分析人体运动的特点。为了实现精细分割,层次聚类算法用于段在每个动作周期运动。不同的基准数据库和自建数据被用于实验。实验表明,该算法可以达到良好的分类和识别结果,同时保持低计算复杂度和提取特征数据。它还可以有机整合人类行走的静态和动态特性。

1。介绍

人体运动的视觉分析是计算机视觉的新边疆,近年来已经受到了太多的关注。识别,识别和跟踪图像序列,以及理解和描述他们的行为。运动目标提取是一个低级的过程,属于图像处理的范畴。目标识别、跟踪1,2)、图像分析和理解是高层过程属于人工智能雨伞(3,4]。今天的研究侧重于使用计算机视觉技术来分析和研究问题领域的图像处理和模式识别,以及从视频图像中提取和识别人类的运动特性。视频可以具体和生动的表达中包含的信息和客观地描述事物作为信息载体的计算机视觉技术(5,6分析和处理。人与计算机之间的对话将更为直观和简洁如果计算机可以通过视频输入设备和捕捉人体运动识别甚至理解这些行为。有必要保持人体在整个交互过程中相机的视野来理解人的行为,然后分析人体的运动。

人体运动识别可以分为几个不同的水平,和分类标准是被广泛接受的:原始的行动,行动,和行为。周et al。7与增加长度,提出了滑动窗口的策略,结合不同样本之间的相似度的测量方法在高维空间中,实现实时的运动分割(7]。Das和Arpita8]估计头部姿势通过学习面对图像特征之间的映射函数和头部姿势空间使用不同的非线性回归(8]。彭et al。9)提出了一种局部梯度方向直方图描述符头减少脸部位置的偏差引起的人脸检测器(9]。在工作中,作者提出了使用基于偏最小二乘回归方法从一系列候选人选择最合适的一个人脸检测窗口来减少脸部区域的位置偏差。尽管许多研究人员正在尝试不同的方法来改善头部姿态估计的准确性,仍有许多挑战在头部姿态估计的研究,比如面部表情变化,部分面部遮挡,光线,和其他因素,影响头部姿态估计的性能。因此,如何在视频图像自动和强劲估计头部姿势是一个具有挑战性的任务。

有必要创建一个合适的角色模型准确地检测图像中的字符。是一个联合对象,大部分角色模型表示身体部位;然而,不同的模型使用不同级别的细节(10]。本研究开发一个移动的目标检测和跟踪系统基于图像识别,专注于移动目标图像识别。本研究的主要贡献如下:(1)运动分割算法深入研究。通过分析转折点的技术特点细分算法和聚类分割算法,一种新的自适应运动分割算法与未知运动序列分割算法。(2)在这项研究中,提出了一种改进的特征识别方法,它克服了传统方法的缺点,利用傅里叶描述符表示与大量数据轮廓特征。然后,人类的身份是被最近邻模糊分类器结合肢体关节角特性。

本研究分为五个章节的内容,如下:第一部分主要介绍选题的背景和研究的意义和目的。第二部分介绍了移动字符的特性分析的理论依据。第三部分主要介绍了运动分割算法和改进的特征识别方法,下面的讨论提供了实验依据。第四部分,本研究的方法是通过实验实现的。第五部分提出了本研究的结论与展望。

2.1。人类运动识别的研究现状

运动分割和运动识别是人类运动分析的两个主要方面。准备运动识别和检索,运动分割涉及确定过渡帧的运动捕获数据,并将双方的不同动作的运动数据。“运动识别”一词指的是标签和分类运动段的过程。这是一个重要的步骤在人机交互过程中。人类行为的电脑终于达到目标认识到行动。

李等人。11)提出了一个语义模型的运动,计算特征点的速度和加速度,量化成相应的字符,然后使用机器学习段运动序列(11]。运动分割也可以通过集群。邵et al。12)提出了一个K——扩展基于核函数的聚类算法,采用分层排列作为时域分割方法聚类分析,将时域分割的问题变成了一个能量最小化问题,并获得了细分点的帮助下动态规划算法(12]。高和Shardt13]提出的特征表示普通2 d图片的光流法(13]。你和金14)成功地提取人体的三维骨骼数据深度图像决定随机森林算法,大大减少了深度图像的空间冗余和为人类开启了一个新的研究空间运动识别(14]。陈等人。15)使用机器人力学的原则将每个关节的旋转和翻译点转换为李群表示的空间特性。拟确定的基本行动在人们的日常生活中实时根据骨骼的相对位置特征点(15]。

2.2。移动目标变化检测的研究现状

运动检测得到的运动区域可能包含不同的移动目标,根据不同的应用背景和图像分辨率,人们检测算法也不同。在图像领域的认知,有必要确定的运动人体的各个部分。在智能监控、图像分辨率不高,我们不需要太在意人们的具体细节但只需要判断它是人们追求的目标。

徐et al。16)提出,通过减少的相关性不同的形状参数,模型变形的变化与高斯模型在低维空间可以代表全球变形,但是,它仍然是不足的地方变形(16]。徐和丁17)建立了一个钟摆模型与大腿和小腿链接,把钟摆和垂直方向之间的角度信号随着行走运动特性,然后分类识别个人身份(17]。Sl et al。18]区域分散,使用面积、长宽比、等特点,将移动目标分成人,人群,汽车,使用三层神经网络方法和背景的树干(18]。冯et al。19]利用色散和区域信息分类二维移动领域,主要是区分人,汽车,和混沌扰动,分类更准确的时间一致性约束(19]。通过跟踪移动目标的兴趣,Xw et al。20.)计算目标的自相关特性随着时间的推移,和自相关的目标是周期性的,因为人们的周期性运动。因此,将时域到频域的方法用于分析目标是否有周期运动特征和确定目标是人类20.]。郭和Na (21)提出了一种分层分类方法使用时间同现矩阵,可以用来区分不仅对象,而且行为(21]。陆et al。22]提出的方法结合颜色直方图模型和灰色梯度模型的目标实现实时跟踪的人头22]。Binsaeedan和Alramlawi23)提出了一种特征分析方法基于图像识别的人,提出提取运动目标的轮廓,背景减法和建立轮廓模型的特征向量使用边界矩不变量和形态学特征的轮廓23]。

3所示。研究方法

3.1。移动目标模型的建立

运动特征识别涉及广泛在今天的科学研究领域,主要涉及一系列的研究领域,如图像处理、多传感器技术、虚拟现实、模式识别、计算机视觉和图形,计算机辅助设计、可视化技术、智能机器人系统,等等。实时和有效的移动目标检测和特征提取为以后目标识别是非常重要的。在这项研究中,一个移动人类特性的分析方法提出了基于图像识别。介绍了提取函数法,提取的特征函数进行了分析。层次聚类算法用于段每个运动的周期运动来实现分割。实验是进行不同的基准数据库和自建数据。

移动目标检测的目的是看看序列图像中的任何物体移动相对于整个场景。移动目标检测是后续处理的基础,如移动目标识别、跟踪、了解,描述运动目标运动,等等,它有一个对后续处理产生重大影响。在这项研究中,目标识别分为两类:人类和非人类。因为移动目标不可避免地锢囚在一个室内环境和上面的肩膀,人体不易堵塞、有相对稳定的形状,本研究使用人类头部和肩膀的形状作为一个二维识别模型。

建立头部和肩膀模型的步骤如下:

计算移动目标的宽高比。

如果是(0.28和0.36)之间,这意味着整个人体可能进入相机的捕获范围。

计算移动目标的垂直投影直方图,如图1,找到当地的最大值点 附近的头顶。

寻找全球最大值点 垂直投影直方图,计算近似的高度 从全球最大的人体和人体的长宽比直立状态。

我们使用的高级能量分布图像的统计信息来描述二进制图像。我们使用 代表规范化二进制图像。我们分 块,每个块的大小 ,在哪里 , 块能量图 通过计算公式如下:

在这项研究中,我们根据经验选择径向基函数。我们模型的回归机映射关系按照下列公式。 在哪里 是重量和 是偏差项。函数是解决优化过程如下: 在哪里 代表不敏感损失函数的参数,的价值 影响支持向量的个数。测量的偏差程度的训练样本 麻木不仁的乐队,我们引入了一个非负松弛变量 正则化参数,主要用于控制样本的惩罚超过误差。

3.2。人类的运动分割

准备运动识别和检索,运动分割需要确定过渡帧的运动捕获数据,划分双方的不同动作的运动数据,然后将整个运动序列划分为几个部分。分析运动序列的第一步是段。转折点检测和集群是两种最常用的方法。基于先前的研究发现,本研究的自适应分割算法。图2显示了特定的程序。建立了相似矩阵使用最大均方差分算法计算初始分割中的每一段的相似性。相似矩阵的主成分被提取使用PCA(主成分分析)算法来估计运动类型包含在运动序列的数量。周期运动检测是第三步。每一个运动的周期性submotion分割,分割结果进一步优化使用迭代运动序列分割结合层次聚类算法。

初始分割算法分割是一个重要的步骤,它展示的重要基础确定下一步的运动类别数量。为了实现这个功能,我们使用概率主成分分析算法来检测运动序列的转折点。首先,我们把前面的 框架作为一个高斯分布和使用Mahalanobis距离来计算段的分布之间的相似性 框架 框架和高斯分布。

下面的方程表达式的距离。马尔可夫距离通常是用来测量类之间的区别。 在哪里 代表的平均值 框架, 代表了协方差矩阵, 代表的相邻序列长度 , 代表希尔伯特控制换位。

在最初的细分之后,最初的运动序列将被分为几个部分。在这项研究中,最大平均差算法将用于描述段之间的相似性,和将进行主成分分析PCA估计相应的运动类别的数量。

特征向量所代表的任何部分都可以相应的相似性矩阵。找到对应的特征向量,我们使用公式(6)在相似矩阵进行奇异值分解 当每个矩阵的列向量投影到特征空间组成的 特征向量的相似矩阵,有一定的映射误差,表达式如下:

信息保持率的公式如下:

在主成分分析的价值 是由最小化的相应价值 成立。

有时,人们会迅速跑过去的相机,这样会有虚拟的影子一定帧的图像,这将极大地影响检测结果。为了避免这一现象,一些相机快门的曝光速度将会增加。因此,在相同的光圈下,入射光的数量将减少,整体形象将黑暗。因此,移动人物低灰色地带可能错过了,导致检测错误。

为了解决这个问题,本研究提出的概念提取功能。让框架包含移动字符是被探测到 ,和灰色的背景图像 ,在哪里 代表像素点的坐标, , 然后,提取函数定义如下:

二进制输出函数 基于提取的功能 定义如下:

如果 ,这意味着当前像素 属于一个移动的人。如果 ,这意味着当前像素 属于背景区域。

自适应匹配窗口的设计实际上拦截原始图像的一部分,其中包含所有的跟踪移动目标的特性。因此,特征提取和特征匹配只有在图像上执行匹配的串行端口,而不是对整个视场图像,这不仅减少了需要处理的数据量也减少自适应窗口之外的其他干扰因素。

匹配窗口的大小是最重要的因素影响匹配的移动物体的速度和准确性。它分为两种类型:固定大小的匹配窗口和自适应匹配窗口大小的变化随着移动目标。移动目标的速度影响预测精度的目标的移动目标在运动过程中,本研究提出了一种自适应匹配窗口,随移动目标的移动速度,确保计算量尽可能小的同时,仍满足精度和提高系统的抗干扰能力。

让移动目标图像的大小 和自适应匹配窗口的大小 他们有以下关系: 在哪里 是一个函数的速度在水平方向移动的目标,然后呢

同样,为垂直方向,

3.3。运动目标识别

运动识别技术也可以用于视频检索,大大减少了人们的工作量。运动识别技术已广泛应用领域的辅助医疗服务。检测和识别病人的运动可以帮助确定损伤的严重程度。此外,计算之间的区别和标准动作可以为病人的康复是一个重要的基础。人类运动识别研究在中国目前处于探索性阶段,和它巨大的商业和社会潜在价值尚未实现。

分类决策是分类器系统的关键环节和最后的链接模式识别系统,分类决策是机器,最终实现它。使用分类器之间的相似性计算测试样本和训练样本按照一定的决策规则和分类模式进行测试为某一类被称为分类决策。这项研究花了大量的时间研究如何提取有用的人体运动功能。我们选择成熟的模板匹配分类器设计、广泛的应用范围,简单的实验操作减少识别过程的复杂性,提高识别速度。

本研究采用机器学习的方法基于HMM(隐马尔可夫模型)的运动识别。运动识别分为两个阶段:训练阶段和测试识别阶段。在训练阶段,对应于每个运动训练HMM模型。在识别阶段,运动序列的概率识别属于每个模型计算,运动最大概率对应的识别结果。的具体内容特性表示基于全球信息如图3

首先,与根节点建立坐标系原点,和每个关节的特征点在整个运动段表示为欧拉角的坐标系统。第二,夹角区间[0,180]之间的连接点和坐标轴分为七个子区间。然后,每个关节的欧拉角点被映射到相应的小区间,和子区间的概率计算对应的高斯分布。第三,根据独立的原则,产品每个接合点的高斯概率权重每个坐标轴方向是作为一个功能组件框架的连接点的位置。

这个分类器不需要统一的计量标准和功能类型的每个输入功能并行组合特征向量输入时,它也可以处理单个功能。结果,两种不同类型的提取运动特征融合在这个话题,然后使用这个分类器实现简单和有效的身份识别人类的运动特性。最近邻模糊分类器的目的是将多个分类器分类直接和简单的方式。必须满足下列条件的模糊分布特征提取的影响最小化错误识别结果:当的价值特性差异很小,曲线逐渐减少,当特征的值差别很大,曲线迅速下降。下行山脊分布的方法可以用于计算相似性的特点相同的维度。这个模糊分布函数的公式如下: 在哪里 代表特征差异的大小。

不同特性的测试样本的隶属度相对于模板库中的每个训练样本得到使用上面的公式,然后是隶属度矩阵 功能相同的维度之间进一步由模糊分布函数。

当分类和识别,不同特征的隶属度属于每个类别应该乘以重量。然后,将它们添加到会员与加权系数矩阵,从而使识别结果更加准确,充分反映了不同的贡献不同的特性来识别的效果。

结合模糊功能分解方法,进行多尺度分解和信息融合的移动字符足迹图像,像素值 移动字符的足迹特征分布如下:

其中, 多尺度变换的模糊度函数, 是功能分解的小波高频系数和低频系数的一个移动的图像。

本研究采用的编码矢量量化的原则,即。,造成数据帧映射到最近的码字。这里的码字是类获得的聚类中心,每个码字字符码书的形式存在。

在这里, 表示对应的代码子的重量 ,和数据帧将由对应的字符代码。

计算可能的概率 的观察序列类似于每个动作的HMM模型, 的数量模型,即。,the number of types of movements.

通过以下公式的计算, 获得的概率是最高的,然后 是人类运动的HMM模型最接近运动。

4所示。结果分析和讨论

在这项研究中,我们使用常用梅测量头部姿态估计算法的性能。我们列出了不同的头部姿态估计方法的估计性能数据表的数据集1

下表1,文学的美16在偏航方向是6.55和6.68节距方向是,然而,在这项研究中提出的方法相比都较低的美。它可以发现,这种方法的性能类似于它的估计偏航方向,然而,距方向的估计的性能更好,我们的方法优于其他方法。

准确地评估造成估计的性能,许多发表的头部姿态估计方法主要使用标志着姿势估计脸图像和人脸定位不学习的影响抵消头部姿态估计。图4显示了这个实验的平均梅斯。

与文献[16],他们报道美是10偏航方向的偏移量15%,而我们的方法获得较低的8.6美在相同的偏移量。通过分析,脸部位置的方法和块能量图在本章提出的描述更健壮的脸位置偏移。

为了测试这个运动分割算法的鲁棒性,我们对合成数据进行了一系列的实验。我们添加了不同程度的噪音在合成的合成数据和实验数据与噪音。噪音水平的表达:0.1意味着一帧的噪声数据插入到每10帧的数据。每个测试数据序列是随机合成。因此,每个测试序列可以分为几类,如图5

运动分割算法在这个研究可以准确估计的数量类别中包含的测试序列,分割精度高,噪音低。运动分割算法的分割精度在这项研究中衰减缓慢,保持在一个合理的水平随着噪声水平的增加。文学的分割精度(13]和文献[21)低于本研究的算法。该算法可以估计运动类别的运动序列的数量不知道运动类别的测试序列的数量。这个算法,另一方面,可以在每个运动检测周期运动。作为行动的周期性运动包含所有的信息,行动的信息可通过分析获取的周期性运动,大大减少信息冗余。

下表2与文献[相比,13)、文学(21具有更高的分类精度,证明了该方法的可行性。在这个实验中,平均周期分割精度是0.81。作为周期分割是一个很好的分割基于前面的分割结果,这是极大地受到它的影响。

主要原因是视频数据流大大地受到光照的影响,分割的准确性有很大的影响。移动物体的移动方向的变化相对于相机,它将影响运动分割。也就是说,同样的动作可能被视为不同的运动,因为不同的运动方向相对于相机。

在实验中,过渡区间,我们认为一个新的类别不包括在计算分割精度。在这个数据库中,单一的运动对象的单位时间一般从165帧持续到330帧。因为减少帧在这种方法中,我们设置 在实验中。我们做了实验在不同 并分析了实验结果,如图6

的增加 ,算法的时间部分相同的测试序列逐渐增加。当 ,该算法在最短的时间内运行。时间分割的准确性明显偏低,因为运动序列很长,计算是基于手动分割,这不可避免地会导致错误的数据。

周期运动分割只是运动分割的延伸。在实验中,最后分割周期运动包含20至40帧,这已经可以反映运动的固有属性。

7显示了提取的曲线函数 在两种情况下的

可以看出,当灰度值变化很小,可以检测到这种变化在低灰度区域,虽然它可能会被忽略在中间和高灰度区域。这表明提取函数可以自适应地调整图像的灵敏度差异根据像素的灰度,不能通过一个简单的帧差算法。

我们应用三个分类器特征形成三个步态识别算法。然后,我们比较这三种方法与其他最新相关算法,如图8

数据分析表明,该算法在文献[16只承认一个运动特性,获得的识别率并不理想。可以有效地提高了识别率结合多个特性识别。实验表明,该算法可以达到良好的分类和识别结果,同时保持低计算复杂度和提取特征数据。它还可以有机整合人类行走的静态和动态特性。算法在这项研究中赋予合适的权重两种不同特征进行融合分类之前,这大大提高了识别率。实验表明,该算法可以实现更好的分类和识别结果通过确保计算复杂度低和提取特征数据,以及有机整合独特的人类行走的静态和动态特性。

5。结论

本研究提出了一种图像实现工艺特性分析方法对视频图像移动的人。运动序列分为几段在这项研究。最大平均差算法是用来测量段相似,相似矩阵描述段是分解使用主成分分析算法在确定数量的运动类别包括在运动序列。最后,实现精细分割,层次聚类算法用于段每个运动的周期运动。从前面的步骤融合权重后进入会员矩阵,决策原则是确定条件最大的成员,和结果。实验表明,对运动序列数目不详的运动类别,在这项研究中提出的运动分割算法具有良好的分割效果和鲁棒性。

虽然可以通过三维人体模型转换,大量的信息丢失在这个过程中,导致严重的局部变形的模型。提高模型的质量在未来,我们需要找到插件,更好的满足模型格式的要求。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项研究是由浙江大学虚拟仿真建设项目(篮球裁判模拟训练)。