文摘
运动构成样本的估计时间和估计精度是对体育运动的姿态估计算法问题。本文提出一种multifeature fusion-based姿态估计算法准确。人类的杆模型在分析人体姿态估计技术。使用卡尔曼滤波器的方法,运动的自由度和范围的确定人体的主要关节。八星模型被用来提取运动姿态的特性,和加权平均法来处理灰度图像的运动。使用multifeature融合方法,提取的源特征向量信息彻底分析和处理,并创建一个新群融合特征向量。使用混合高斯分布模型中,一个运动员的身体的姿态估计是完成。实验结果表明,当体育构成样本数据的数量是900 GB,该方法的准确估计时间是5.3,和它的准确性为100%。提高样本的估计精度的运动姿态。
1。介绍
随着社会的进步和生活水平的提高,人们开始更加注重身体健康和其他方面,通过体育不断提高他们的身体素质。在运动的过程中,标准的运动姿势不仅能确定运动的影响在一定程度上也提供最大可能的保护损伤(1]。在羽毛球,例如,使用标准的羽毛球运动日常锻炼不仅能有效地锻炼身体,而且可以提高球员的竞争水平(2]。然而,标准的定义运动姿态运动期间主要是基于图像或口头指示,导致缺乏定量评价标准标准马达的姿势。然而,人类造成的估计和识别人类的运动从收集到的图像或视频序列为衡量标准的运动姿势提供了理论基础。早期人类动作识别需要外部设备感知人体姿态的变化来识别人类行为。随着机器学习的发展和深度学习,在学术领域有很多研究方向,包括图像处理、SVM分类器,和深层神经网络(3]。这些进步都使计算机检测人体运动只使用设备,如摄像头,从而大大减少外部感知器的数量。
人体姿态估计是最关键的技术在运动的过程中造成的认可。为了引导人们的姿势在运动过程中,一系列的特性来源于人类的姿势估计与一些标准的行为。因此,人类运动评估体系发展显著。同时,人们的焦点逐渐从专业类型转向轻便型:便携式人体运动不受位置和环境影响评估系统可以提高人们的日常锻炼的质量。人体姿势识别获得的利益大量的国内外研究机构和大学实验室(4)由于其较高的理论价值和广阔的应用潜力。许多对人类构成识别算法和相关国内外提出了具体问题。此外,进步了人类对象识别领域的关键帧提取、人体姿态估计,其他专业问题。传统的人类的手势识别技术识别率低、难度高,成本高,速度慢,人类行为识别和大存储空间,并不是要求在未来人机交互技术的应用。结合关键帧选择技术与人体姿态估计技术可以大大减少计算和节省存储空间。近年来,人类姿态估计的研究现状国内外总结如下(5]。
的作者(6)提出了一个基于semisupervised 3 d人体姿态估计方法学习卷积神经网络,收集视频数据包含运动姿势,建造了一个semisupervised学习卷积神经网络模型,并估计相应的3 d构成骨骼改变姿势。该方法可以准确地估计3 d构成相应的帧的视频,但运动姿势估计效率很低。作者提出的方法(7)获取特定运动帧运动视频是基于人类的姿势估计和集群。选择HRNet姿势估计模型为基础,建立模型轻量级进程,结合黑暗的数据编码,构造Small-HRNet网络模型,从视频中提取人体关节点,并使用视频的每一帧的骨骼特征样本点。标准的运动帧的骨骼特征是集群中心集群整个视频。视频的具体运动框架是通过聚类,是在运动数据集上进行实验。这种方法可以减少身体姿势估计模型参数,同时保持准确性,但该方法的分类效果是不够的。可变形模型的人体姿态估计优化算法提出了参照[8]。从每一帧中提取模型参数的神经网络的彩色图像,参数优化,解决了使用人类的关键点和轮廓作为约束条件。根据视频序列的帧间一致性,造成的误差估计结果的视频帧然后纠正,提高运动序列的流体和光滑。获得的点云从深度图和相应的彩色地图模型被用作联合输入,紧随其后的是使用点云之间的距离约束和相应的点模型的优化和解决这个问题。最终,实际结果类似于人类的姿势。利用点云数据优化,该算法可以有效地纠正单帧姿态估计结果,大大提高其准确性。尽管如此,运动姿态估计的准确性很差。
本文提出一个准确的估计算法对运动构成基于多特征的融合。
2。收购运动姿态的特性
2.1。人体姿态估计技术
根据牛津字典,一个姿势是一个特定的身体的姿势,和一个人维持他或她的身体。人体姿态估计方法是提取、分类,区分,并描述人体的构成特点,近年来已被广泛关注。人体生理学的应用,数字图像处理,模式识别,其他学科是一个跨学科的研究领域9]。从人类的收集方法的角度提出信息,人体姿态估计技术可以分为两类:接触识别和非接触识别(10]。根据不同的分类标准,可分为多种人体姿势识别算法。从实现方法的角度,通常分为三种类型:3 d模型重建方法,从有效样本中提取的3 d功能构建三维模型,人工外观模型的方法,通过获得人体的形状特征建立二维模型,使用模式匹配方法来完成识别,运动模型的方法,根据运动特征的分类。从模式识别的角度、态度识别分类的问题时变特性,也就是说,匹配与预设的测试序列序列根据获得的特征信息。
2.2。人类杆模型的建设
根据人体解剖学的知识,人体有200多块骨头,骨头是由关节连接,使整个系统非常复杂,实际的数据采集是非常复杂的。由于这个系统中使用的收购单位的特殊性,我们不能收集的所有数据为每个骨头(11]。
目前,大多数研究人体与杆模型简化的建模和分析;即人体主要关节的抽象为一个点,和之间的四肢关节被抽象成一个链接,主要是考虑到肘部,肩膀,臀部,臀部、膝盖、脚踝,和其他关节。这样,整个人体简化成棒状模型,这也是人类的姿势的前提分析,如图1。
简化的杆后人体模型已经建立,各关节的运动范围必须限制以使模型更接近正常的人类的姿势。在康复医学,人体运动的初始姿态定义如下:面临的身体直着向前,眼睛是平的,脚站在一起,脚趾指向前方,上肢挂在一边的身体,手掌是附加到身体外的大腿的一面。联合有三个组件:关节面、关节囊、关节腔(12]。关节表面的形状和结构确定轴的联合活动,和关节运动的自由与轴周围的运动密切相关。有几个自由度如果有多个关节活动的方向。所有与两自由度多关节能够产生圆周运动,通常和肢体关节轴旋转。每个主要的自由度和运动范围人类共同如下:(1)肩关节:有三个自由度,上臂凹陷在一个中立的立场。其运动范围向前弯曲:70∼90°,后扩展:40∼45°,向前弯曲:150∼170°,向上提升:160∼180°,绑架:80∼90°,内收:20∼40°,内部旋转:70∼90°,外部旋转:40∼50°。(2)肘关节:有一个自由度。肘关节的中立的立场是前臂扩展。屈:135∼150°,伸展过度:10°,内转:80∼90°,旋后:80∼90°。(3)腕关节:有两个自由度。中立的立场是手和前臂,手掌向下。背扩展:80∼90°,手掌弯曲:50∼60°,径向倾斜:25日∼30°,尺骨倾斜:30∼40°。(4)髋关节:有三个自由度。中立的立场是髋关节扩展和髌骨前进。弯曲可以达到130∼140°,后扩展可以达到10∼15°,绑架可以达到30∼45°,内收可以达到20∼30°,膝盖弯曲90°,正常外部旋转30∼40°,内部旋转40∼50°。(5)膝关节:有两个自由度。中立的立场是膝关节扩展,弯曲:120∼150°,过伸:5∼10°,内部旋转大约10°,和外部旋转:20°时,弯曲膝盖。(6)踝关节:有两个自由度。中立的位置是90度角脚和小腿之间,没有内翻或外翻。背屈20∼30°,跖屈大约是40∼50°,内翻足30°,外翻是30∼35°。
本文的态度解决方案是指利用现有nine-axis传感器数据和相关理论和算法得到姿态角信息从这些数据。态度解决算法属于类别的数据融合,也就是说,态度解决通过融合多个传感器数据(13]。常用算法的态度解决包括卡尔曼滤波、扩展卡尔曼滤波器,互补滤波器和梯度下降算法。
基于模型的卡尔曼滤波器的线性最小方差估计是一个非常广泛使用态度计算算法。作为一种重要的最优估计理论,广泛应用在自动控制和航空航天等各个领域14]。由于离散卡尔曼滤波算法可以直接在计算机上实现估计多维随机过程,它将在下面介绍。
让系统噪声序列按照估计的状态在时间并且可以描述如下:
测量方程是一个线性函数,见以下方程: 在哪里是一步状态转移矩阵的时间吗时间 , 是系统噪声控制矩阵,是观测矩阵,是测量噪声序列,是系统的干扰噪声向量(15]。
假设系统噪声方差矩阵半正定和观测噪声方差矩阵吗是正定的,估计可以以下列方式解决:
单步状态预测方程如下:
状态估计方程如下:
均方误差估计矩阵如下: 的初始值和需要提前,状态估计在时间从测量方程可以获得吗在时间递归。
2.3。基于八星模型特征提取的态度
人类对象的图像是一个二维数组。提取的特征的人类对象转换为一维特征向量,这大大降低了特征向量的维度和计算复杂度。本文主要关注走路,跑步,跳跃在三体式特征提取和识别,通过分析三种态度,和腿移动手臂摆动幅度,因采用星型模型的过程中对人体的建模,即通过计算人体运动目标图像的质心点和局部轮廓极及其相互关系,为了获得的态度。本文利用一个八星模型提取一组特征向量包含17个特征值来描述人类的姿势在每一帧16]。六星级模型相比,它可以描述人体的轮廓,包括头部和四肢,更准确地说,这不是多余的。
八星是传统的星型模型的改进模型,这是一个特征描述模型形成根据当地轮廓波兰人和质心点八人的对象。人类构成模型建立所示以下方程: 在哪里是八个地方轮廓的两极之间的距离八星模型和质心的人类的目标。最小角是由直线和横线的八个地方轮廓波兰人的质心点八星模型;是人类目标的偏心。具体的特征提取过程如下:
计算人类对象的质心 : 在哪里是目标像素的数量。
目标分为四个部分,水平线和垂直线通过质心。基于目标的整体轮廓,八个地方轮廓极坐标系 最右边的,最左边的,和最低的轮廓在每个部分分别提取。
八个地方轮廓之间的欧氏距离 和质心点 计算,分别表示为 ,和计算公式所示以下方程:
然后, 。提取过程如图2。
在特征提取和融合之后,人类的特征向量构成的视频帧所示如下方程:
特征向量是一个17-dimensional特性向量由当地轮廓极距离特性,当地轮廓极角特性,和人类的八星的古怪特性模型,是当地轮廓极八星的距离特性,是人类的局部轮廓极角特性,然后呢人体的怪癖。姿态的计算复杂度和内存描述符相对较低,因此,系统可以实现实时识别效果好。
在实践中,视频图像将包含一些噪声,影响检测和识别的影响。因此,视频图像处理是图像预处理的主要任务,和它的效果直接影响到后续的检测和识别。
2.4。体育彩色图像灰度
真彩色图像像素的颜色值由三部分组成:红色R,绿色G,和蓝色b .每个组件的价值256的亮度水平,这是由编号从0到255。因此,有224个颜色,直接相对复杂的过程。是一个特殊的彩色图像,灰度图像的R, G, B和组件都是平等的,所以只剩下28颜色了,方便图像处理(17]。因此,为了实现算法的实时性能,前的原始图像转换成灰度图像视频图像处理,以减少算法的计算量。一般来说,灰度方法包括组件方法,最高法、平均法、加权平均法。
在组件的方法,一个RGB三个组件的使用像素的灰度值,见以下方程: 在哪里我代表了灰度图像的像素亮度 , ,和分别代表RGB分量的亮度值。一个灰色的图像可以根据应用程序的需要选择。第七届LENA_WALK1视频帧,10日PETS2006视频帧,在魏茨曼和21帧的测试视频数据库为例,实现了灰度的组件的方法。
上述方法实现起来比较简单,但缺乏考虑不同组件的重要性。根据组件的重要性和其他需要的图像,可以采用RGB三个分量的加权平均灰度值的像素(18]。从人体生理学的角度来看,人类的眼睛是敏感的蓝色绿色和麻木不仁。因此,根据人眼的视觉模型的重量组件设置为大,而体重的组件是小,其常用的公式所示以下方程:
灰色的权重采用OpenCV的开源计算机视觉库还遵循人眼的视觉模型,加权平均公式所示以下方程:
从理论和实践的角度,加权平均方法更合理、更符合实际应用的需要,因此,加权平均法是最常用的灰色图像的方法。在本文中,使用加权平均法灰度图像(19),cvCvtColor OpenCV计算机视觉开源库函数是用来完成图像的灰度CV_BGR2GRAY通过设置它的第三个参数。或者使用cvLoadImage函数,通过其第二个参数设置为0,可以实现彩色图像的灰色。
3所示。一个精确的运动姿态估计算法
3.1。中值滤波图像处理方法的姿态
在这种方法中,算术平均值或中位数相同的像素坐标在连续图像帧作为背景的像素值点模型,从而实现背景建模。背景建模过程中所示(1314),分别。
其中,意味着中间操作, 意味着视频帧在时间t, 意味着更新背景模型 。然而,它可以从公式(14),因为内存需求增加帧的图像需要缓存更新背景模型。因此,为了减少内存和计算,背景更新模型参数通常是根据以下方程: 在哪里称为更新率,控制背景模型的更新速度。通过实验验证,以减少前景变化对模型的影响,的价值通常是小,一般设置为0.05。
3.2。Multifeature融合人类运动的姿势
Multifeature融合是指源特征向量的综合分析和处理信息从不同的特征提取方法提取的特征融合算法融合形成新的特征向量组。一般来说,它可以分为两类:直接功能组合和特征选择的组合。直接特征组合方法是由所有特征向量直接合成新的特征向量组根据一些简单的规则,例如,串行和并行融合方法。特征选择和组合的方法是将所有原始特征向量,并根据一些选择规则,选择和保留一些特征向量从原始特征向量作为特征向量的新组合。
连续特征融合方法:样本空间的特征向量直接合并成新的特征向量。假设和标准化的特征在样本空间吗 ,任何样品 ,特征向量表示为 ,和 表示为熔融特性
并行特征融合方法(20.]:两组样本空间的特征向量合并成一个新的特征向量通过一个复杂的向量。假设和标准化的特征在样本空间吗 ,和任何样品 ,特征向量表示为 和 ,然后,融合特征表示为
在(17),是一个虚数单位。如果维度的特性和是不平等的,将进行特征融合在zero-complementing低维度的特性。
串行融合方法是最简单和最有效的方法,融合功能。融合特征的维数增加,所有特征信息保留,而且有许多冗余的特征向量。并行融合方法保证了不变性的特征维度,但复杂的使用空间向量增加了操作的复杂性,影响了识别的实时性能。为了提高精度和实时性能、特征选择方法生成的新特性可以确保中的有效性和功能类之间不产生过量的冗余。特征级融合方法大致分为五类:概率统计方法(贝叶斯估计、卡尔曼滤波等),逻辑推理方法(d - s证据理论、模糊逻辑等)、神经网络方法、基于特征提取的融合方法(PCA, LDA等)、基于搜索和融合方法(遗传算法,粒子群优化(pso),等等)。
3.3。人体姿态估计基于混合高斯分布模型的运动
混合高斯背景建模的方法是动态更新的参数,这背景模型建立了具有更好的适应性。它的基本原理是假定图像中每个像素是独立的,可以被K混合高斯分布,在那里K通常是3∼5。
在时间 ,在位置的像素值 是 ,和每个像素值的概率可以表示为的加权和高斯概率密度函数,见以下方程: 在哪里的加权系数高斯分布在时间 ,的均值和协方差矩阵高斯分布在时间是 , ,和 ,和高斯分布的概率密度函数 。具体计算见以下方程: 当一个新的视频帧输入,根据(19),像素值每个新先后与输入图像模型已经建立在当前像素点的位置。在哪里是信心的参数,通常设置为2.5。
如果新的输入像素值满足(20.),然后判断为背景点后成功的匹配;否则,它是前景点。新的视频帧输入像素匹配完成后,这个点的模型参数更新 ,和更新方法的参数方程所示(18)(20.),学习速率是一个固定值,该值是什么 ,和可以通过更新以下方程:
如果没有匹配的实现, ,只有更新(23),其余不变。如果没有成功匹配模型,该模型在最低的混合高斯模型代替,然后,新的参数的意思是 ,标准差是初始最大值 ,和重量是小值 。
为了获得模型的背景和高斯模型之间具有良好的相关性,也就是说,模型重量和标准偏差小,所有的高斯模型排列从大到小的根据 价值获取运动姿势估计函数 ,这是表示为
公式的参数代表背景的比例。如果在输入视频帧成功匹配任何最好的描述模型,是判定为背景点。否则,它是判断为前景点。此时,获得运动姿势估计函数值是运动造成的结果估计,从而达到准确的运动姿态估计。
4所示。实验
4.1。实验设计
实验在两个基准数据集,喷气推进实验室第一个交互数据集(tJPL)和DogCentric活动数据集(DogCentric),分别包含了84年和209年的视频。前者是人机交互的数据集,而后者是人类交互数据集从第一视角。两个数据集的视频分辨率为320 240和30帧的帧速率。
本文使用多个评价指标评价模型,包括样本的准确性,样本类别精度水平,样本平均分类精度水平,和视频的准确性。样品的准确性,也称为整体精度,是指正确分类样本的比例的样本总数是最简单和直观的评价指标分类问题。具体来说,假设示例部分从视频根据抽样策略,获得和段的数量正确分类的模型 ,然后,样本精度的计算公式如下:
然而,当类别的比例严重失衡,仅仅依靠样本是不可靠的精度评价标准。假设一个极端的例子:当负样本的比例是样本总数的99%,分类器还可以获得高精度的预测所有样品负样本。数据倾斜时,类别与大部分成为评估标准的主要影响因素。因此,我们也使用样例级别分类准确性和样本平均分类精度。其中,sample-level分类精度是集团所有样本段根据类别和获得正确的预测在每个类别的概率。的平均分类精度样本平均水平是根据每个类别精度的加权求和。具体来说,假设类的数量( ),每组是按照类别进行分组,样本的数量 在每组 ,然后,
为了获得视频水平预测样本的预测指标部分,部分中描述的方法3.2用于投票融合,融合的最大数量的分类预测,最大类别分数,和最大加权分数,和运动姿态的估计精度计算根据融合结果。
4.2。实验结果
4.2.1。准备准确的运动姿态估计需要时间
为了验证该方法的精度估计效率,该方法在文献[6在文献[],该方法7],本文中的方法是用来估计运动姿态的精确的估计时间,结果如图所示3。
图分析3显示,当样本数据的运动姿势是100 GB,估计时间的方法在文献[6)是43.5秒,估计时间的方法在文献[7是35.2秒,该方法的估计时间是1.5秒。当运动姿态数据的样本量是300 GB,估计时间的方法在文献[6)是42.1秒,文献[7方法是31.6秒,该方法需要2.3秒。当样本数据量的运动姿势是900 GB,准确的估计时间的方法在文献[6在文献[]是46.5秒,该方法7是58.3秒,这方法的准确估计时间是5.3秒。该方法的姿态精度明显高于其他方法,表明它能有效地提高姿态运动的准确性。
4.2.2。样品在运动姿态估计精度
为了验证样本的有效性提出的运动估计方法,文献[6)、文学(7),在本文提出的方法用于比较,结果如图所示4。
根据图4,当体育构成样本数据的数量是200 GB,估计精度的方法在文献[6在文献[]是72.5%,该方法7)是48.6%,该方法是95%。当体育构成样本的数据量是600 GB,估计精度的方法在文献[6)是69.9%,方法的文献[7)为71.5%。该方法的估计精度是99.9%。体育构成样本的估计精度是69.2%,该方法在文献[6方法在文献[]和89.6%7当样本数据大小是900 GB。该方法的估计精度是百分之一百。这表明,该方法能有效地提高体育构成样本的估计精度。
5。结论
在这篇文章中,一个人杆模型使用一个精确的运动姿态估计算法基于多特征的融合。基于卡尔曼滤波的方法来估计运动姿势,确定运动的自由度和范围的主要身体关节,使用八星模型提取运动姿态的特性,使用multifeature融合方法来提取源向量信息功能,并使用混合高斯分布模型来实现运动的身体姿势。实验结果表明,当体育构成样本数据的数量是900 GB,该方法的准确估计时间是5.3,和它的准确性为100%。提高样本的估计精度的运动姿态。
在未来,我们将介绍一个多线程的注意机制和更先进的6 d识别技术进一步提高运动手势识别的准确性。
数据可用性
使用的数据来支持本研究的结果包括在本文中。
的利益冲突
作者宣称没有利益冲突。
确认
本文得到了河北省体育科技研究项目;项目名称:河北体育城市老人的健康研究的背景下体育和医学的“集成”;项目没有。:20202006。