近年来,随着计算机存储能力的迅速发展和网络传输功能,用户可以很容易地共享自己的视频和图片在社交网站上的信息,和网络上的多媒体数据量迅速增加。不断增长的数据量的网络,建立有效的自动化数据管理方法和搜索方法已成为一个日益迫切需要。提出了一种检索方法基于运动捕捉人体运动数据的索引空间。通过提取关键帧从原始运动执行水平降维并根据拉班运动分析,定义特征运动段受到垂直特征降维。后提取特征从输入运动,运动匹配索引空间执行。本文设计的优化方法分阶段动态变形算法时间效率的优化方法和分析分阶段动态变形算法时间复杂性。本文考虑冗余的时间效率,优化分阶段动态时间变形方法的时间复杂度。这提高了时间效率的动态时间规整算法,使其适合于大规模的人体运动数据问题。实验表明,本文方法的优点是速度,更符合人类的语义动作,并能满足人体运动的检索需求的数据库。
大命题之间的视频检索、视频检索的问题对人类的姿势已经逐渐引起了研究者的注意由于其广泛的应用[
运动编辑通常可以解决最初的运动捕获数据的情况不符合需求。常见的使用包括更改原来的角色或体育运动风格。困难在于最初的运动可以编辑的需要而不失真。动作捕捉技术的出现以来,大量的运动捕获数据的难度也增加了有效地管理和重用。因此,如何有效和准确的检索数据库的运动已成为一个重要的研究目标。当前的运动检索方法主要包括动态模板匹配等方法,基于内容的、基于索引和动态时间扭曲。随着技术的成熟,基于人类的手势识别的视频检索技术已开始引起注意(
目前,大多数视频检索研究更关心的是检索的准确性的方法,但如果要应用到现实生活中,其检索效率远从当前水平的关键字检索。如何提高检索的响应速度的前提下保证检索精度已成为一个新的研究课题。因此,视频检索仍然有很大的研究空间。在互联网上使用最广泛的视频检索方法仍然使用关键字的文本检索。这种方法有很多缺点,如成本高的标签和信息的损失。因此,是很有意义的视频检索方法研究基于视频的内部信息。本文分析了人体运动捕捉人体运动数据检索方法,提出了基于索引空间的检索方案。通过提取关键帧从原始运动部分,减少人体运动数据处理的复杂性,和语义定义人类的运动特性。特征提取是进行运动节段,减少人体运动数据的维数,提高了检索结果的语义相似度。本文的技术贡献可以概括如下。
第一:我们创建一个索引空间提取所有数据库和人体运动的特点,得到检索结果通过索引的索引空间。上演了动态时间规整算法的时间复杂度进行了分析,及其时间效率优化。
第二:双向分阶段动态变形提出了减少计算时间。贪婪的思想应用于动态时间变形算法,减少了国家设置在状态转换。我们分析之间的关系状态和组织解决状态合理解决。通过先后接近复杂的状态转换,过渡时间减少。
第三:进行了仿真实验。结果表明,该方法有更好的时间效率,更高的灵活性,和检索精度更好的运动语义特征提取。这可以满足各种各样的人体运动数据的检索需求,以及大规模的人体运动检索数据库。
本文的其余部分组织如下。部分
欧拉角是一个序列分解角位移成三个在三个相互垂直的轴旋转角度值。“角位移”意味着欧拉角可以用来描述任何旋转,但它也可以描述一个物体的空间定位。欧拉角将方位划分为三个互相垂直的轴周围旋转,通常都是遵循笛卡儿坐标系统,在一定的顺序是积极的。
起初,物体坐标系和惯性坐标系重合,标题是旋转的<我t一个lic> y我t一个lic>设在,向右旋转是正的;也就是说,它是把向下沿着顺时针方向<我t一个lic> y我t一个lic>设在。同样,球场周围旋转<我t一个lic> x我t一个lic>设在对象坐标系统中,银行是周围旋转<我t一个lic> z我t一个lic>设在在对象坐标系统。两者都遵循左手规则,当从积极的方向顺时针方向旋转轴的原点。
在正常情况下,三个欧拉角组件的旋转后,任何物体的旋转坐标系可以表达。特殊情况是指通用锁;当旋转锁状态将会出现。欧拉角的三个组件在不同条件下可以定义不同。例如,我们获得的数据bvh格式人类zxy轴的运动序列。
自三个表达式都有自己的优点和缺点,在不同的场景中使用不同的表达式通常是计算方便或者其他表达式不匹配的特点。常常需要转换三种形式的表达。
欧拉角(<我t一个lic>
x我t一个lic>,<我t一个lic>
y我t一个lic>,<我t一个lic>
z我t一个lic>)旋转矩阵
欧拉角的四元数
一方面,特征提取可以减少维数的原始人类运动数据,避免了直接的相似性比较人类高维运动数据的检索,另一方面,有效的特征可以代表人类运动的语义(
人类运动的视觉特性收集和特征提取。
身体特征主要描述人体运动的结构和几何特征。这一类可以帮助识别人体运动的一部分,和哪些部分接触和人体器官的运动模式。在这部分功能的定义,考虑到一些关节的自由度人体通常小于3,一些不太可能出现的构成特性可以直接忽略来简化特征空间。
动作特性表明人体是否在当前运动状态,通过计算相邻的姿势之间的位移是否超过阈值。这个功能主要是四肢和整个的位移:
相对位置的描述每一个肢体的相对位置。例如,左右腿身体正前方或正后方飞机,飞机前的特征值是1;否则,它是0。这个特性可以描述身体的每个部分的位置是最重要的,大部分定义的特性。
定位信息指示的方向是否上下部分的人体基本姿势变化很大。这个特性可以描述运动改变方位信息,如扭转:
四肢计算之间的联系信息是否每个肢体接触(两个肢体之间的距离是否小于阈值),如分离和合并的左和右手臂,可以区分运动更准确:
角信息计算夹角是否在当前姿态和四肢的夹角的上、下部分人体小于阈值。例如,大腿与小腿的夹角和上半身和下半身可以用来判断这个人是直立或坐或蹲的。
动态特性描述为行动的逻辑动态,和相同的身体姿势可能由两个动作完全不同的语义。例如,达到向前的动作,轻轻将一些东西,和愤怒是完全不同的语义,不能只由几何位置特征。
空间特征区分是否直接或nonstraight运动轨迹,计算从当前姿态和之间的距离比前一帧的时间间隔:
时间特性与动态特性和区分是否运动变化突然或逐渐根据从小型到大型的速度运动。这个特性和强度特性在一起可以详细描述整个过程的风格从一开始的运动,运动和运动的终结。例如,一个急切的敲门声出现暴,而当场跳似乎突然轻轻地。
形状特征描述人体运动姿态的轮廓,和功能主要定义了不同的形状的人类的身体和四肢。
本文定义了一个特征空间索引整个身体运动数据库在一个分布式的方式。特性的运动姿势,相应的布尔值序列的指数可以作为分布式索引空间的姿势,和体态特征序列与序列的值对应于一个功能点1和剩余的0态势在一定的价值功能。在特征提取阶段,运动段的数量和相应的帧数每个体式都记录的索引信息。最后,所有的姿势都按照大小排序功能的布尔值和存储。可以看出,该指数空间提取不同姿势的人体运动数据库中所有运动部分和包含信息的每个姿势运动段。空间索引的更新也非常容易;它只是插入一个新的运动姿势和索引信息直接或添加新的索引信息的现有的姿势。
根据已定义的索引结构的特点,常见的检索要求,比如运动子序列匹配和模糊搜索可以很容易地实现。输入查询运动段时,它可能是一些长期运动段的子序列在人类运动数据库。在检索,通过查询功能值序列对应于第一个关键帧姿态运动的一个组成部分,索引空间的相似的姿势可以快速定位;也就是查询的开始运动段匹配的运动段可以找到。
当用户需要人体运动数据相似但不完全符合查询的一些功能运动,他们可以请求匹配通过指定一些特性。指定的功能越少,越匹配。
本文提出一种基于人类运动视频检索框架,及其过程如图
视频检索框架基于人类运动。
上演了动态时间变形算法可以有效地实现在两个方面,即向前和向后。在某些情况下,相同的分阶段动态时间变形算法采用不同的实现方法,并将有一定程序的时间效率的差异。一般来说,如果问题的初始状态决定但最终状态是不确定的,它可以通过“自上而下”的顺序的方法。相反,如果问题的最终状态确定初始状态是不确定的,你可以考虑“自下而上”的逆方法。
可以结合双向广度优先搜索算法扩展方法来降低国家的总额,上演了动态时间扭曲算法也可以使用。类似于双向广度优先搜索算法,当问题的状态空间大,问题的初始状态和最终状态确定,单向的扩张将导致大量的无效状态计算。接下来,为了减少的规模状态,你可以在两个方向扩展的初始状态和最终状态并执行最佳判断交点的两个扩张问题的解决方案。
图
状态空间图的双向和单向规划。
双向分阶段动态时间变形也有更好的应用于实际问题,如结合服务选择问题;即在多个服务,提供相同的功能,选择特定的服务组合,以最大化用户的服务质量。服务选择问题抽象为图模型。最后,问题转化为图的最长路径问题。问题已经解决了双向和动态时间变形,这是比单向编程更容易。
州的数量需要解决的问题是直接关系到状态表示方法,和州的总数问题通常可以改变通过改善状态表示方法。当使用动态时间变形的想法来解决这个问题,该算法设计了不同的状态表示方法需要不同的国家总数得到解决。当国家为每个状态转换的数量和每个状态转换的时间不变,需要计算的状态数的问题是减少,可以提高算法的时间效率。
解决问题的过程随着时间分阶段动态变形算法是计算所有的州(子问题)问题。当前状态的计算通常是通过国家已经解决和决定在这个状态,状态转换过程。参与每一个状态转换的状态数在计算州是一个关键因素影响分阶段动态时间变形算法的时间效率。本节将讨论一些优化方法来减少国家参与每一个状态转换。
我们使用分阶段动态时间变形的方法来解决这个问题,当问题规划模型
W (<我t一个lic> 我我t一个lic>,<我t一个lic> j我t一个lic>)代表的度量值的总和<我t一个lic> 我我t一个lic>th的阶段<我t一个lic> j我t一个lic>th阶段问题。这个指标在不同的问题有不同的含义,可以获利,输出和资源消耗。G (<我t一个lic> 我我t一个lic>,<我t一个lic> j我t一个lic>()代表的状态问题<我t一个lic> 我我t一个lic>,<我t一个lic> j我t一个lic>)阶段。状态转移方程的意义是将原问题分解为两个子问题,然后解决问题。最优二叉搜索树和其他问题都使用这个状态转移方程。
其中,权函数<我nline-formula>
如果函数<我nline-formula>
当国家f (<我t一个lic>
一个我t一个lic>,<我t一个lic>
b我t一个lic>)满足四边形不等式性质,决策变量v (<我t一个lic>
一个我t一个lic>,<我t一个lic>
b我t一个lic>)满足
使用决策变量的性质,得到优化的状态转换方程如下:
我们使用状态转换方程满足四边形不等式,分析之间的关系状态,然后推断出最优决策是单调的。当计算状态时,最优决策的单调性是用来减少的州的数量为每个状态转换需要考虑,从而降低算法的时间复杂度。我们可以得到灵感来自这种优化措施。的过程中使用了动态时间变形算法来解决这个问题,该算法不仅可以优化减少的总数,但也最优决策的性质可以充分利用优化算法。
在解决问题的过程中逐步的动态变形方法,计算状态的问题将不断引用。因此,深入分析美国的关系已经解决,合理组织有时可以简化依赖状态的问题,这有助于提高了动态时间变形算法的时间效率。通过一个例子来说明模型、规划模型的问题是如下:
的公式,<我t一个lic> 米我t一个lic>(<我t一个lic> 我我t一个lic>)代表条件值<我t一个lic> 我我t一个lic>th阶段的问题,G (<我t一个lic> 我我t一个lic>)代表国家价值<我t一个lic> 我我t一个lic>th阶段的问题,状态转换方程意味着只有当问题的当前阶段的条件价值大于前面的条件价值阶段,国家将被转移。
有O (<我t一个lic>
n我t一个lic>)国家需要解决的状态转换模型,时间对于每一个过渡是O(1),为每个状态转换的状态数是O (<我t一个lic>
我我t一个lic>),总时间复杂度的算法
优化的状态转移方程
的元素<我t一个lic> 米我t一个lic>(<我t一个lic> 我我t一个lic>)的设置<我t一个lic> D我t一个lic>是单调递增的。因此,在上面的状态转换过程中,一个有效的搜索algorithm-binary搜索可以使用,所以每个转换的时间是O (log n),和州的数量仅为O (1)。优化后,每个状态转换的时间增加,但在状态转换的数量减少。这反映了时间效率之间的矛盾因素的优化过程。优化后,算法的时间复杂度是O (nlog n)。因此,整个算法的时间效率提高。
贪婪的想将当前状态中选择最优解问题的根据一个特定的贪婪策略当解决一个问题,而不是考虑全局最优的问题。因此,该算法不能得到所有优化问题的最优解,但最好的实践通常可以达到简化问题模型的影响。
我们使用分阶段动态时间变形的方法来解决这个问题。当问题的状态空间是巨大的和模型很复杂,传统的分阶段动态时间变形方法是无效的,你可以考虑使用分阶段动态时间变形的贪婪的想法。你在深度分析问题的本质,找出算法的冗余,降低容许的范围决定可能产生最优解集,然后实现的目标优化算法的时间效率。
在实际问题中,你会遇到以下所示的状态转换方程方程:
W (<我t一个lic> 我我t一个lic>,<我t一个lic> j我t一个lic>)代表的度量值的总和<我t一个lic> 我我t一个lic>th的阶段<我t一个lic> j我t一个lic>th阶段问题。这个指标在不同的问题有不同的含义,可以获利,距离,和资源消耗。G (<我t一个lic> 我我t一个lic>,<我t一个lic> j我t一个lic>)代表国家问题的阶段(<我t一个lic> 我我t一个lic>,<我t一个lic> j我t一个lic>)。这是一个动态变形的一个典型的间隔时间模型。这个问题通常是找到整个区间的最优值。这种类型的问题的基本特征是,问题可以分解为两个子问题相结合的形式。解决方案是列举合并点,把问题分解成两个左和右子问题,然后合并左和右部分的最优解获得原问题的最优解。
优化过程是分析问题的最优解组成找出问题的状态依赖的关系,从而避免一些无效的枚举状态,减少算法的时间复杂度。这是一个贪婪的思想的典型体现。“贪婪的分阶段动态时间扭曲”不是一个具体的算法,但是一个优化的想法。如果你想灵活使用贪婪的思想分阶段动态时间规整算法,关键在于问题的深入分析和分析。你开始与原来的动态时间变形模型,分析算法的整体结构,然后巧妙地用贪婪的想法来解决冗余在原始动态时间变形算法,从而达到优化算法的目的。
实验人体运动数据摘要包括大约400运动段的人体运动捕捉数据库卡内基梅隆大学,分为8类,如图
人体运动的数据分类数据库。
人体运动数据的预处理是检索前的离线处理的原始人类运动的数据集,包括三个步骤的关键帧提取、特征提取和索引空间建设。
考虑离线处理的需求,本文采用分阶段动态时间变形优化算法计算量更准确和稳定。在本文实验使用方法来提取关键帧的原始人类的运动数据。不同动作的最优压缩率是不同的。简单的和缓慢的行动是最优压缩率高,而复杂的最优压缩率较低和暴力行动。例如,慢慢地的平均压缩率是7%,而跳舞的平均压缩率是16%。最后,毕竟总数帧提取人体运动数据是40460帧,和总平均压缩率约为10%。可以看出,人类运动的量大大减少后期的数据处理。
共有36个布尔特性是本文定义的。因此,在特征提取阶段,每一个关键帧的运动部分将被转换成一个布尔值序列长度36岁,和相应的值范围是[0,224]。最后,每个运动部分转换成一个特征向量。
我们构建索引空间提取每个特性的特征向量,记录序列号和帧数的运动的一个组成部分,和排序的所有特性。可以看出从功能定义索引空间的大小不会超过224年,但在实践中,一些常见的姿势,如静止的和普通的行走,会反复出现在多个不同的运动;同时,一些理论上的体式特征定义基本上不出现,所以最后的索引空间将比224年小得多。
在这个实验中,共有8000个不同的最终提取特征值,特征分布和姿势重复性如图
功能分布和姿势可重复性。
累积误差匹配特性。
我们选择的人类运动测试数据集收集和处理在本文中,使用传统的协同过滤相似函数来获取人体运动数据,然后使用验证评估算法的检索效果。我们画准确率和召回率的变化在不同的相似度函数,分别如图
比较不同的相似度计算函数的准确性。
召回率进行比较,不同的相似度计算函数。
根据图
本文比较了修正余弦相似度计算函数和动态时间变形计算函数和比较的检索效果函数的区间N从1到25。我们画下的精度和召回的变化不同的相似性函数和不同的前N,分别如图
比较不同的相似度函数的准确性。
召回率进行比较,不同的相似的功能。
从图可以看出
从图可以看出
构建索引空间离线后,你可以在网上搜索通过输入查询片段并指定匹配的特性。其中,查询片段也转化为特征向量通过关键帧提取和特征提取。检索算法在本文中使用二进制搜索在搜索时搜索索引空间特征序列对应于一个特定的框架。本文的实验环境,原始查询运动段300帧时,平均搜索时间是0.034秒。
为了比较不同算法的检索效果在测试人类运动数据库、数字
P-R比较搜索结果的多种方法对几种不同的体育项目。
图
检索的各种方法在不同的身体运动数据库大小。
本文提出了一种新的方法获取人体运动捕捉的运动数据,从而有效地减少人类通过关键帧提取运动数据的维数和自定义特征提取。索引空间定义为记录所有运动在人体运动姿态分布信息数据库。在检索阶段,快速查询索引空间是用来匹配运动节段。本文的优化方法分阶段动态变形算法的时间效率。优化算法的过程中,一方面,需要对问题的性质进行深入分析,找出问题的本质,另一方面,它可以改善原算法的缺点。设计算法使用了动态时间变形的想法需要很强的创造力。上演了动态时间变形算法是一个想法,并没有统一的标准状态模型问题。分阶段动态时间变形状态模型的实际问题可能是完全不同的,所以需要一个特定问题的具体分析。同样的,算法的优化也很灵活。本文讨论的是只有一些传统优化措施,高效的优化方法在具体问题需要继续挖。 The index space constructed by the method in this paper does not depend on the size of the human motion database and is easy to modify. It can be matched with varying degrees of accuracy by flexibly specifying feature matching during retrieval, so it has good retrieval performance and effects. Since the designation of parameters that need to be matched during retrieval will affect the retrieval results, the user needs to have certain prior knowledge. The next goal is to adaptively match the prominent motion characteristics of different categories of motion to achieve the purpose of intelligent retrieval.
使用的数据来支持本研究的发现可以从相应的作者。
作者宣称没有利益冲突。