手势识别数据流的人类运动传感器使用加速PSO群搜索特征选择算法

文摘

如今人类运动传感技术获得巨大的受欢迎程度与实际应用,如视频监控安全,手签,智能和游戏。这些应用程序捕获人类运动的实时视频传感器,数据模式是不稳定和不断变化的。虽然这样的运动传感设备的硬件技术以及数据收集过程变得相对成熟,计算的挑战在于这些现场反馈的实时分析。在本文中,我们认为,传统的数据挖掘方法缺乏准确地分析人类活动模式从传感器数据流。算法设计的缺点是由于不适应动态变化的动态手势动作。这些算法的继任者被称为数据流挖掘是评估与传统的数据挖掘,通过手势识别的情况下对运动数据通过使用微软Kinect传感器。三个不同的受试者被要求读三个漫画,告诉在传感器前面的故事。数据流包含发音点的坐标和人体的各个部分的位置对应于用户执行的操作。尤其是小说的特征选择使用群体搜索技术,加速算法提出了使快速预处理诱导一种改进的实时分类模型。优越的实验结果显示在运行经验数据流。 The contribution of this paper is on a comparative study between using traditional and data stream mining algorithms and incorporation of the novel improved feature selection technique with a scenario where different gesture patterns are to be recognized from streaming sensor data.

1。介绍

随着传感技术的的发展1]相对易于部署和具有成本效益的操作,视频运动传感器找到它在不同的领域应用广泛,仅举几例成功案例在环境传感、有用的应用程序,比如手运动姿态的检测智能手机进行远程交互(2),监测人体运动医疗康复(3),老年家庭的日常活动(4)、娱乐和运动(5],以及先进的人机交互研究[6,7]。而通信机制和传感器的一般操作程序已经取得了深入的研究,这种传感器系统的决策通常被称为分析“大脑”尚未探索的细节。Kinect传感器,例如,8),是一个外围I / O设备,旨在提供一个自然界面游戏控制台不需要传统的控制器。这个传感设备功能简单的彩色相机、深度传感器,和multiarray麦克风,能够提供快速的音频和视觉数据流支持面部识别,识别局部或全身运动,和声学检测识别。

一般来说,人体运动识别是一个过程,首先检测和记录人类的姿势或手势位置的变化(这取决于上下文的一个完整的身体或手),相对于周围环境或背景视频序列对应于前面的位置。收集到的数据从传感器包括红外信号的运动、光学幻觉,射频能量,或超声波,这取决于所使用的类型的运动传感器。假设已部署的传感器是持续而可靠的眼睛和耳朵收集感知数据从一个移动主题,初步的数据快速流图像处理,提取图像的特征,然后到中央处理器函数作为决策支持应用程序通过解释改变信息的功能。

作为广义过程适用于许多应用程序中,数据收集和交付后的剩余任务决策支持中心由以下组成:图像处理、数据预处理、模型归纳,规则提取和情报传播。现代传感器硬件的图像处理通常是嵌入一些低级的中间件的装置流程和提取信息从原始图像中特征抽象级别。

数据预处理包括数据转换、数据清理和经常特征选择减少特征空间,增强识别精度;我们先前的论文长度解决这个任务对分布式无线传感器网络(9,10]。我们本文关注感应和规则提取的任务模型,特别是通过使用数据流算法和轻量级的特征选择方案适合高速递增的机器学习,手势识别。

探讨后剩下的任务数据进行收集和交付给决策支持中心的目的是找到合适的组合分类算法和特征选择算法正确认识人类的手势。有关遥感数据摘要收集的数据来自微软的Kinect传感器,用于捕捉手势,身体的位置在3 d和相应的速度和加速度在用户提出了各种各样的姿势。我们的重点是严格的和比较在两组分类算法的性能分析,即batch-learning和增量或位置学习,根据在最短的预处理时间实现最高精度。我们说明新提出的特征选择方法的有效性在一个说明性的例子,即如何识别人类的手势模式在应用程序的视频传感器。

这里的主要研究挑战是寻找最合适的模型归纳动作模式识别算法。挑战取决于几个严格要求视频运动传感器:首先,提要的数据量可能是无限的,和交付的数据是连续的高速列车信息。因此预计将实时处理和立即响应。这意味着被部署的分类归纳算法必须是轻量级的,增量,准确的确定。模型需要做更新快速、动态地在每个到来的新实例的数据。作为附加的功能,用于修饰或说明是否适合视频传感器的决策支持过程/操作可能需要嵌入在一个小的移动设备,内存需求是选择尽可能少的原因很明显的节能和拟合到一个小设备的大小。换句话说,学习模型,可能在形式的广义非线性映射的特性值之间的预测目标类,必须足够紧凑的在一个小的运行时内存执行。不浪费存储空间的特性和他们的关系,既不重要也不贡献模型精度。为此,不使用特征选择是不可能的。这是因为原始特征的数量从视频序列中提取可能非常高。 Feature selection is a heuristic process which retains only the significant features as an optimal subset of the full features, representative enough to induce an accurate classification model for pattern recognition.

另一个问题的定量计算特征值之间的非线性关系和目标类的时间自然传感器数据流。必须紧缩建模的数据流足够长的时间季节性周期或普通模式如果他们曾经存在。没有直接的关系,可以很容易地将属性数据映射到一个特定的类中没有一个长期的观察。这体谅地影响数据挖掘算法设计,应该能够阅读和忘记了数据流(因此被称为“一次走刀”算法),只保留只是所需的统计推理之间的长期关系和目标类的属性值。

考虑上述独特的计算挑战从视频传感器与运动相关的数据,严格的分析评价既重要又必要的一些比较流行的数据挖掘算法,对手势模式识别。这个评估报告提出了见解开发者想要设计一个视频传感器网络为目的的认识人类活动或通过数据流挖掘的手势。

剩下的纸是组织如下。部分2介绍了我们研究的背景通过实验讨论在这两个方面的布局和类型的数据挖掘算法进行测试。特别是,视频传感器用于测量运动数据作为描述人类活动的结果,与传统和增量决策树进行比较和对比。部分3涵盖了数据流挖掘算法的技术细节。具体讨论了传统算法的缺点,以及如何数据流挖掘算法的新功能,帮助克服的限制。实证数据集视频传感器应用在实验中,在部分4,目标是比较几个数据挖掘算法与手势识别。最后一节5总结了纸。

2。背景

2.1。手势识别和数据集

2013年,圣保罗大学的研究者Madeo等人研究了使用支持向量机(手势分割问题11手势分析[的]和审查时间方面12)和动作捕捉的视频传感器是如何被整合在时间方面与身体的位置[引用13]。虽然他们的研究焦点是姿态阶段细分研究小组指出,手势行为可能会影响分类器的性能。众所周知,不同的人类用户拍摄做同样的手势可能会产生不同的手势行为。因此需要一个有效的机器学习方法在准确分类的运动模式数据转换成相应的手势。

他们的实验数据集,可以下载视频序列捕获由7通过使用微软Kinect传感器。前微软Kinect传感器3人类受试者被要求读3漫画,告诉的故事漫画使用手势和身体姿势,而传感器记录运动。最后的图像处理,视频包含一个图像序列,一个用于每一帧,索引的时间戳。然后格式化为一个矩阵视频序列的文本文件,与行数据代表了时态数据实例和列描述空间或位置- - - - - -- - - - - -6关节的三维坐标点。目前发现的接合点位置的四肢和身体部位,如头、脊椎,左手,手腕,右手,右手腕。职位的措施被规范化为数值。每个数据实例的姿态信息提取每个视频帧,每个惟一确定的时间戳。数据实例是由人类专家的帮助下位手动分割一个标签的文件和相关的手势。本手册需要后处理生成地面真理分类为了评估测试分类算法的性能。

有32个数据集的属性或特性,结合静态位置的身体部分的视频帧和运动信息。目标类的五个阶段分别抽象为持有的手势,准备,休息,收缩,和中风。共有50个属性用于描述每个实例相当于成千上万的长度取决于故事播放。50的属性,18岁的身体部位的位置,和32是速度和加速度,在矢量和标量形式的手和手腕。表1显示了50个属性。总共有9900个数据实例从7视频中提取可用于培训/测试的分类算法。


职位	运动

(1)韩:左手的位置(协调)	(1)矢量左手速度(协调)
(2)韩:左手的位置(协调)	(2)速度矢量的左手(协调)
(3)韩:左手的位置(协调)	(3)速度矢量的左手(协调)
(4)猕:右手的位置(协调)	(4)矢量的右手的速度(协调)
(5)猕:右手的位置(协调)	(5)矢量的右手的速度(协调)
(6)猕:右手的位置(协调)	(6)矢量的右手的速度(协调)
(7)h:头的位置(协调)	(7)速度矢量的左腕(协调)
(8)h:头的位置(协调)	(8)速度矢量的左腕(协调)
(9)h:头的位置(协调)	(9)速度矢量的左腕(协调)
(10):脊柱的位置(协调)	(10)矢量的右手腕的速度(协调)
(11):脊柱的位置(协调)	(11)矢量的右手腕的速度(协调)
(12):脊柱的位置(协调)	(12)矢量的右手腕的速度(协调)
(13)lw:左腕关节的位置(协调)	(13)矢量的加速度的左手(协调)
(14)lw:左腕关节的位置(协调)	(14)矢量的加速度的左手(协调)
(15)lw:左腕关节的位置(协调)	(15)加速度矢量的左手(协调)
(16)rw:右手腕的位置(协调)	(16)加速度矢量的右手(协调)
(17)rw:右手腕的位置(协调)	(17)加速度矢量的右手(协调)
rw (18):右手腕的位置(协调)	(18)矢量的加速度的右手(协调)
	(19)加速度矢量的左腕(协调)
	(20)加速度矢量的左腕(协调)
	(21)加速度矢量的左腕(协调)
	(22)的右手腕的加速度矢量(协调)
	(23)矢量的右手腕的加速度(协调)
	(24)的右手腕的加速度矢量(协调)
	(25)标量左手速度
	(26)标量右手的速度
	(27)标量的速度离开了手腕
	(28)标量速度的右手腕
	(29)标量左手速度
	(30)标量右手的速度
	(31)标量的速度离开了手腕
	(32)标量速度的右手腕

作为一个例子,左手的3 '的立场是可视化显示波动值随着时间的推移图1。此外的归一化值三个坐标可视化为平行坐标图在图2显示属性值的宽范围虽然他们已经规范化在0和1之间。三坐标的映射关系的六个阶段(目标类)在2 d和3 d可视化数据3和4,分别。他们都指出,映射关系构成的建设确实非常非线性的分类模型。高度非线性模型是已知计算难以诱导特别是如果他们需要达到一个良好的通用性和准确性之间的平衡。数据流挖掘的附加要求,处理必须迅速在算法设计带来了一定的挑战。

2.2。传统的学习方法和增量模型

传感器数据分析是新兴和它需要一个高效的分类模型,该模型能够挖掘数据流,使看不见的样本的预测。传统的分类方法被称为一种自上而下的监督学习方法(14),一个完整的数据集是用来构造一个分类模型,通过递归分区数据为建模概念形成映射关系。由于这些模型是基于一个固定的数据集构建,模型更新需要重复整个培训过程每当新的样品到达,添加包含基本模式的改变。传统模型可能有一个良好的性能在一个完整的历史数据,并且数据相对静止的没有预期新变化。在动态流处理环境,如使用视频传感器的手势识别,然而,数据流是进化和分类模型必须相应地更新频繁。因此,新一代的算法,通常被称为增量分类算法或简单,数据流挖掘算法提出了解决这一问题(15]。

以决策树构造为例,启发式函数是一个重要的评价方法,确定了分裂属性将叶子转化为节点,例如,信息增益中使用C4.5 [16)和霍夫丁树(17]。传统的方法需要完整的数据集(新到达的数据和历史数据)来更新决策模型虽然增量方法实现单次的方法就是不必要的重新加载完整的数据集。图5显示了分类模型的流程图感应通过使用这些学习方法的两个家庭。

技术传统方法的缺点,保持整个执行过程在运行时内存model-induction不是有利的特别是当输入训练数据太大。因此,增量方法负载只有一个小片段的输入数据流一次而不是填满所有,为刷新逐步分类模型如图5。在增量学习,霍夫丁绑定(HB)是用来决定是否一个属性应该分割建立新节点提供了足够的样本的属性出现在数据流。这种新方法是专为增量决策树,这是非常快的先驱决策树(VFDT),有时它更普遍被称为霍夫丁树(HT) [17]。HT是经典的使用HB节点划分的测试工作。这是归因于HB的统计特性控制节点划分的错误率。

3所示。为数据流挖掘增量学习模型

3.1。Batch-Learning分类问题

我们审查,通过数学,为什么传统模式归纳过程可能不是函数挖掘数据流从视频传感器。假设数据到模型的一个实例归纳流的时间戳,;它携带一个矢量数据的多个属性和相应的类值中定义的在一个时间段(在时间戳的数量数据收集到数据块,在那里。定义在的数据块这是到目前为止收集到的手,一个启发式函数用于诱导一个分类模型。让是这样的启发式函数;贪婪的搜索方法,在各个击破的方式通常是采用传统的决策树模型,试图引起全局最优决策树,TR_全球。这棵树是确保全球,因为完整的收集数据的可用性。的作用是一个排名的顺序并选择属性信息增益最高的(18),分裂树节点的决策树。还有其他的增量学习方法尽管增量决策树用于插图。所以对于每个属性的指标和在哪里和,因为属性和的最大数量是迄今获得的最大实例数,是分裂的值。函数试图选择属性最大分裂值,从分割的值来我们已经知道的。这个过程可以确保合成模型是全局最优的完整的数据收集中定义的,它是

对于任何给定的新实例,到达未来的时间,,将它映射到一个预测类诱导模型在哪里是可能的组类指数,。参照的数据已经收集并用于训练到目前为止,诱导模型被建立,目的是最小化分类误差,定义在(4)。的和功能是通用的,这取决于实现和分类算法的选择。一般火车()函数接受两个参数,一个是数据将用于监督学习和是启发式函数用于从数据。的函数产生一个预测结果通过测试应该是全局最优的分类模型对测试样本在时间戳:

现在考虑时间戳的情况,数据积累和分类模型TR_全球被诱导,目前为止一切都很顺利。当新数据到达TR,分类模型_全球现在需要更新重复定义的归纳过程(3)和(4包含新数据),。模型重建所花费的时间只会变得更长和增加。每次它需要加载历史反复。

在挖掘传感器数据,收集到的数据实例是巨大的在体积和生成新的数据被频繁地(在某些情况下像24/7视频监控)。如何有效地跟上最新的模型是一个开放的问题。对于经常更新模型,验算历史数据时,不适用数据存储库包含数百万条记录。某种形式的增量方法是必需的。

为了解决这个增量问题,作者在17)提出了一个替代方法逐步诱导一个分类模型,TR_增加。这种方法也被称为无时间限制的算法在训练数据读取一次只有不存储或重载了。归纳法构建树通过选择一个属性节点划分的估计的充分统计记录每个属性值的计数。这是通过计算霍夫丁绑定()中定义的(5),检查频率属性值的属性将对应于类: 类分布是衡量在哪里和实例的数量被认为是属于一个类。与传统方法不同,属性该方法检查splitting-value提名两个最佳值。在任何时候,我们有最好的价值被称为这样。同样的,第二个最好的价值所以,。选择这两个最佳值增量随着感应和新数据到来。区别这两个最佳值的计算为每一个属性在哪里。为已经观察到的实例数量到目前为止,置信区间计算,HB (5),被称为我们所能确定的有关属性的值去上课。增量,仅仅通过观察置信区间为每个属性作为唯一保留数据,在哪里。为保证一个属性将被提名为节点划分,最低数量的观察样本,是必需的。在观察到的样本,如果不平等适用于,,那么属性被测试是最好的候选人只由统计基于数据流的一部分在整个数据流具有良好的信心。

通过这种方式,我们估计splitting-value的属性,而不需要知道所有属性值来。它因此释放我们从重载的完整数据训练分类模型的增量学习额外的数据什么时候来。诱导模型可用于预测在任何时间以及被训练在任何时候通过调整分裂的统计值。当能够拥抱无限的输入样本数据流,增量学习的目的是使误差最小的优化目标如下:

3.2。增量学习算法作为解决方案

两个主要的增量学习算法设计:基于功能和决策树。前者的算法构造一个黑箱模型,由数字表示重量和系数映射之间的关系预测的输入和输出。两种最流行的基于功能的增量学习算法是KStar和可更新的朴素贝叶斯。

KStar的全称是“基于实例的学习者使用的距离测量。”顾名思义,它逐步学习每个实例的相似度函数,措施之间的距离测试实例和另一个实例。出于信息理论,底层的相似性函数解决了平滑问题,总结在所有可能的决策路径的概率达到良好的整体性能。由于大量的总和所有可能的路径,KStar通常需要较长的处理时间比其同行。算法的细节及其entropy-based距离函数描述的完整(19]。在同一篇文章中,KStar被证明比其他基于规则和基于实例的学习算法使用一些实证数据集。

可更新扩展朴素贝叶斯的著名的朴素贝叶斯分类器,拥抱一个家庭简单的概率分类器基于贝叶斯定理的原则。算法设计与假设之间的具有强烈的独立特性。这种假设的一个优势是,它只需要少量的训练数据来估计均值和方差的特性(变量)计算所有可能结果的概率进行分类。可更新的朴素贝叶斯是相同的朴素贝叶斯算法的在线版本不断更新其调优变量假设它运行;它不断地接收新数据实例和预测目标类基于当前的假设;新实例用于进一步相应更新其假说。

其他主要的算法是基于决策树的。无时间限制的树归纳原则作为讨论的部分3所示。2,几个研究论文的准确性提出了不同的方法来改善VFDT在过去的十年。一些选择算法,加上KStar和可更新的朴素贝叶斯将到实验测试。这样的增量决策树算法在节点分裂测试使用HB所谓霍夫丁树(HT)。

热(18)提出了一个算法产生一些可选的树枝同时,取代这些规则通过可选的精度较低。分类精度已明显改善而建设的学习速度放缓,因为可选的树枝。有些选项是不活跃的分支消耗计算机资源被删除;有些是随机选择的树来加速称为随机霍夫丁树(RHT),等等。ADWIN [20.]代表自适应滑动窗口算法提出了一种解决检测通过观察最近看到更改大小可变的滑动窗口内数据实例。节点分裂值的平均值的变化判断实例可以看到内部的窗口。另一个名为“概念漂移的自适应算法是主动学习策略”还是活跃的(21]。主动学习旨在学习一个精确的模型尽可能的小树枝。众所周知,在数据流、数据流中的数据分布很容易随着时间的不同导致概念漂移,因此需要适应的学习模型重新学习。通常通过不确定数据流学习重点检查实例可以决定边界附近发现。如果发生概念漂移的边界以外的其他领域,学习可能无法适应。主动学习策略使用随机化搜索空间的均匀学习从数据流。与数据流增量学习的另一个挑战是大量的搜索空间(如超平面)的一位代表需要派生特征子集,为高效的模型归纳不引起大延迟高速数据流挖掘。通常的特征的数据量越大,越高基数的维度,搜索空间大,需要很长时间进行处理。接下来的小节处理一些技术特征选择来解决这个问题。

3.3。特征选择的群搜索和皮犬

一种当代的特征选择算法,特别设计的选择最优的子集的一个巨大的超空间称为群搜索功能选择(SS-FS)模型(22]。SS-FS是wrapper-based特征选择模型,保留每个试验的精度分类器由一个候选特征子集,选择尽可能高的健身,认为候选特征子集的选择输出。SS-FS的工作流模型如图6。可以看出迭代操作从一个随机的选择特征子集,继续细化分类模型的准确性通过搜索更好的特征子集,以随机的方式。流使分类模型和最终选择特征子集是收敛的。

包装的分类器作为健身评估者,建议多有用特性的候选子集;优化函数以随机的方式搜索候选人的特征子集。这种方法如果由强力测试所有可能的子集,它将花费很长的时间。有50个特性的传感器数据,有2⁵⁰≈1.1259×10¹⁵可能的反复试验构建分类器。而增加的数据特征,高计算成本加强实例的数量成正比;在数据流挖掘中,传感器饲料可能无穷!

在这方面,称为群搜索使用的搜索策略。测试每一个可能的特征子集,而是群搜索由多个搜索代理启用并行工作能够找到目前最优特征子集。为了缩短搜索过程,加速实现在我们的模型中加入群的初始化步骤中加速搜索,称为加速粒子群优化(阿普索犬)23]。

目标函数的算法搜索空间调整个人代理的轨迹,称为粒子,分段路径形成的位置向量quasistochastic的方式。大量的粒子的运动由两个主要组件组成:一个随机组件和一个确定性的组件。每个粒子吸引对当前全球最好的位置和自己的最佳位置历史上称为“个人最好”,同时它有一个随机移动的趋势。让和是粒子的位置向量和速度,分别。速度矢量的定义在哪里和是两个随机向量,每个条目的值在0和1之间。的参数和是加速粒子的学习参数的典型值吗。一个明显的改进是使用一个惯性函数这取而代之的是惯性的速度矢量函数在哪里定义的在哪里典型值为0.5。这类似于引入一个虚拟质量稳定粒子的运动,所以群搜索可以更快地收敛。

最好使用个人的原因主要是增加多样性质量解决方案;然而,这种多样性可以使用一些随机性模拟。简化版本可以加速算法的收敛性是使用全球最好的。因此,在这个版本的皮犬速度矢量是由一个简单的公式。考虑在哪里是来自替换第二项。现在更新的位置变得简单, 为了加快收敛更快,我们可以定义更新的位置在一个步骤中, 这个简单的版本的位置更新将相同的收敛阶。通常情况下,= 0.1l~ 0.5l在哪里每个变量的规模,而= 0.1 ~ 0.7是满足大多数情况下。值得说明的是速度不出现在(11),没有需要处理的初始化速度矢量除了起始位置必须被正确设置。

为了设置起始位置皮犬必须快速而简单的一些特性以及功能应该被应用。在我们提出的数据流挖掘模型,一个非常简单和有效的特征选择称为聚类系数的变异(闭路)是用于为皮犬找到理想的起始位置。闭路是基于一个非常简单的原则variance-basis发现有用特性的一个子集之间的最优平衡分类模型归纳概括和过度拟合。闭路是建立在一个基本的信念,一个好的属性在一个训练数据集应该有它的数据足够广泛的一系列价值观不同,所以它是重要的”来形容一个有用的预测模型。变异系数(CV)表示为一个实数从−+∞∞,它描述了一组数据的标准差相对于他们的意思。它可以用来比较变化即使单位是不一样的。一般的简历告诉我们关于变化的程度的大小相对于观察,它的优点是变异系数是独立于单位的观察。然而,变异系数是相同的所有数据集的特性,因为它不依赖于标准的计量单位。所以你可以获取的信息数据变化的所有特性,利用变异系数看所有的标准差的比值来表示每个特性。直观地说,如果意思是期望值,然后变异系数测量的预期变化,相对于的意思。 This is useful when comparing measurements across multiple heterogeneous data sets or across multiple measurements taken on the same data set – the coefficient of variation between two data sets, or calculated for two attributes of measurements in the case of feature selection, can be directly compared, even if the data in each are measured on very different scales, sampling rates or resolutions. In contrast, standard deviation is specific to the measurement/sample it is obtained from, that is, it is an absolute rather than a relative measure of variation. In statistics, it is sometimes known as measure of dispersion, which helps compare variation across variables with different units. A variable with higher coefficient of variation is more dispersed than one with lower CV.

让是一个训练数据集向量的实例的值是共有的特征属性或特性。一个实例是一个维元组的形式()。为每一个在哪里,可以分割成不同的类的子组预测目标类的总数。这。考虑

意思是所有的吗属于类的特征值。变异系数的总和为每个类在哪里,特别th特性。变异系数是表示为一个实数来。闭路后计算所需的后续步骤的简历是找一个阈值,以决定哪些特性和功能要保留多少。这个任务背后的基本概念是Bia-Variance困境。一些最近的研究指出,指导学习者的错误分解成偏差和方差方面可以提供相当大的洞察预测学习分类器的性能。

假设目标函数:。然后预期的平方误差固定大小的训练集来自可以表示为三个组成部分的总和:

我们的目标是最小化预期的损失,我们分解成(平方)偏见的总和,噪声方差和常数项。正如我们将看到的,是一个偏差和方差之间的权衡,非常灵活的模型(可能overfit)在低偏压和高方差,和相对刚性模型(下)在高偏压和低方差。为了实现这一偏差和方差之间的最佳平衡,一个简单的则是采用集群技术。它分区数据点为两个集群:一个被保留,另一个被删除。我们的目标是为每个数据点分配集群的成员。聚类算法有助于集群找到理想的职位,最小化的集群数据点到集群质心的距离,与下列目标函数: 在哪里是属于集群的点集吗。聚类算法采用欧氏距离的平方。

给定一个数据集,估计函数。就像前面提到的,增加参数到模型的特性,增加模型的复杂性,方差,而偏见稳步下跌。的功能则是将数据集划分为两组根据变异系数的值。variance-bias是不同的数据点的值在不同的集群,以反映模型的复杂性。众所周知的一个复杂的模型,偏差就越大,反之亦然。所以我们降低了模型的复杂性通过分离方差通过选择一些有价值的属性。两组的总误差:

两组(15)和(16)与数据点代表的组合方差和偏差被选为最优特征子集。快速和有效的业务方法调用HyperPipes [24)是用于这一任务。HyperPipes是一个概率的学习工具,它非常类似于朴素贝叶斯,除了事实没有记录的频率计数属性对应于类。从本质上讲,一个属性对应于一个假设的类或者它不,不管多少次出现这种情况。学习者将记录所有的属性及其对应的类表中的布尔运算。学习者将决定基于类的属性加起来的分数(0,如果它不存在,如果是1)。

4所示。矿业传感器数据流

4.1。评价方法

实验包括两个部分:首先,我们比较两组分类学习方法,传统的批处理学习和增量学习有关分类性能如准确性、卡帕、精度和召回,等等。的名称分类学习算法,以及一个简短的描述如表所示2。两组的选择算法是受欢迎的方法,已经广泛应用在文献中。把被测的数据流挖掘算法主要是继承了霍夫丁原理在不断增长的决策树。此外,两个nondecision树类型的增量学习等可更新朴素贝叶斯和KStar进行比较。其次的定时性能评价两组分类,与精度提高的成本效益的价格额外的运行时间。


传统的分类器	描述

HyperPipe (HP)	对于每个类别HyperPipe构造包含所有点的类别(本质上记录每个类别的属性范围内观察到)。测试实例进行分类根据类别,“大多数包含实例”
Naviie贝叶斯(NB)	朴素贝叶斯分类器使用估计类。数字估计精度值选择基于训练数据的分析。出于这个原因,分类器不是一个可更新分类器(在典型使用初始化与零训练实例)
BayesNet (BN)	贝叶斯网络学习使用各种搜索算法和质量的措施。基类为贝叶斯网络classifierprovides数据结构(网络结构、条件概率分布等)和设备常见的贝叶斯网络学习算法和
决策树(DT)	生成一个修剪C4.5决策树
随机森林(RF)	构造一个随机树的森林
支持向量机(SVM)	libsvm的包装类工具(通常libsvm类的jar文件,需要在类路径中使用这个分类器)
神经网络(NN)	使用反向传播的分类器进行分类的实例。网络中的节点都是乙状结肠(除了当类数字在这种情况下,输出节点成为unthresholded线性单元)

增量式分类器	描述

随机霍夫丁树(RHT)	随机决策树对数据流
霍夫丁树(HT)	非常快的决策树实现使用霍夫丁绑定
霍夫丁选项树(热)	霍夫丁树:单个树代表多个树
NBUpdateable (NBup)	这是朴素贝叶斯的可更新版本。该分类器将使用默认的数值型属性的精度为0.1时buildClassifier叫做零训练实例
活动(AC)	主动学习演化数据流分类器
Adwin (AW)	自适应滑动窗口的方法。该方法是一种改变探测器和估计量。它使一个变长窗口最近看到的物品,随着房地产的窗口有最大长度统计符合这一假说”没有改变窗口”内的平均值
Kstar	是一个基于实例的分类器;也就是说,一个测试实例的类是基于这些训练实例的类相似,由一些相似的功能

实验进行的计算平台上戴尔精度与英特尔至强处理器e5 T7610 PC - 2670 v2(十核心HT, 2.5 GHz涡轮,25 MB)和128 GB RAM。Java开发工具包1.5编程环境。的算法,农业部平台上实现它们。默认参数值设置为所有实验运行。一个公平的评价算法的有效性,10倍交叉验证用于获得一个无偏估计的精度分类模型的性能。数据分为10个相等部分的子集;相同的算法模型的建立10轮,每一轮抽出10子集的训练模型,看不见的数据的性能验证。

4.2。传感器数据分类

传感器数据的实验性能评估4种处理预处理特征选择的方法。第一个预处理没有特征选择我们简单地称之为“原始”意思是传感器数据的原始形式从视频传感器收集的;与Correlation-based特征选择第二种方法是进行预处理,即慢性疲劳综合症是一种流行的数据挖掘方法,第三个预处理是完成群搜索特征选择使用PSO,称为FS-PSO;第四个预处理是一样的第三个方法除了标准PSO是取代了加速算法,称为FS-APSO。

实验进行的特征选择的组合预处理方法和分类算法,从传统和增量学习类型。性能结果收获的准确性,卡帕(Kappa统计),真正的阳性,假阳性,精度,还记得,F-measure,每运行模型建立时间,预处理时间,选择的特征数。结果列在下表中3和4分别对传统分类算法和增量分类算法。选定的一些重要性能指标如准确性、卡帕、真阳性,假阳性的速度、时间和大小选择特征子集分别画在雷达图表数据7- - - - - -12。


传统slassifier /特征选择	精度	卡巴	TP	《外交政策》	精度	回忆	测量	模型建立时间(年代)	预处理时间(年代)	#选择功能

HyperPipe (HP)
原始	77.6822	0.6666	0.777	0.084	0.803	0.777	0.772	0	0	50
慢性疲劳综合症	73.6661	0.6159	0.737	0.078	0.817	0.737	0.733	0	0	23
FS-PSO	78.0264	0.672	0.78	0.083	0.814	0.78	0.774	0	2	36
FS-APSO	78.3706	0.6764	0.784	0.084	0.817	0.784	0.777	0	2	32
朴素贝叶斯(NB)
原始	66.2077	0.5257	0.662	0.085	0.732	0.662	0.68	0.08	0	50
慢性疲劳综合症	69.7074	0.569	0.697	0.08	0.744	0.697	0.707	0.01	0	23
FS-PSO	79.5181	0.6953	0.795	0.076	0.791	0.795	0.789	0.01	9	15
FS-APSO	78.7149	0.6835	0.787	0.079	0.785	0.787	0.78	0	9	12
BayesNet (BN)
原始	82.2146	0.7417	0.822	0.052	0.835	0.822	0.828	0.37	0	50
慢性疲劳综合症	82.7309	0.7459	0.827	0.057	0.828	0.827	0.827	0.04	0	23
FS-PSO	85.0832	0.78	0.851	0.05	0.849	0.851	0.849	0.05	17	25
FS-APSO	86.1733	0.7952	0.862	0.049	0.859	0.862	0.86	0.05	12	19
决策树(DT)
原始	87.4355	0.8147	0.874	0.044	0.875	0.874	0.874	0.2	0	50
慢性疲劳综合症	87.6649	0.8178	0.877	0.044	0.876	0.877	0.876	0.11	0	23
FS-PSO	89.0419	0.8379	0.89	0.042	0.889	0.89	0.89	0.11	36	23
FS-APSO	89.3287	0.842	0.893	0.041	0.891	0.893	0.892	0.07	20.	13
随机森林(RF)
原始	91.1073	0.8654	0.911	0.048	0.911	0.911	0.904	0.21	0	50
慢性疲劳综合症	92.7711	0.8916	0.928	0.036	0.927	0.928	0.924	0.09	0	23
FS-PSO	91.3941	0.87	0.914	0.046	0.913	0.914	0.908	0.08	34	21
FS-APSO	93.4596	0.9024	0.935	0.032	0.934	0.935	0.933	0.11	31日	13
支持向量机(SVM)
原始	75.2151	0.5961	0.752	0.155	0.678	0.752	0.659	2.05	0	50
慢性疲劳综合症	75.961	0.6123	0.76	0.143	0.742	0.76	0.678	0.96	0	23
FS-PSO	76.0757	0.6145	0.761	0.141	0.738	0.761	0.682	0.39	349年	14
FS-APSO	77.2806	0.6359	0.773	0.133	0.748	0.773	0.706	0.42	296年	13
神经网络(NN)
原始	90.0172	0.8512	0.9	0.042	0.898	0.9	0.897	24.44	0	50
慢性疲劳综合症	89.0419	0.8369	0.89	0.041	0.889	0.89	0.888	8.35	0	23
FS-PSO	89.2714	0.8403	0.893	0.043	0.889	0.893	0.89	14.71	5212年	35
FS-APSO	90.3614	0.8565	0.904	0.04	0.901	0.904	0.901	12.49	4685年	32


增量分类器/特征选择	精度	卡巴	TP	《外交政策》	精度	回忆	测量	模型建立时间(年代)	预处理时间(年代)	#选择功能

随机霍夫丁树(RHT)
原始	61.1589	0.4226	0.612	0.158	0.607	0.612	0.589	0.02	0	50
慢性疲劳综合症	57.0281	0.3233	0.57	0.245	0.522	0.57	0.523	0.01	0	23
FS-PSO	72.8055	0.5749	0.728	0.143	0.658	0.728	0.68	0.01	5	24
FS-APSO	74.4119	0.5923	0.744	0.142	0.665	0.744	0.681	0.01	5	16
霍夫丁树(HT)
原始	75.6741	0.6309	0.76	0.113	0.725	0.76	0.735	0.35	0	50
慢性疲劳综合症	76.2478	0.6402	0.763	0.103	0.735	0.763	0.745	0.08	0	23
FS-PSO	67.9289	0.5569	0.719	0.153	0.669	0.719	0.677	0.03	16	16
FS-APSO	76.7068	0.6457	0.767	0.104	0.739	0.767	0.747	0.03	15	15
霍夫丁选项树(热)
原始	66.2077	0.5262	0.662	0.085	0.732	0.662	0.68	0.2	0	50
慢性疲劳综合症	69.5927	0.5674	0.696	0.081	0.742	0.696	0.706	0.04	0	23
FS-PSO	77.7395	0.6657	0.777	0.09	0.763	0.777	0.762	0.02	11	13
FS-APSO	78.8296	0.6856	0.788	0.077	0.788	0.788	0.782	0.02	10	13
NBUpdateable (NBup)
原始	66.3798	0.5281	0.664	0.085	0.733	0.664	0.682	0.07	0	50
慢性疲劳综合症	69.5927	0.5676	0.696	0.08	0.743	0.696	0.706	0.02	0	23
FS-PSO	76.9363	0.6588	0.769	0.082	0.768	0.769	0.764	0.01	9	15
FS-APSO	78.7149	0.6835	0.787	0.079	0.785	0.787	0.78	0.01	12	12
活动(AC)
原始	67.7567	0.5387	0.678	0.092	0.719	0.678	0.694	0.17	0	50
慢性疲劳综合症	69.2484	0.5554	0.692	0.092	0.718	0.692	0.702	0.12	0	23
FS-PSO	68.0436	0.5342	0.68	0.105	0.703	0.68	0.689	0.17	55	18
FS-APSO	70.2238	0.5647	0.702	0.095	0.72	0.702	0.709	0.14	50	20.
Adwin (AW)
原始	72.9776	0.6035	0.73	0.091	0.735	0.73	0.731	1.55	0	50
慢性疲劳综合症	73.3792	0.6101	0.734	0.088	0.74	0.734	0.732	0.44	0	23
FS-PSO	70.0516	0.5566	0.701	0.118	0.71	0.701	0.698	0.47	176年	13
FS-APSO	74.5267	0.619	0.745	0.099	0.743	0.745	0.732	0.38	142年	10
Kstar
原始	82.1572	0.734	0.822	0.085	0.834	0.822	0.818	0	0	50
慢性疲劳综合症	90.0746	0.8536	0.901	0.038	0.902	0.901	0.9	0	0	23
FS-PSO	94.0333	0.9117	0.94	0.026	0.94	0.94	0.94	0	2121年	12
FS-APSO	95.9266	0.94	0.959	0.014	0.959	0.959	0.959	0	1817年	9

4.3。讨论的结果

雷达图表被放置了7传统分类算法在右边的图,左边的7增量算法,方便比较。定义的准确性措施是正确分类的实例数量在总在传感器数据实例。传统算法,在批处理的情况下学习的精度正确分类实例的比率在99000年所有的实例。在增量学习的情况下,精度是衡量平均每个数据段的所有中间精度造成了一系列的测试。在图7总体精度略高于传统的分类算法的增量算法:平均准确率为82.98296%传统增量为74.08409%。表现最好的是神经网络和KStar。性能一般为原始的预处理方法和Cfs由FS-PSO和FS-PSO表现。一般慢性疲劳综合症持续提供改善准确性对传统算法,虽然略。然而Cfs的增量算法并不总是提高准确性。这可能是由于这一事实对象和属性之间的相关性的计算增量机制不适合非平稳的数据,反之亦然。群搜索类型的特征选择(FS)一致优于Cfs。FS的改善最明显的NB, RHT,热,NBup, KStar算法。这些算法有一个共同的现象,他们的模型结构松散是由大量的数值变量。热,RHT例如,决策树在多种形式,收集池候选人在诱导过程中可能的模型。 NB, NBup, and KStar are represented by a large number of conditional probabilities and statistical variables. These models are relatively loosely defined; hence the stochastic search by PSO is appropriate and effective in finding the optimal feature subsets leading to a big leap in performance improvement. The proposed new version of APSO for Swarm Search, namely FS-APSO nevertheless shows its superior respective to performance improvement over the standard PSO version by FS-PSO. FS-APSO is better than FS-PSO in all cases except NB. Moreover, for HT, PSO has very poor performance in upholding the accuracy whereas APSO solved the problem. By far, FS-APSO has shown the maximum accuracy improvement compared to original and Cfs, indicating that FS-APSO would be a feasible feature selection scheme for the other family members of Hoeffding tree. When it comes to performance indicators like Kappa and True Positive rate, the algorithms show similar patterns as described above in Figures8和9分别。假阳性率也称为假警报率在机器学习是一个不受欢迎的特性。图10显示与Cfs RHT发生误警率最高,推断correlation-based人选的特征选择对数据流挖掘尤其是当许多随机树是在运行时生成。FS-APSO设法平息了假警报率在所有情况下。KStar特别是非常好用,FS-APSO能够维持最低的误警率。

选为最佳的特性子集的不同组合算法如图12。可以看出FS-APSO只能够维持最少的功能是足够重要诱导分类模型在大多数情况下最高的精度。随后FS-PSO皮犬的标准版功能同样可以选择少于Cfs除了NN, BN和惠普。少数量的特性选择可能意味着简单部署传感器数据的分类或预测,不需要使用一系列完整的特性,这些特性可能需要一定的处理资源和感知能力。换句话说,它将成本效益如果少特性还需要能够获得一个好的传感器数据分类的精度水平。

最后,运行时的因素被认为是与其他精度性能。图11显示了一个比较预处理时间发生不同混合的特征选择和分类算法。Cfs需要几乎没有时间虽然Cfs的确是一个好处是表现不佳的精度等性能指标。通过比较只有FS-PSO和FS-APSO本质上是随机的,他们需要花时间去寻找最优特征子集,这是有趣的观察更有效率。FS-APSO precalculating合格的特性所带来的好处,很快通过闭路,最初开始搜索的位置,缩短了运行时在所有情况下(NBup除外)FS-PSO相比。惠普是令人惊讶的快速FS-PSO和FS-APSO,其次是RHT在相对较短的时间内完成预处理。KStar、神经网络、支持向量机和交流但是需要相对的两种类型的FS最长的预处理方法。通过粗略的结果在图11可以看出,传统的群分类的预处理算法花费的时间稍微超过增量群算法在数据流挖掘。这可能解释的本质的传统分类器嵌入到群搜索作为一个健身评价函数是固定数据耗时。另一方面,增量算法,我沿着数据流作为适应度函数执行时更快,因为它的增量。

为了有一个公平的比较,本文提出了一个名为获得的新指标。只是性能提升的因素,考虑到增加的准确性(准确性与特征选择%,准确性%的原始)在预处理的秒数。理想情况下我们支持与高增益的组合算法,这意味着它可以产生精度最高的增加而导致时间最短的预处理。比较不同组合的算法,针对这个增益指标,计算每个人的增益值和列在下表中5。


	FS-PSO	FS-APSO

传统的分类器
HyperPipe (HP)	0.1721	0.3442
朴素贝叶斯(NB)	1.4789333	1.3896889
BayesNet (BN)	0.1687412	0.3298917
决策树(DT)	0.0446222	0.09466
随机森林(RF)	0.0084353	0.0758806
支持向量机(SVM)	0.0024659	0.006978
神经网络(NN)	−0.0001431
平均:	0.2678793	0.3201961

增量式分类器
随机霍夫丁树(RHT)	2.32932	2.6506
霍夫丁树(HT)	−0.484075	0.0688467
霍夫丁pption树(热)	1.0483455	1.26219
NBUpdateable (NBup)	1.1729444	1.027925
活动(AC)	0.0052164	0.049342
Adwin (AW)	−0.016625	0.0109092
Kstar	0.0055993	0.0075781
平均:	0.5801037	0.7253416

因为它是表所示5,最高平均获得的增量学习算法加上FS-APSO(0.7253),其次是相同的增量与FS-PSO组(0.5801),然后用FS-APSO传统算法(0.3202)和传统组FS-PSO去年(0.2679)。分别获得最大的性能是由RHT结合FS-APSO。RHT和FS-APSO雇佣大量的随机函数,但他们相互赞美。NN反过来至少获得了机器学习中它有严格的机制来调整其内部权重和激活函数。

总而言之,这是最可行的利用数据流挖掘的新提议FS-APSO,尤其是RHT算法。或者,NB, DT,射频不错的选择正在考虑他们的相对较高的准确性和适度的预处理。

5。结论

只要一个传感装置的操作,它收集了大量的数据流。最新数据被生成的时刻,它需要一个增量计算能够动态地监控大规模的数据。因此,数据挖掘的算法设计传感器应用程序时应考虑一个轻量级的增量算法的鲁棒性,高精度和最小预处理延迟。在本文中,我们调查的可能性,使用一组增量分类算法分类收集的数据流从视频传感器的手势识别。作为一个案例研究的实证数据流是使用捐赠的一个研究小组从Madeo等人的研究团队在圣保罗大学,巴西。收集的数据是视觉反馈的视频被微软Kinect传感器组成。视频数据转换为50数值变量与人从视频中提取出手势,针对学习手势分割初始阶段。我们比较传统的分类模型诱导和增量的计数器部分归纳。特别是我们提出了一个新的轻量级的特征选择方法通过使用群搜索和加速PSO,这应该是适用于数据流挖掘。评价结果表明,增量的方法获得了更高的增益精度每秒产生的预处理。 The contribution of this paper is experimental insights for anybody who wishes to design a similar gesture recognition application from video sensors in choosing the appropriate decision support algorithms especially in scenario of mining activity patterns that are temporal and streaming in nature. In the future, we will want to extend the data stream mining of such sensor data with extra capabilities of sensing more complex gestures for richer information in the experimentation.

利益冲突

作者宣称没有利益冲突有关的出版。

引用

n . Kiryati t·r·雷维夫y Ivanchenko,和s . Rochel“实时运动检测异常监控录像,”19国际会议的程序模式识别2008年12月,页1 - 4,。视图:谷歌学术搜索
李y, j·鲁伊斯,和e .平直的“移动交互,用户定义的运动姿态”学报》第29届太极拳年会在计算系统人为因素(CHI的11)206年,页197 -温哥华,加拿大,2011年5月。视图:出版商的网站|谷歌学术搜索
k . m . Culhane m·奥康纳·d·里昂和g·m·里昂“加速度计在老年人康复医学,”年龄和衰老,34卷,不。6,556 - 560年,2005页。视图:出版商的网站|谷歌学术搜索
j·w·李,a·希拉勒、y Sung)和k .曹”上下文驱动的控制算法可伸缩的模拟智能家居的人类活动”学报第十届IEEE国际会议上无处不在的智能和计算(UIC 13)和10日IEEE国际会议上自主和可信计算(ATC 13)2013年12月,页285 - 292。视图:出版商的网站|谷歌学术搜索
l . Cheng冰雹,d .梁f .粉丝,y,和z,”一个实验研究运动训练的运动传感系统,”学报》第五届欧洲无线传感器网络会议(EWSN ' 08),博洛尼亚,意大利,2008年。视图:谷歌学术搜索
y唱k .秋,“协作编程演示在虚拟环境中,“IEEE智能系统,27卷,不。2、14 - 17,2012页。视图:出版商的网站|谷歌学术搜索
k曹,h曹,Kyhyun,”推断随机正则文法与近似人类行为识别的信息,”图像分析和识别的国际会议(ICIAR 06年),第204 - 193页,2006年。视图:谷歌学术搜索
微软“Project Natal 101年”,2009年。视图:谷歌学术搜索
h·杨,美国方、g .太阳和r . Wong“快速的实时数据挖掘决策树算法不完美的分布式无线传感器网络中的数据流,”国际期刊的分布式传感器网络文章ID 863545卷,2012年,16页,2012年。视图:出版商的网站|谷歌学术搜索
h·杨,美国方、r . Wong和g .太阳”优化分类决策树通过使用加权朴素贝叶斯预测降低无线传感器网络的类不平衡问题,“国际期刊的分布式传感器网络460641卷,2013篇文章ID, 15页,2013年。视图:出版商的网站|谷歌学术搜索
r·c·b·Madeo c . a . m .利马和s·m·佩雷斯”姿态单元分割使用支持向量机:分段手势从静止位置,”28届ACM学报》研讨会上应用计算(SAC的13)2013年3月,页46 - 52点,。视图:出版商的网站|谷歌学术搜索
r·c·b·Madeo p·k·瓦格纳,s·m·佩雷斯”的手势时序方面的分析应用于语篇分析和自然对话,”国际计算机科学与信息技术杂志》上,5卷,页1 - 2013。视图:谷歌学术搜索
r·c·b·Madeo支持向量机和姿态分析:[硕士将时间方面论文)、圣保罗、圣保罗研究员基金会,圣保罗,巴西,2013(葡萄牙语)。
l . Rokach和欧迈”,自上而下的决策树归纳classifiers-a调查,“IEEE系统,人与控制论C部分:应用程序和评论,35卷,不。4、476 - 487年,2005页。视图:出版商的网站|谷歌学术搜索
c . c . Aggarwal Ed。数据流:模型和算法施普林格,卷。31日,2007年。
r·昆兰C4.5:机器学习项目摩根考夫曼,旧金山,加州,美国,1993年。
p·多明戈和g . Hulten“矿业高速数据流”学报第六届ACM SIGKDD国际会议上知识发现和数据挖掘(KDD ' 00)ACM,页71 - 80年,纽约,纽约,美国,2000年。视图:谷歌学术搜索
b . Pfahringer、g·霍姆斯和r .——“新选项霍夫丁树”澳大利亚联合会议上人工智能学报》上,页90 - 99,黄金海岸,澳大利亚,2007年12月。视图:谷歌学术搜索
j·g·克利里和l . e .区格”K^∗:一个基于实例的学习者使用的距离测量,”第12届国际会议上机器学习学报》上,第114 - 108页,1995年。视图:谷歌学术搜索
a . Bifet和r . Gavalda学习从图示数据自适应窗口《暹罗国际会议数据挖掘,第448 - 443页,2007年。视图:谷歌学术搜索
Žliobaitė,a . Bifet b Pfahringer, g .福尔摩斯“主动学习和发展中的流媒体数据,”机器学习和数据库知识发现:欧洲会议(ECML PKDD”11),雅典,希腊,9月5 - 9,2011卷,6913在计算机科学的课堂讲稿施普林格,页597 - 612年,柏林,德国,2011年。视图:出版商的网站|谷歌学术搜索
方,s . Deb X.-S。杨,j .李“Metaheuristic群搜索特征选择在生命科学分类,“IEEE它专业杂志,16卷,不。4,24-29,2014页。视图:谷歌学术搜索
X.-S。杨、s . Deb和美国方”,加速粒子群优化和业务优化和应用支持向量机,”网络数字技术:第三个国际会议,2011年无损检测,澳门,中国,2011年7月11 - 13日。诉讼卷,136页53 - 66,施普林格,柏林,德国,2011年。视图:出版商的网站|谷歌学术搜索
i . h .威滕·e·弗兰克,数据挖掘:实用机器学习与Java实现的工具和技术,2005年摩根考夫曼。