文摘

本文提出了一种新的方法来识别人类活动基于加权分类特征提取的人体。为此,新特性取决于体重是从图像或视频中使用的提议描述符。人类构成中扮演一个重要的角色在提取特征;然后这些功能是用作重量输入分类器。我们使用机器学习在两个步骤的培训和测试的标准数据集的图像可以用于基准测试系统。不同于以往的方法,需要大小或形状的长度主要代表提示使用机器学习时认识到人类活动,准确的实验结果来自人体的适当领域证明了提出方法的价值。十二个活动是用于挑战的可用性与数据集来演示我们的方法。结果表明,在训练集我们实现了87.3%,而在测试集,我们实现了94%的精度。

1。介绍

在信息技术(IT)的时代,承认人类活动在许多应用程序中发挥着重要作用和研究电脑。最近,机器学习的目的是将人体的特点,分析它们,然后提取信息数据实现的现实活动。每个人类活动都有某些特性,表明它的类型。因此,自动学习的重量主要取决于这些特性来分类的这些特性,从而获得正确的检测活动。

人类活动识别(HAR)使用视频和图像已广泛开展特别是由于灵活性1]。总之哈尔在静态图像得到的关注更少,因为错过了之前的信息处理过程中,图像的性质。因此,图像有固定和严格的信息很难处理(2,3]。处理任何HAR系统所需的信息提取图像和视频,和之前需要做预处理实现获取先验知识预先考虑特征提取。然而,地面实况哈尔认为相关视频和图片和具有挑战性的一个是形象;和已知的视频主要由一系列图像,predata和postdata提供提取。哈尔的主要目标系统,使用图像或视频是开发一个自动渲染系统收集的数据来精确判断人的行为。哈尔是有用的在一个广泛的应用,特别是在适当的实现适合人机接口(4]。哈尔方案主要是用于应用程序的使用监控安全系统的自动化。

每个HAR系统需要一个分类器分类活动的特性检测,和支持向量机在这方面是一个最好的分类器由于其容易使用和可靠性,可以改进它适合该方法。

系统处理模式识别必须由不可避免的阶段的准备阶段(降噪和增强),分割(或分区),特征提取,分类(5]。在图像,噪声去除是必要的,和许多技术建议等文学模糊系统相关图像和值得解决6]。分割对图像分割也很有用的视频或图像本身,机器学习取决于人体特征提取,为了提取数据,我们必须首先段人类的形象因为细分给系统机器学习算法可以理解的观点。(7]。机器学习应该提取重要特征的分类器,将数据估计在机器学习;另一个继承subinformation内将派生,8]实际上选择最佳特性考虑的主要问题,以控制HAR系统并使系统有用的或不9,10]。

最近,许多分类器已经被提出,准确地为实时应用程序开发,实现好的结果(11];大多数的这些分类器是数学和著名的一个是支持向量机(SVM)也将在深度开发。除了等分类器再(资讯)和线性判别分析(LDA)执行好人类活动的分类12,13),实时应用需要高响应时间是合适的;几个分类器大特性用于他们的流程来实现准确的结果。一般来说,系统处理模式识别或分类包括三个主要步骤:预处理,特征提取,最后通过合适的分类器分类(10,14]。

分类的目的是认识到人类活动行为;在这方面理解运动的人类理解和执行所有活动是必要的。哈尔系统应采取的实际分析每个动作响应。有时人体需要的形状特征的形状不容易理解由于相似的两个活动,比如走路和跑步,在人体需要最有可能相同的位置和形状。图1描述了每个操作的可视化的活动比如跑步、散步、和其他活动,所以人体很容易检测到的一部分,而其他部分则难以检测的一些活动。一些运动活动等特殊领域难以检测的微笑,哭泣,或悲伤;因此一个频域(DT或CWT过滤器)需要特征提取(15,16]。

视频和静态图像本文的两个主要领域关注;具有挑战性的一个静态图像;因此,该方法将有助于这两个视频和图片。由于活动从单一或静态图像的识别实际上有些忽视了先验知识,结果将更加困难。为此,现有的方法改善,导致这方面(17]。提取特征分类的人类活动可以是硬件和软件。硬件使用可穿戴传感器来检测活动(18,19),而在编程工具软件使用提取功能。图2说明了上面提到的两个不同的领域。

最近,视频监控摄像头已广泛应用在户外和室内出于安全考虑,在许多领域:工业、医学、教育等等,camera-produced视频需要处理电路来处理它(外20.]。大多数的图像需要减少噪音,这被认为是预处理阶段准备提取有用的数据;提出了许多算法降噪在文献[21]和准备使用的图像没有贡献。

哈尔是一个重要的话题;因此介绍了许多调查和发表9,22]。一些调查论文分为分类和聚类的活动,而其他人认为特征提取与类型;无论如何他们中的大多数介绍详细的HAR系统作为一个大问题,因为哈尔系统复杂是因为包括许多必要的阶段。中最重要的研究文献考虑哈尔的应用系统,我们可以把它应用在不同的生活领域23]。

哈尔系统包括三个主要阶段:准备阶段、特征提取阶段,分类阶段。深度学习如今被广泛传播,成为必要的由于其在许多现代应用程序中使用。哈尔系统深入学习算法中使用,如任何系统学习了机器对人类有影响工作,旨在利用计算机器完美的来源。预测未来的结果是必需的,因为每个系统的参数,成为必要的控制增加了深度学习,如交通流量拥塞(24,25]。机器的自动化行为已成为值得在这个世界上,所以机器学习是重要的,恰逢中国等一些国家的经济发展26]。

2。文献综述

许多研究人员提出了不同的技术在文学。我们目前最重要的研究领域的机器学习。复杂的特征提取采用端到端的机器学习和多通道时间融合在智能手机27]。基于可穿戴传感器提出(HAR方法28)和堆叠autoencoder用来提取人体的强大的功能。移动边缘计算视频但是用逐帧图像,传感器的多功能模拟智能手机从人体识别活动收集信息在医疗问题29日]。单眼图像提取视频在3 d和2 d对验证的活动提出了(30.];作者使用了两个参数仍高,视频图像。随机森林模型,提出了提高深层学习,和40活动是公认的具有良好性能的HAR系统[31日]。

3所示。哈尔系统机器学习

获得的数据收集等各种类型的嵌入式视觉传感器;数据分析在预处理阶段。信息来自设备分为两类;数据来自视觉传感器像相机或可穿戴传感器;每个类别之间有不同的预处理;数据从传感器需要降低噪声,提高图像分割在所需的数据来自相机(13]。简单的架构见图3展示了主要的数据录入到系统与相关预处理操作。

3.1。收集数据

信息处理HAR系统包括两类:第一个是基于传感器的HAR系统和第二个系统是基于视觉的HAR。一个可以预先确定一组n活动和行为一个;那么下面就可以指出: 和多组传感器是用来测量属性的数量年代k间隔的时间序列= (t一个, ),因此这些活动可以获得:

哈尔系统的目的是找到分区的时间如(0,1、…r−1)和属性的列表年代;类集合将描述在每次活动分区k,时间可以被定义为的集合

基于视觉HAR取决于传感设备技术像CCTV和具有录音功能的相机记录的人类活动32]。在这种方法中,它不需要可穿戴传感器或智能手机,但主要取决于从相机拍摄的图像质量。质量的图像是由图像分辨率,照明变化和环境照明。收集的数据像序列图像或音频信号或计算机视觉。收集数据后,他们将通过过程,如特征提取、建模与细分活动,然后分类和跟踪活动。

3.2。机或基于深度学习的HAR

信号处理技术已经使用了很长一段时间来分析收集的数据从传感器33]。这种方法实现执行从视频或图像预处理和提取工程特性;接下来,提取特征训练机器学习(ML)分类算法来决定活动(26]。一个简单的分类方法使用逻辑回归来分配下的概率公式表现一样分类模型:

提取特征工程将手动分析选择合适的特征,然后将实现减少特征空间。深度学习已经成为一个有趣的研究课题在过去几十年;那么它将处理人类在不同的研究领域包括哈尔系统性能。对传统ML,执行正常的特征提取与大型数据集和实时HAR HAR系统,但系统需要改善和提高效率。有不同的术语和机器学习和深度学习的特点,它在桌子上1。拟议的HAR系统依赖于机器学习和满足其条件和要求25]。

其他分类器被用于HAR系统如朴素贝叶斯但操纵的能力增加的特性和分类器本身不好很难修改的新类型的特性。决策树分类器不能与深度学习的自适应方法由于深度学习改变运行系统和自适应处理的过程是必要的。分类器的最大问题是特征提取和什么样的处理这些特性要求。

3.3。学习HAR系统

有一个指数级增长使用HAR系统近年来;变得更加简单和高效的数据流程,学习算法涉及收集与分析数据的改善和发展,模式识别,和有用的特性美联储ML算法的系统(34]。

许多算法中引入文学领域的ML和他们通常分为以下几类:(1)分类算法:用朴素贝叶斯决策树算法(2)规则提取算法:算法处理先验知识(3)聚类算法:如k - means算法和EM算法(4)特殊支持向量机:定义为SVM算法的改进(5)神经网络与隐层(6)遗传算法

HAR系统分类的一个重要阶段,在本文中使用一种改进的支持向量机分类器对活动进行分类。使用这种分类器的优点之一(支持向量机)是灵活和可展(35]。支持维克多分类向量训练 两类或类和向量 ,所以我们可以定义的原始问题:

实际上,这个向量的真相 和训练是向量x它映射

提高SVM分类器,首先有必要玩因素的分类器,找到所需的新路径的算法可以适应的结果。有线性和非线性分类器;定义为简单的线性支持向量机(x,y),= 1,…,Nx= (x1,x2、…x)的属性th样本;如果考虑 ,这类标签,然后决定将

权向量,b是偏见,培训是线性分离时,坐标( ,b)将被定义为 和线性分类器的功能是定义如下:

所以,在训练对于一个给定的数据集来决定的th平面的样品x当定义飞机( ,b)可以被定义为

函数幅度给定图像数据集在训练决策边界,由两条直线缺口被称为幅度和宽度的利润控制至关重要的是,宽度定义为 在方程(9)。

减少保证金使分类更准确和分类器必须优化如下给出信息。

控制 ,b,

最小化后,将函数

3.4。非线性HAR系统

在拟议的方法中,需要得到最优超平面定义为最大化泛化。问题是当培训收益数据分离不是线性运行线性分类器时这意味着它不能达到良好的效果。由于特征空间映射为高维不允许执行分类器。由于这个原因,该方法提供了有效的方法来解决高维空间称为内核技巧(36]或加权特性。当线性系统取决于点积,开发分类器是内积核函数训练数据。在这方面,该方法的目的是找到一个1、…一个n在以下方程:

这是最大化的一个因素,因为

因此,分类器可以应用通过以下方程:

对于给定图像数据集提供了一些活动试图训练系统使用六个活动改进分类器进行分类。系统可以运行更多的通过培训活动;然后继续测试系统。加权特征提取也作为分类的因素

向量的加权特征变量和跳活动x。体重在一个活动不同于其他二人体重的性质,该方法与特性作为人体和终端之间的角度像手臂,腿,等等。

4所示。方法和讨论

在每个HAR机器学习系统存在三个主要阶段,预处理,特征提取,最后分类是我们的主要关切。照片从相机或扫描仪等不同来源被认为是作为哈尔的输入系统。两个有趣的数据集使用如INRIA和k从公共领域的六个活动散步、跑步、慢跑、拳击、鼓掌,挥舞着。图像正常化识别率估计的大小。识别率可以由以下公式计算:

任何HAR模型由阶段如图4

系统从图像来自标准数据集包含活动1580多场,每9行动。该方法通过设计算法来自动分析活动减少人类的努力,得到即时响应。

该方法的示意图如图4,包括图像的分割的预处理阶段。这个阶段有时被称为准备阶段准备给下一步图像的属性;这个阶段必须考虑作为一个重要的阶段,因为在这里处理决定是否提取适当的特性。任何错误在这个过程中可以破坏系统,不得给准确的结果。一些图像与噪声来自数据集或浮游生物;摆脱这种噪音,一个功能强大的表达如方程(16)需要使用。 在哪里年代xy代表邻居像素的图像的大小(×N)相应的坐标(x,y);Id代表剩余的灰度值等 检测尺寸。

一些图像有噪声,有些没有,但大多数是清晰的图像;我们应用的降噪系统的完整性。另一个问题在制备步骤细分;在这个过程中,有两个条件的行为;首先是背景减法这意味着我们提取所需的前景对象,在我们的情况下,人体,通过从图像背景减法得到人类的形状;这个过程是产生应用方程表达式(时17)对于一个给定的图像。

另一段类型考虑图像的一部分,关系的对象(人体)图像环境;这个过程变量从一个哈尔系统到另一个,大多数研究在文学这个阶段。过程在此阶段提供了下一阶段的行动,这是特征提取阶段。

特征提取收益取决于它的重要性,任何分类特征提取除了分类器无法达到的任何结果向量的特征。特征提取对象本身和每个部分的位置。图5显示人体将在给定的图像分割。

信息提取部分图像存储的矢量f(µ)= {µ1,µ2、…µn},µ数据从一个段。适用于一个活动自动适用于什么其他活动。

其他特性提取使用三角形扫描所有图片叫做三角形的特性,和三角扫描应用灵活,可调整大小的除了旋转情况如图6

三角形可以扫描所有的图像从左上角开始了对每一步的360度旋转。其他功能的角度垂直高度与地面物体的地平线,三角形的角度,垂直高度也存储在向量后分类的分类器。

该方法,小说从人体特征提取,然后他们的重量用于非线性分类器,如改进的支持向量机。功能控制分类器的结果;当得到某些结果,安排的特性开始改变根据他们的重量,和变化的权重发生在训练迭代分类器。在图像的分割成亚节部分,系统检测是否有人体的一部分。作为人体器官改变立场的活动中,我们可以发现新的相应位置,如图7

5。结果与讨论

两个有趣的数据集被用来评估该方法,从公共领域。数据集使用k和法国都有六个活动,行走,跑步,跳跃,拳击,挥舞着,鼓掌。八个场景包含内部的活动。该方法中使用的图像是第一个规范化64×128像素,与正面考虑挥舞着鼓掌,而剩下的侧面是活动。选择这六个活动由于其流行的静态图像数据集。

非线性支持向量机分类器是用于获取高精度识别率从图像中提取动态特性时考虑。一些活动,如散步、跑步,慢跑得到高至于识别率结果由于特征提取的角度直接与这些活动受到影响。当其余的活动更少的识别率,因为这些活动的性质,功能获得此类活动的减少。该方法的适用性与在线识别率和时间是有限的计算通过运行比别人长。该方法可以得到准确的结果在静态图像没有在线处理利用提出了功能的丰富性。该方法获得高识别率的87.3%;它的比例是正确的分类错误的一个和哈尔系统中被认为是一个好的结果。在静态图像,这个结果被认为是高之前由于缺乏可靠的信息在静态图像,它不像视频,可以依靠以前的信息,如前一帧,这当然会改变结果。

数据表2被称为监督方法的混合矩阵。结果描述在混淆矩阵表明,一些活动获得更多利益如散步,跑步,慢跑,因为改编的建议功能(角度),所以该系统能够识别他们完美。

该模型在特征提取主要关注胳膊和腿与身体垂直的方向。相比之下,其他活动如鼓掌并挥舞关注三角形源自于手臂和腿。

培训体系与收集数据集六活动达到可接受的结果当使用改进的SVM分类器与现有方法相比。

该方法允许评估系统的精度为6个活动使用两个数据集评估活动之间共享这些数据集站在一起。训练系统得到了很好的响应时间但延迟发生在改变图像灰度其次是降噪和分割。培训还取决于数量的图像数据集内;培训与过程样本已知的活动将被数据集;当完成训练,从测试开始未知的图像根据特征向量属于一个特定的类。功能是输入到分类器通过执行分析以下方程: 在哪里 对所有类= 1,2,…n

每一个x真正的n维的矢量和y显示功能是否属于= 1,否则=−1,这意味着两个类A和B在这种情况下分为数据分开。在机器学习分类决策规则将创建 分类某些X属于一个类。观察训练集收益率建立规则的培训。预测阶段,也称为测试阶段,需要给定的图像和流程应用机器学习在训练集。该系统将比较从给定的图像特征提取与特征提取在训练过程中找到合适的匹配或接近总统认识到活动。训练和测试模式呈现在图8

许多功能强大的功能支持的建议被认为是哈尔系统。大多数研究改进和加强在这一节,因为这部分仍然需要改善的额外数据集使用限制使用的功能根据图像本身内部的对象的本质。使用准确的分类也有助于实现良好的结果在某种程度上用该方法适应它。

6。结论

我们报告一个哈尔机器学习系统能识别人类活动,如散步、跑步,慢跑,散步,鼓掌,挥舞着。该系统主要由三个主要阶段,预处理,特征提取,分类。我们的贡献是系统集成的最后两个阶段。的机器学习分类器视为哈尔的核心系统,改进在这种背景下产生良好的结果。新建议等功能角度来自三角形和人体与地平线垂直HAR系统中起着重要的作用。拟议的HAR系统取得了良好的结果在识别率方面通过分类活动和准确性,而在这项研究中没有考虑实时响应。

数据可用性

两个标准数据集被用于拟议的系统,每个都有超过890个可用的图像,识别六个活动。两种类型的特性来自人体通过角度用于运行支持向量机分类器。提高支持向量机分类器的数学问题是有助于改进系统。中使用的图像的HAR系统采用标准化规模24×128像素。

的利益冲突

作者确认没有利益冲突有关的出版。