CIN 计算智能和神经科学 1687 - 5273 1687 - 5265 Hindawi出版公司 647858年 10.1155 / 2011/647858 647858年 研究文章 Accelerometry-Based使用马尔可夫模型分类的人类活动 Mannini 安德里亚 萨巴蒂 安吉洛玛丽亚 Babiloni 法比奥 师范学校Superiore桑特的安娜 广场一些Martiri德拉位33 国际学生评估项目56125上 意大利 sssup.it 2011年 4 9 2011年 2011年 25 02 2011年 17 05年 2011年 29日 06 2011年 2011年 版权©2011 Andrea Mannini和安吉洛玛丽亚萨巴蒂。 这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。

加速度计是一个受欢迎的选择体运动传感器:原因是部分提取有用信息的能力自动推断人类主体参与的体育活动,他们的角色在旁边喂生物力学参数估计。自动分类的人类体育活动是极具吸引力的普适计算系统,而语境意识可能缓解人机交互,在生物医学,而可穿戴传感器系统提出了长期监测。本文涉及执行所需的机器学习算法的分类任务。隐马尔可夫模型(HMM)分类器通过对比研究了高斯混合模型(GMM)分类器。摘要结合上可用的统计信息运动动力学分类过程,没有丢弃时间的历史之前的结果gmm一样。统计获得杠杆的好处的例子说明和讨论通过分析加速度计时间系列的两个数据集。

1。介绍

许多技术的应用可以大大受益于可用的系统能够自动分类的特定的人类体育活动。摘要静态姿势,例如,站着,或动态运动,例如散步,身体活动包括在术语。的上下文感知来自这方面的知识( 1)可能有助于改善医疗监控设备的性能或促进的发展先进的人机接口。事实上,执行的精确的活动主题有助于定义的上下文可以进行进一步的评估。例如,考虑的问题估计人类主题的代谢能量消耗通过间接方法( 2:据报道,这些方法产生严重的估计错误没有任何信息的情况下的特定的功能任务所涉及的主题是( 2, 3]。在机器人技术,多个应用程序,尤其是在康复工程、需求的一些功能的机器人控制器识别用户的意图。特别是智能支持系统已经开发出来走到协助马达削弱人在他们的努力和老人站立和行走 4, 5)或检测用户的步态不稳定( 6, 7和减少跌倒的风险 7]。

原则上,可穿戴传感器需要引起上下文信息将以低功耗、小尺寸和重量,适当的计量规范。微机电系统(MEMS)运动传感器出现匹配这些需求( 8]。方法调查本文围绕从小型网络获得的加速度信号的处理MEMS加速度计的定位在一些人体的解剖点。本文中的机器学习算法被认为是一个有用的补充计算方法用于姿态估计和导航使用惯性传感器( 9]。

本文的主要部分包含说明和讨论人类体育活动的分类方法,基于使用隐马尔科夫模型(摘要)。原则上,这种方法的目的是利用运动动力学信息,即认识活动的能力在当前时间与分类器的分类结果提供了在过去。因此,我们谈论顺序分类器,它不同于所谓的单分类器,后者有兴趣单一活动原语,换句话说,基本活动是独立于以前检测到的历史研究活动( 9- - - - - - 16]。

如今,摘要中找到应用大量的识别问题,包括,但不限于,语音识别 17],手势和手语识别[ 18),和控制机器人工具通过手势( 19]。关于人类活动识别,大多数研究摘要的应用( 20., 21)是基于相机记录,如图所示的大和等人[ 22),虽然现在很少有研究报告的摘要针对应用程序从可穿戴传感器系统(收集数据 23, 24]。这些研究关注每个考虑活动的统计模型的验证。以不同的方式,我们的方法是基于使用轻量级可穿戴传感器和面向利用摘要在一个更高的水平。特别是,使用它们可以面向建模时的活动序列的元素之间的关系。摘要发表在文学的一些应用程序对于人类体育活动从惯性传感器的分类问题,可能是因为摘要已知可能受到严重的参数估计的困难。在本文中,我们提出一种减轻这种困难采用监督分类器训练方法。这种方法是可行的,当训练集数据的注释。

2。材料和方法 2.1。身体活动分类的数据集

目前的工作部分是基于加速度波形数据集的分析发表的包和Intille 10];今后的数据集,数据集称为我,作者给我们的被释放。加速度数据,采样在76.25赫兹,从五双轴加速度计,获得的是位于臀部,手腕,手臂,脚踝和大腿。最初的协议是基于测试20对象,请执行20日常生活活动。这些包括主要涉及使用上肢的活动(例如,刷牙,擦洗,叠衣服,吃或喝,和工作在电脑),全身活动(如拉伸、和吸尘),和活动,主要涉及下肢的使用(例如,走路,爬楼梯,跑步,和骑自行车)。此外,静态姿势被认为是(如静止,坐在和放松,躺下来放松)与准静态姿势(例如,阅读,看电视)。我数据集包括对于每个主题,加速时间序列已知的对应于一个特定的活动由他/她。我们将作为一个任何活动 原始的活动,区别于更高层次的活动,即电动机链接几个活动而导致的行为原语在某些时间顺序。加速度信号相关的高级活动不是我中可用数据集,由于研究目标 10是专门测试单分类器。

在本文中,我们选择七个活动如图 1,减少数据集,从今以后 seven-activity数据集。我们假设一系列活动原语,说,一个活动的 电动机的句子水平可以使用一阶马尔可夫链模型,组成一个有限的数量 的状态 年代 ( = 7 )。每个州占一个活动原始的基本活动 电动机词水平: 年代 1 躺着,放松; 年代 2 、骑自行车; 年代 3 爬楼梯; 年代 4 行走; 年代 5 运行; 年代 6 坐在和放松; 年代 7 站着不动。一阶马尔可夫链的时间演化是由向量 π 先验概率和转移概率矩阵(TPM) 一个 ,这有助于描述人类行为在行为水平。先验概率向量 π ,大小( 1 × ),由概率 π 每个州的 年代 的状态 X 在最初的时间 t 0 π = 公关 ( X ( t 0 ) = 年代 ) , = 1 , , 的元素 一个 j 矩阵A的大小( × ),是转换的状态的概率 年代 在时间 t n 国家 年代 j 占用时间 t n + 1 一个 j = 公关 ( X ( t n ) = 年代 j X ( t n - - - - - - 1 ) = 年代 ) , , j = 1 , ,

方案基于摘要的顺序分类。

之前和过渡概率需要创建可观测的马尔可夫模型(石)( π , 一个 )与马尔可夫链可以基于观察的经验决定一个主题的活动的行为。

为了克服我的限制数据集应用于模型时顺序数据,我们提出虚拟实验的概念。虚拟实验是一种生成模型,它允许活动连接在一起,来模拟复杂的行为主要用于算法验证和测试。模拟复杂的行为由一个主题在我们的研究中(虚拟实验)要求每个模型状态可能排放数据帧随机抽样(替换) N 框架可用于给定的主题和活动相关的原始排放状态( 18 N 58 )。从今以后,数据帧被称为滑动窗口和有限宽度不变,用于计算样本的特征向量分类算法所需的,看到的部分 2。2。对于seven-activity数据集,数据帧持续6.7秒(50%重叠)。对于每一个主题,我们执行20虚拟实验( 年代 = 20. ),每个组成的 T = 300年 数据帧。石与每个虚拟实验是建立利用TPM相关规范见表 1

摘要虚拟实验模拟TPM ( seven-activity数据集)。

年代1 年代2 年代3 年代4 年代5 年代6 年代7
年代1 0.95 0.20 0.00 0.00 0.00 0.01 0.04
年代2 0.00 0.90 0.00 0.04 0.00 0.01 0.05
年代3 0.00 0.00 0.62 0.25 0.01 0.02 0.10
年代4 0.00 0.01 0.03 0.80 0.02 0.07 0.07
年代5 0.00 0.01 0.01 0.35 0.40 0.01 0.22
年代6 0.02 0.00 0.00 0.04 0.00 0.85 0.09
年代7 0.01 0.03 0.01 0.18 0.03 0.12 0.62

合成虚拟实验的过程以上述形式的存在意味着明确的边界数据帧关联到不同的原语,没有瞬态之间的连续数据帧可能未知的分类器。这个问题通常是由手工裁剪数据创建数据集( 10]。当然,现实生活中的数据将更为复杂和模糊,特别是对于体位不同活动之间的转换。在试图得到一个更现实的照片通过顺序分类器性能,数据帧从原始数据集不包含在减少数据集随机散布在测试的数据序列生成的石比例1:3。由此产生的垃圾由拒绝虚假数据部分中描述的方法 2。5

我们提出虚拟实验方法是被认为是一个有用的方法初步算法验证和测试。当时,可穿戴系统ActiNav正在第一步我们实验室应用领域的行人导航和智能生物力学参数的估计;因此,它是一个受欢迎的除了我们的工具为研究人类活动的马尔可夫模型方法分类。

ActiNav围绕一个ARMadeus董事会(APF27)。它配备了一个基于arm9飞思卡尔处理器,128 MB的内存,256 MB的闪存,200 K-gates Xilinx FPGA。一个定制的印刷电路板允许武装APF27与12位逐次逼近寄存器ADC (AD7490,模拟设备,Inc .)。这个转换器操作1议员;此外,由于它具有16个模拟通道,5 triaxis ActiNav模拟加速度计和陀螺仪可以集成。主板的系统( One hundred. × 84年 × 16 毫米)和不同的传感器连接图所示 2

ActiNav板显示与几个传感器连接到它的输入端口。

本文中描述的工作,一个triaxis加速度计(ADXL325,模拟设备,Inc .)和全面±5 g (1 g = 9.81 m / s2)系7个健康受试者的右腿。每个主题二十重复执行下列任务:最初,他坐在椅子上,然后他站了起来,几秒钟的停顿后,他开始走路。每个试验持续了约15秒。传感器数据获取的采样频率250赫兹;此外,他们是手工注释在收购(监督方法)。具体来说,实验者还试图定义的时间间隔不同的活动之间的转换。选择数据帧持续250毫秒(50%重叠)。这个低数据集,从此被称为 sit-stand-walk数据集,允许我们测试提出的方法在一个真正的顺序数据集,包括姿势过渡和初期的运动情况。

2.2。数据处理:特征向量

加速度数据的自动分类需要预处理阶段的特征变量与高信息内容从数据帧中提取的测量通道系统提供我们有十个测量通道中 seven-activity数据集和三个测量通道 sit-stand-walk数据集。

在以前的作品[适应症报道后 10, 15),特征变量考虑摘要:

直流分量。这feature-helpful歧视静态postures-is评价平均在每个数据帧原始样品。每一个特征测量通道。

能源。这个feature-helpful评估活动强度评估的平方的总和声谱图系数在每个数据帧。第一个系数,包括直流分量的信息和排除在外。每一个特征测量通道。

熵谱图系数。这个特性有助于识别活动不同的原语在频域的复杂性 10]。核密度估计应用于谱图系数的决心。每一个特征测量通道。

相关系数。这些特性是数据协方差矩阵的元素;他们通过应用点积计算对测量通道数据帧,数据帧的去趋势和规范化提供窗口大小;相关系数是有助于识别活动涉及不同身体部位的运动。总共55和6计算相关系数,分别为 seven-activity sit-stand-walk数据集。

申请前的分类算法,特征向量选择为了减少问题的维数,尤其是至关重要 seven-activity数据集,85特性变量计算(15 sit-stand-walk数据集)。特征选择是必需的限制导致的风险严重的过度拟合( 25]。我们使用Pudil算法a顺序forward-backward浮动搜索(SFFS-SFBS) [ 26];这个算法使用之间的欧几里得距离每一对同一个类的特征向量训练集的标准选择最丰富的特征变量。优化特性集的标准来自于一个基于交叉验证研究 k最近的邻居分类器( k神经网络)。迭代,Pudil算法修改的数量特性和重复验证过程。之后,所有功能都包括一次至少在特性集的最小尺寸的特性集最大化准则被选中。一种广泛使用的特征提取方法,即 主成分分析(PCA),也适用于特征向量( 25]。

2.3。单帧分类

尽管几个单分类器可以提出,我们考虑一个特定的技术单帧分类,即高斯混合模型(GMM)分类器。这种方法是由艾伦et al。 9取得非常不错的效果。特别是,作者讨论了分类器的高适应性,良好的特性分析的数据对象不包含在训练集。

当然,其他单帧分类方法人类体育活动可以选择,他们也可能超越gmm ( 27]。这里,GMM的单分类器分类器选择参考,特别是嗯的结构为其相似之处。事实上,每个状态的概率密度的排放在一个嗯可以建模为高斯混合。

GMM分类器首先执行class-conditional概率密度函数的参数估计 p ( x w ) 分配特征向量的概率 x 鉴于其成员的类 w 。在训练阶段,class-conditional高斯混合概率估计。每一个特征向量 x 然后分类在课堂上产生的最高价值 p ( x w )

2.4。HMM-Based分类

在建模序列一阶马尔可夫链的人类活动,我们建议前和过渡概率模型的相关经验决定通过观察行为。如果TPM和国家在当前时间是已知的,那么最可能的状态,将遵循概率确定。然而,每个活动原始只能观察到通过一组原始传感器信号(从对身体加速计测量的时间序列,在目前的情况下)。以其他的术语来说,美国是隐藏的,只有一个二级过程实际上是可观测(排放)。统计模型包括两( π , 一个 一个嗯)和发射过程。我们选择一个连续排放方法( 连续排放密度嗯,又名cHMM, ( 17])。最常见的问题建模方法连续排放参数。特别是我们考虑 th状态 年代 类,即 w 的混合物, 多元正态分布 N ( μ , Σ ) 分配指定的均值向量 μ 的协方差矩阵 Σ ,矩阵 C 混合参数 c : p ( x 年代 ) = = 1 c N ( x μ , ) , = 1 , , , 在哪里 = 1 c = 1 , = 1 , , 混合物用于模型链中的每个国家排放的。一个很好的参考源摘要为他们的学习和测试和算法识别问题是( 17]。

我们考虑一个 状态的cHMM的代表人物 1 seven-activity数据集, = 7 ( sit-stand-walk数据集: = 3 )。高斯cHMM训练 d 维特征空间, 州和 为每个混合组件,需要规范的以下参数:

π 先验概率向量, 1 × ;

一个 转移概率矩阵 × ;

μ 组中值矩阵, × × d ;

Σ 的协方差矩阵, × × d × d ;

C 混合,设置参数, ×

这种方法的一个主要问题可能是大量的参数。处理参数识别问题的方法我们追求的是将培训阶段分为两个不同的步骤:一级监督训练阶段是紧随其后的是一个二级培训阶段,它是由运行Baum-Welch算法( 17]。不准确的初始化参数很容易导致次优的结果使用Baum-Welch算法时,由于存在许多局部极大值的优化表面( 17]。然而,训练集是标记在本文中描述的应用程序。因此,第一级监督培训成为了提出的方法实现的一个很好的初始化参数进入第二层次的训练。

为了简化评价过程,参数设置主要分为两个组,即过渡参数( π , 一个 )和发射参数( μ , Σ , C )。这种分离让我们单独训练两个参数集与大小,降低收益率减少相关的训练集的总体规模。因为活动标签从训练集的例子都假定为已知,简单计算事件发生的方法允许我们估计过渡参数( 17]。例如,概率 一个 j 的一个过渡 ——状态 j th状态估计如下: 一个 ̂ j = N j N , 在哪里 N j 转换的数量吗 th状态 j 状态的计算在训练集的大小 N 。发射参数可以通过拟合估计高斯混合分布 组件发出的每个状态特征向量,以类似的方式使用的过程学习GMM分类器。培训过程第二层次利用参数估计的值在第一个层面上,在培训过程中作为运行Baum-Welch算法的初始值;在当前实现中,这一步帮助精炼过渡参数的估计,人物 3。模块的伪框架拒绝,L是可能性而适当选择阈值Th。最优状态序列跟踪的cHMM估计使用一个标准的维特比译码器( 17]。

框图发达cHMM-based顺序分类器。

执行分析验证研究本文对GMM和cHMM-based分类器。这意味着一个分类器训练使用数据从所有科目,然后它只是测试数据排除了主题。交叉验证过程重复多次,每次扣除一个不同的主题培训。然后从不同的聚合模型结果。这种验证方法允许测试每个分类器的分类能力正确的新例子,不同于那些用于培训(泛化);好表现的泛化是必不可少的,以防止个别模型校准的必要性。

2.5。虚假的数据被拒绝

分类的策略,我们采用允许我们定义一个标准自动拒绝虚假特征向量。如果一个基于阈值检测器应用于估计class-conditional概率 p ( x w ) ,可以拒绝这些特征向量的分类也被认为是不确定的;我们不是被迫引入额外的状态,或混合组件,专为未知数据。提醒,在GMM或cHMM, p ( x w ) 指的概率特征向量 x 随着排放模型的状态 w 。对于任何一个特征向量,如果相对于每个状态的概率低于给定的阈值,特征向量本身可以标记为虚假和删除,而不影响分类器的操作。低的值 p ( x w ) 未知时典型的活动是隐藏在数据提交给分类器或者当太多不确定性的影响。

的阈值优化研究specificity-sensitivity曲线(ROC曲线);平均在主题,据报道在图 4( seven-activity数据集)。阈值选择特异性时略大于敏感性。

ROC曲线获得使用不同的阈值。

3所示。结果

我们经验确定是否旋转和降维将共同追求PCA应用于特征变量时幸存Pudil的方法。初步测试结果的指导下,我们使用PCA级联Pudil的纯旋转方法在特征空间( seven-activity旋转和降维的数据集)和( sit-stand-walk数据集)。在前一种情况中,其中13所有特色相关系数保留进一步处理。在的情况下 sit-stand-walk数据集,三个主要组件被认为是(97.8%的方差是保留),之后Pudil的方法选择七15个特征变量。

k神经网络分类精度通过Pudil的方法分别是99.5%和99.2% ( seven-activity sit-stand-walk数据集,分别地)。轮廓是很重要的,这些值与分类精度报告了在接下来的GMM和cHMM-based分类器。事实上,特征选择过程是基于交叉验证的研究扩展到整个数据集,虽然分类器测试是基于一种分析方法。

混合高斯的组件的数量 = 1 ,GMM和cHMM-based分类器。实验证据没有明确支持该假设的数据分布uni-modal数据集;尽管如此,测试 = 5 没有提供令人信服的论点更简单的选择吗 = 1 将被解雇。至于 seven-activity数据集,表 2 3清楚地表明, = 1 在大多数情况下是获胜的选择。这可能是由于高数时,需要估计的参数 增加。至于 sit-stand-walk数据集,结果在表 4似乎指定首选项的值 大于1。然而,这是只有当禁用拒绝虚假数据的机制;否则, = 1 是赢的选择。在接下来的结果中,我们只礼物 = 1

分类精度平均在20科目中可用 seven-activity数据集。虚假的数据没有插入。报告为均值±标准差的值。

Seven-activity数据集(没有虚假的数据)
= 1 = 2 = 3 = 4 = 5

GMM 88.6±13.7 88.1±13.4 85.9±13.6 82.5±16.4 82.0±16.6
cHMM(1级) 90.2±13.0 88.0±12.9 85.6±13.0 80.8±17.1 79.3±17.7
cHMM(1 + 2级) 90.2±13.0 88.8±13.4 85.2±14.5 83.5±16.3 82.8±18.1

分类精度平均在20科目中可用 seven-activity数据集存在虚假数据。报告为均值±标准差的值。

Seven-activity数据集(虚假的数据出现在比例1:3)
= 1 = 2 = 3 = 4 = 5

没有拒绝虚假数据
GMM 63.3±9.9 62.4±11.4 60.2±11.2 60.5±13.0 56.0±11.2
cHMM(1级) 63.8±9.3 61.4±10.6 57.8±10.9 55.0±14.0 42.6±13.9
cHMM(1 + 2级) 63.8±9.3 61.8±9.7 57.0±12.5 50.1±15.5 43.4±14.6
拒绝虚假数据
GMM 85.4±13.4 86.7±14.9 83.4±15.3 80.5±16.2 81.7±17.6
cHMM(1级) 86.2±12.9 87.1±13.7 83.0±14.6 80.2±15.7 81.9±17.6
cHMM(1 + 2级) 86.2±12.8 86.1±13.3 83.2±14.0 76.1±16.7 75.9±20.6

分类精度平均在七个科目中可用 sit-stand-walk数据集。报告为均值±标准差的值。

Sit-stand-walk数据集
= 1 = 2 = 3 = 4 = 5

没有拒绝虚假数据
GMM 94.1±1.8 93.7±4.1 94.8±2.4 95.5±1.9 95.8±2.1
嗯(1级) 95.2±7.0 96.8±3.0 98.5±1.0 98.3±1.1 98.1±1.1
嗯(1 + 2级) 95.2±7.0 97.4±2.9 97.9±2.4 97.0±2.9 98.5±1.0
拒绝虚假数据
GMM 94.0±1.8 95.6±1.5 95.8±2.3 95.6±1.7 95.6±1.5
嗯(1级) 99.0±1.0 98.6±1.0 98.8±1.0 98.8±1.1 98.6±1.1
嗯(1 + 2级) 99.0±1.0 98.8±1.0 98.8±1.0 98.7±1.1 98.7±1.0
3.1。Seven-Activity数据集

在表 3所有测试分类器,分类精度,平均,据报道。估计TPM是几乎相同的表中指定的TPM 1定义虚拟实验。至于拒绝虚假数据的算法,阈值是固定的,实现敏感性(Se = 86.1%)和特异性(Sp = 86.7%)。分类精度存在虚假数据和后自动拒绝了GMM或cHMM。混淆矩阵得到嗯(1 + 2级)分类后的数据拒绝刊登在表中 5结果所有受试者都聚合。

混淆矩阵获得比较嗯(1 + 2级)分类器输出(列)和实际活动的类标签后的数据被拒绝(行)。所有受试者的结果汇总。

cHMM 年代 1 年代 2 年代 3 年代 4 年代 5 年代 6 年代 7
年代 1 9686年 10 3 29日 1 53 22
年代 2 0 6064年 15 15 0 0 682年
年代 3 0 29日 1825年 2543年 25 0 921年
年代 4 0 420年 347年 19189年 35 0 613年
年代 5 0 2 4 1 580年 6 23
年代 6 2 0 0 0 0 18823年 0
年代 7 0 293年 47 376年 3 0 9939年

由于一些未知的原因,我们观察到三个学科的特点是异常低的分类精度值。表 6当这些对象并不认为显示了结果。

分类精度平均在17个主题中可用 seven-activity删除后数据集,三个异常对象(参见文本)。不插入和虚假数据 = 1

分类器 精度
GMM 93.5±6.0
cHMM(1级) 95.1±4.8
cHMM(1 + 2级) 95.1±4.8
3.2。Sit-Stand-Walk数据集

分类精度的结果被发表在表 4而混淆矩阵对HMM分类器后,拒绝虚假数据报告在表 7。现在假拒绝算法应用于标记数据可靠性较低的分类。更多的标记数据接近活动转换发生,人物 6。最后,图 5描述了虚假的数据拒绝机制的作用更多的细节。上面的图显示了一个典型的例子,一个坏行为的维特比译码器接近- - - - - - - - -过渡时拒绝机制是关闭的。- - - - - - - - -过渡是立即紧随其后- - - - - - - - -过渡,这是错误的。现在,鉴于cHMM走出训练左右结构,飞回一旦进入系统是被禁止的。低图所示,当系统决定不确定的数据帧的不确定的起源,维特比译码器的作用可能更正确。这一次,的确,- - - - - - - - -过渡是正确的观察,系统准备承认- - - - - - - - -非常接近实际发生。

混淆矩阵获得比较嗯(1 + 2级)分类器输出(列)和实际活动的类标签后的数据被拒绝(行)。所有受试者的结果汇总。

cHMM
4973年 10 0
0 3989年 28
0 64年 2270年

虚假的数据的方法拒绝行动(见文本)所示。

分类和虚假的数据序列的拒绝 sit-stand-walk数据集。

4所示。讨论和结论

我们决定专注于活动的基本词汇是出于我们的正在进行的工作,旨在开发一种可佩带的传感器系统行人导航和人类运动康复。他指的是 seven-activityPudil数据集的特征选择方案个别化特性的一个子集,包括运动协调信息(相关系数)。尽管如此,认为直流分量,能量,和熵时域特性将非常有价值,如果我们决定调查其他的活动,例如,那些来自一组研究[ 10本文不考虑。虽然被限制为三个活动链接在一个固定的顺序,并只持续几秒钟,测试 sit-stand-walk数据表明,该算法也可以应用于数据的活动转换自然。

测试分类器的泛化能力可以被认为是好的,因为,对于这两个数据集,采用leave-one-out-subject验证策略。尽管如此,分类精度很高,虽然变化的标准差在虚拟实验特别高 seven-activity数据集。这可能是由于不同的因素:相比 sit-stand-walk数据集,更多的被认为是在活动和课程 seven-activity数据集,最后,虚拟实验中的数据污染政策相当积极。主要的事实是,我们相信,有些学科可能以不同的方式执行相同的活动对其他科目:我们的数据表 2 4清楚地表明,这是与测试分类器的泛化能力。

监督培训摘要追求的想法将估计的参数的过程cHMM-based分类器在两个不同的水平。二级培训过程是基于参数使用Baum-Welch reestimation算法。结果报告摘要Baum-Welch算法的影响是不确定的和有限的效用。然而,Baum-Welch算法是经典的方法对于HMM参数reestimation,即使一个很好的初始化监督培训是可用的 23, 28- - - - - - 31日]。参数reestimation监管框架的基本原理是可能的改进分类器的泛化能力的减少为代价的特异性。一些最近的研究讨论一个有趣的方法,其中Baum-Welch算法修改在试图使一个HMM-based分类器自适应( 32]。我们目前正在研究我们提出的修改分类器在这个方向。

一个有趣的问题在我们的方法是相关管理方法的特征向量。大多数已发表的研究,包括( 10),处理问题的模糊边界的人工种植的数据。显然这是有用的和适用的如果我们找一个实时系统活动分类。在我们的方法中,整个假拒绝过程是自动的。当三分之一的全部特征向量数据是假的,比如在本文描述的虚拟实验,测试顺序分类器的分类精度限制在约64%没有提出的基于阈值检测器。如果基于阈值检测器实际上是实现,性能提高约86%。当虚假的数据无法事先确定的标记,如在 sit-stand-walk实验,基于阈值检测器提供的性能提升不一样令人印象深刻的在虚拟实验中然而,我们看到,cHMM受益于一个相当显著的增量从95%降至99%。

cHMM-based分类器优于GMM分类器利用活动的统计信息动态。然而,HMM的统计利用带来了一系列的问题。这是明显的在分析处理的结果 sit-stand-walk数据集。首先,我们观察到,在 sit-stand-walk实验中,平均而言,表演的GMM或cHMM非常相似。然而,在没有虚假数据的基于阈值检测器,cHMM倾向于表现出更多的不稳定行为与GMM相比,看到表的结果 5。为什么会这样呢?cHMM依赖于数据,它必须被视为发出它的内部状态,换句话说,马尔可夫模型必须考虑所有可能的观测,以得出有意义的推论。当出现错误时,cHMM往往固执地依靠其统计记忆,然而这是错误的,生动地显示在图 5。当GMM分类器被认为是,cHMM排放模型是一样的,但GMM分类器并不重视不建模之间的连接状态。幸运的是,当虚假数据阻止影响其行为,cHMM倾向于执行比GMM分类器。

总之,马尔可夫链的建模的适用性已经证明人类体育活动的分类。特别是,我们强调的重要性,利用统计学知识对人类运动动力学,可以“困”在马尔可夫链。该算法包含一个有效的设备拒绝虚假特征向量,这结果显示高敏感性和特异性的检测。

确认

作者感谢教授Stephen s . Intille,允许他们使用他的加速度数据集计算机实验。他们也感谢匿名审稿人的宝贵意见,这有助于提高论文的质量。

Brezillon P。 环境问题解决:一项调查 知识工程评审 1999年 14 1 47 80年 2 - s2.0 - 2442767774 10.1017 / S0269888999141018 梅耶尔 G。 Westerterp k·R。 Verhoeven f·M。 科佩尔 h . B。 十Hoor F。 方法评估身体活动与运动传感器和加速度计 IEEE生物医学工程 1991年 38 3 221年 229年 2 - s2.0 - 0026119071 10.1109/10.133202 Bouten c V。 Koekkoek k·t·M。 Verduin M。 Kodde R。 詹森 j . D。 一个三轴加速度计和便携式数据处理单元的日常身体活动的评估 IEEE生物医学工程 1997年 44 3 136年 147年 2 - s2.0 - 0031106807 10.1109/10.554760 H。 Spenko M。 Dubowsky 年代。 共享一个自适应控制系统智能老年人流动性援助 自主机器人 2003年 15 1 53 66年 2 - s2.0 - 0041340855 10.1023 /:1024488717009 Chuy o . Y。 Hirata Y。 Kosuge K。 基于被动行为的控制方法来提高用户交互 IEEE机器人 2007年 23 5 899年 908年 2 - s2.0 - 35348927519 10.1109 / TRO.2007.907920 萨巴蒂 a . M。 吉诺维斯 V。 Pacchierotti E。 步行和对象的流动性援助支持运输的运动障碍 2 《IEEE / RSJ智能机器人和系统国际会议 2002年12月 1349年 1354年 2 - s2.0 - 0036448863 10.1109 / IRDS.2002.1043942 Hirata Y。 Komatsuda 年代。 Kosuge K。 秋天预防控制被动智能沃克基于人体模型 《IEEE / RSJ智能机器人和系统国际会议 2008年9月 不错,法国 1222年 1228年 2 - s2.0 - 69549083235 10.1109 / IROS.2008.4651173 萨巴蒂 a . M。 贝格 R。 Palaniswami M。 生物力学的惯性传感:计算技术消除运动的调查分析和个人导航 计算智能运动科学:神经网络和其他新兴技术 2006年 美国宾夕法尼亚州 想法组 70年 One hundred. 艾伦 f·R。 Ambikairajah E。 洛弗尔 n . H。 厘米/秒 b G。 分类的一个已知序列的动作和姿势个加速器使用适应高斯混合模型的数据 生理测量 2006年 27 10 935年 951年 2 - s2.0 - 33748420535 10.1088 / 0967 - 3334/27/10/001 l Intille 美国年代。 活动从user-annotated加速度数据识别 普适计算 2004年 301年 1 17 2 - s2.0 - 35048842427 贝格 R。 Kamruzzaman J。 机器学习方法来自动识别使用基本的运动模式,动力和运动步态数据 生物力学杂志 2005年 38 3 401年 408年 2 - s2.0 - 12344268981 10.1016 / j.jbiomech.2004.05.002 福斯特把 F。 检测的姿势和运动个加速器:动态监测的验证研究 电脑在人类行为 1999年 15 5 571年 583年 2 - s2.0 - 0032680130 10.1016 / s0747 - 5632 (99) 00037 - 0 Karantonis d . M。 Narayanan m·R。 马斯 M。 洛弗尔 n . H。 厘米/秒 b G。 实现一个实时人体运动分类器使用三轴加速度计动态监测 IEEE在生物医学信息技术 2006年 10 1 156年 167年 2 - s2.0 - 30744436064 10.1109 / TITB.2005.856864 马斯 m·J。 厘米/秒 b G。 洛弗尔 n . H。 水果贩 a·c·F。 使用三轴加速度计分类的基本日常运动 医学和生物工程和计算机 2004年 42 5 679年 687年 2 - s2.0 - 6344237275 10.1007 / BF02347551 拉维 N。 Dandekar N。 迈索尔 P。 利特曼 m . L。 活动从加速度计数据识别 美国人工智能 2005年 5 1541年 1546年 范Laerhoven K。 Cakmakci O。 我们教我们的裤子吗? 第四和国际研讨会上的可穿戴计算机学报》上 2000年10月 亚特兰大,乔治亚州,美国 77年 83年 2 - s2.0 - 0034510080 拉宾 l R。 教程隐马尔科夫模型和选择在语音识别中的应用 IEEE学报》 1989年2月 77年 2 257年 286年 2 - s2.0 - 0024610919 10.1109/5.18626 r·H。 Ouhyoung M。 一个实时连续的手语手势识别系统 学报》第三届IEEE国际会议上自动和手势识别 1998年4月 日本奈良 558年 567年 J。 Y。 程ydF4y2Ba c·S。 人类行为学习通过隐马尔可夫模型 IEEE系统,人,控制论:系统和人类 1997年 27 1 34 44 2 - s2.0 - 0030736755 马纳尔先生 R。 Anantharaman B。 Ramakrishnan k·R。 Srinivasan s . H。 压缩域分类使用嗯 模式识别的字母 2002年 23 10 1203年 1213年 2 - s2.0 - 0036680807 10.1016 / s0167 - 8655 (02) 00067 - 3 Martinez-Contreras F。 Orrite-Urunuela C。 Herrero-Jaraba E。 拉吉卜 H。 Velastin 美国一个。 使用silhouette-based嗯认识人类活动 学报第六届IEEE国际会议上先进的视频和基于信号的监测 2009年9月 意大利的热那亚 43 48 2 - s2.0 - 72349097787 10.1109 / AVSS.2009.46 日本人的 J。 Ohya J。 石井 K。 人类行为识别时间序列图像中使用隐马尔科夫模型 《IEEE计算机学会学报计算机视觉与模式识别会议 1992年 日本的横须贺 379年 385年 pob d . M。 Staudenmayer J。 拉斐尔 C。 Freedson p S。 新技术的发展对体育活动模式使用加速度计进行分类 医学和科学在运动和锻炼 2006年 38 9 1626年 1634年 2 - s2.0 - 33748577353 10.1249/01. mss.0000227542.43669.45 竹内 年代。 (尽管) 年代。 Hayamizu 年代。 人类行为识别使用加速度信息基于隐马尔可夫模型 诉讼亚太信号和信息处理协会的年度峰会和会议、年度峰会和会议(APSIPA ASC ' 09) 2009年10月 日本札幌 829年 832年 耆那教徒的 答:K。 Duin p W。 J。 统计模式识别:一个回顾 IEEE模式分析与机器智能 2000年 22 1 4 37 2 - s2.0 - 0033640646 10.1109/34.824819 Pudil P。 Novovičova J。 难应付的 J。 浮动搜索方法在特征选择 模式识别的字母 1994年 15 11 1119年 1125年 2 - s2.0 - 0028547556 Mannini 一个。 萨巴蒂 a . M。 机器学习分类方法人类体育活动对身体加速计 传感器 2010年 10 2 1154年 1175年 2 - s2.0 - 77950247206 10.3390 / s100201154 威尔逊 答:D。 Bobick 答:F。 手势识别的参数隐马尔可夫模型 IEEE模式分析与机器智能 1999年 21 9 884年 900年 2 - s2.0 - 0033189911 10.1109/34.790429 莱斯特 J。 Choudhury T。 克恩 N。 博列洛 G。 赫纳夫德 B。 一个混合歧视/生成方法建模人类活动 19学报》国际联合会议上人工智能(IJCAI 05展出) 2005年 766年 772年 程ydF4y2Ba M。 B。 Y。 人类通过隐马尔可夫模型异常步态建模 国际会议信息采集 2007年7月 Seogwipo-si,韩国济州 517年 522年 2 - s2.0 - 47349120705 10.1109 / ICIA.2007.4295787 C。 Q。 W。 人类意图识别在智能辅助生活系统使用层次隐马尔可夫模型 学报》第四届IEEE国际会议自动化科学与工程 2008年8月 美国弗吉尼亚州阿灵顿 253年 258年 2 - s2.0 - 54949149214 10.1109 / COASE.2008.4626513 b . C。 y。 g . T。 机构 大肠。 嗯机器学习和日常生活活动识别推理 《华尔街日报》的超级计算 2010年 54 1 29日 42 2 - s2.0 - 78149415969 10.1007 / s11227 - 009 - 0335 - 0