加速度计是一个受欢迎的选择体运动传感器:原因是部分提取有用信息的能力自动推断人类主体参与的体育活动,他们的角色在旁边喂生物力学参数估计。自动分类的人类体育活动是极具吸引力的普适计算系统,而语境意识可能缓解人机交互,在生物医学,而可穿戴传感器系统提出了长期监测。本文涉及执行所需的机器学习算法的分类任务。隐马尔可夫模型(HMM)分类器通过对比研究了高斯混合模型(GMM)分类器。摘要结合上可用的统计信息运动动力学分类过程,没有丢弃时间的历史之前的结果gmm一样。统计获得杠杆的好处的例子说明和讨论通过分析加速度计时间系列的两个数据集。
许多技术的应用可以大大受益于可用的系统能够自动分类的特定的人类体育活动。摘要静态姿势,例如,站着,或动态运动,例如散步,身体活动包括在术语。的上下文感知来自这方面的知识(
原则上,可穿戴传感器需要引起上下文信息将以低功耗、小尺寸和重量,适当的计量规范。微机电系统(MEMS)运动传感器出现匹配这些需求(
本文的主要部分包含说明和讨论人类体育活动的分类方法,基于使用隐马尔科夫模型(摘要)。原则上,这种方法的目的是利用运动动力学信息,即认识活动的能力在当前时间与分类器的分类结果提供了在过去。因此,我们谈论顺序分类器,它不同于所谓的单分类器,后者有兴趣单一活动原语,换句话说,基本活动是独立于以前检测到的历史研究活动(
如今,摘要中找到应用大量的识别问题,包括,但不限于,语音识别
目前的工作部分是基于加速度波形数据集的分析发表的包和Intille
在本文中,我们选择七个活动如图
方案基于摘要的顺序分类。
之前和过渡概率需要创建可观测的马尔可夫模型(石)(
为了克服我的限制数据集应用于模型时顺序数据,我们提出虚拟实验的概念。虚拟实验是一种生成模型,它允许活动连接在一起,来模拟复杂的行为主要用于算法验证和测试。模拟复杂的行为由一个主题在我们的研究中(虚拟实验)要求每个模型状态可能排放数据帧随机抽样(替换)
摘要虚拟实验模拟TPM (
|
|
|
|
|
|
|
|
|
|---|---|---|---|---|---|---|---|
|
|
0.95 | 0.20 | 0.00 | 0.00 | 0.00 | 0.01 | 0.04 |
|
|
0.00 | 0.90 | 0.00 | 0.04 | 0.00 | 0.01 | 0.05 |
|
|
0.00 | 0.00 | 0.62 | 0.25 | 0.01 | 0.02 | 0.10 |
|
|
0.00 | 0.01 | 0.03 | 0.80 | 0.02 | 0.07 | 0.07 |
|
|
0.00 | 0.01 | 0.01 | 0.35 | 0.40 | 0.01 | 0.22 |
|
|
0.02 | 0.00 | 0.00 | 0.04 | 0.00 | 0.85 | 0.09 |
|
|
0.01 | 0.03 | 0.01 | 0.18 | 0.03 | 0.12 | 0.62 |
合成虚拟实验的过程以上述形式的存在意味着明确的边界数据帧关联到不同的原语,没有瞬态之间的连续数据帧可能未知的分类器。这个问题通常是由手工裁剪数据创建数据集(
我们提出虚拟实验方法是被认为是一个有用的方法初步算法验证和测试。当时,可穿戴系统ActiNav正在第一步我们实验室应用领域的行人导航和智能生物力学参数的估计;因此,它是一个受欢迎的除了我们的工具为研究人类活动的马尔可夫模型方法分类。
ActiNav围绕一个ARMadeus董事会(APF27)。它配备了一个基于arm9飞思卡尔处理器,128 MB的内存,256 MB的闪存,200 K-gates Xilinx FPGA。一个定制的印刷电路板允许武装APF27与12位逐次逼近寄存器ADC (AD7490,模拟设备,Inc .)。这个转换器操作1议员;此外,由于它具有16个模拟通道,5 triaxis ActiNav模拟加速度计和陀螺仪可以集成。主板的系统(
ActiNav板显示与几个传感器连接到它的输入端口。
本文中描述的工作,一个triaxis加速度计(ADXL325,模拟设备,Inc .)和全面±5 g (1 g = 9.81 m / s2)系7个健康受试者的右腿。每个主题二十重复执行下列任务:最初,他坐在椅子上,然后他站了起来,几秒钟的停顿后,他开始走路。每个试验持续了约15秒。传感器数据获取的采样频率250赫兹;此外,他们是手工注释在收购(监督方法)。具体来说,实验者还试图定义的时间间隔不同的活动之间的转换。选择数据帧持续250毫秒(50%重叠)。这个低数据集,从此被称为
加速度数据的自动分类需要预处理阶段的特征变量与高信息内容从数据帧中提取的测量通道系统提供我们有十个测量通道中
在以前的作品[适应症报道后
申请前的分类算法,特征向量选择为了减少问题的维数,尤其是至关重要
尽管几个单分类器可以提出,我们考虑一个特定的技术单帧分类,即高斯混合模型(GMM)分类器。这种方法是由艾伦et al。
当然,其他单帧分类方法人类体育活动可以选择,他们也可能超越gmm (
GMM分类器首先执行class-conditional概率密度函数的参数估计
在建模序列一阶马尔可夫链的人类活动,我们建议前和过渡概率模型的相关经验决定通过观察行为。如果TPM和国家在当前时间是已知的,那么最可能的状态,将遵循概率确定。然而,每个活动原始只能观察到通过一组原始传感器信号(从对身体加速计测量的时间序列,在目前的情况下)。以其他的术语来说,美国是隐藏的,只有一个二级过程实际上是可观测(排放)。统计模型包括两(
我们考虑一个
这种方法的一个主要问题可能是大量的参数。处理参数识别问题的方法我们追求的是将培训阶段分为两个不同的步骤:一级监督训练阶段是紧随其后的是一个二级培训阶段,它是由运行Baum-Welch算法(
为了简化评价过程,参数设置主要分为两个组,即过渡参数(
框图发达cHMM-based顺序分类器。
执行分析验证研究本文对GMM和cHMM-based分类器。这意味着一个分类器训练使用数据从所有科目,然后它只是测试数据排除了主题。交叉验证过程重复多次,每次扣除一个不同的主题培训。然后从不同的聚合模型结果。这种验证方法允许测试每个分类器的分类能力正确的新例子,不同于那些用于培训(泛化);好表现的泛化是必不可少的,以防止个别模型校准的必要性。
分类的策略,我们采用允许我们定义一个标准自动拒绝虚假特征向量。如果一个基于阈值检测器应用于估计class-conditional概率
的阈值优化研究specificity-sensitivity曲线(ROC曲线);平均在主题,据报道在图
ROC曲线获得使用不同的阈值。
我们经验确定是否旋转和降维将共同追求PCA应用于特征变量时幸存Pudil的方法。初步测试结果的指导下,我们使用PCA级联Pudil的纯旋转方法在特征空间(
的
混合高斯的组件的数量
分类精度平均在20科目中可用
| Seven-activity数据集(没有虚假的数据) | |||||
|
|
|
|
|
|
|
|
|
|||||
| GMM | 88.6±13.7 | 88.1±13.4 | 85.9±13.6 | 82.5±16.4 | 82.0±16.6 |
| cHMM(1级) | 90.2±13.0 | 88.0±12.9 | 85.6±13.0 | 80.8±17.1 | 79.3±17.7 |
| cHMM(1 + 2级) | 90.2±13.0 | 88.8±13.4 | 85.2±14.5 | 83.5±16.3 | 82.8±18.1 |
分类精度平均在20科目中可用
| Seven-activity数据集(虚假的数据出现在比例1:3) | |||||
|
|
|
|
|
|
|
|
|
|||||
| 没有拒绝虚假数据 | |||||
| GMM | 63.3±9.9 | 62.4±11.4 | 60.2±11.2 | 60.5±13.0 | 56.0±11.2 |
| cHMM(1级) | 63.8±9.3 | 61.4±10.6 | 57.8±10.9 | 55.0±14.0 | 42.6±13.9 |
| cHMM(1 + 2级) | 63.8±9.3 | 61.8±9.7 | 57.0±12.5 | 50.1±15.5 | 43.4±14.6 |
| 拒绝虚假数据 | |||||
| GMM | 85.4±13.4 | 86.7±14.9 | 83.4±15.3 | 80.5±16.2 | 81.7±17.6 |
| cHMM(1级) | 86.2±12.9 | 87.1±13.7 | 83.0±14.6 | 80.2±15.7 | 81.9±17.6 |
| cHMM(1 + 2级) | 86.2±12.8 | 86.1±13.3 | 83.2±14.0 | 76.1±16.7 | 75.9±20.6 |
分类精度平均在七个科目中可用
| Sit-stand-walk数据集 | |||||
|
|
|
|
|
|
|
|
|
|||||
| 没有拒绝虚假数据 | |||||
| GMM | 94.1±1.8 | 93.7±4.1 | 94.8±2.4 | 95.5±1.9 | 95.8±2.1 |
| 嗯(1级) | 95.2±7.0 | 96.8±3.0 | 98.5±1.0 | 98.3±1.1 | 98.1±1.1 |
| 嗯(1 + 2级) | 95.2±7.0 | 97.4±2.9 | 97.9±2.4 | 97.0±2.9 | 98.5±1.0 |
| 拒绝虚假数据 | |||||
| GMM | 94.0±1.8 | 95.6±1.5 | 95.8±2.3 | 95.6±1.7 | 95.6±1.5 |
| 嗯(1级) | 99.0±1.0 | 98.6±1.0 | 98.8±1.0 | 98.8±1.1 | 98.6±1.1 |
| 嗯(1 + 2级) | 99.0±1.0 | 98.8±1.0 | 98.8±1.0 | 98.7±1.1 | 98.7±1.0 |
在表
混淆矩阵获得比较嗯(1 + 2级)分类器输出(列)和实际活动的类标签后的数据被拒绝(行)。所有受试者的结果汇总。
| cHMM |
|
|
|
|
|
|
|
|---|---|---|---|---|---|---|---|
|
|
9686年 | 10 | 3 | 29日 | 1 | 53 | 22 |
|
|
0 | 6064年 | 15 | 15 | 0 | 0 | 682年 |
|
|
0 | 29日 | 1825年 | 2543年 | 25 | 0 | 921年 |
|
|
0 | 420年 | 347年 | 19189年 | 35 | 0 | 613年 |
|
|
0 | 2 | 4 | 1 | 580年 | 6 | 23 |
|
|
2 | 0 | 0 | 0 | 0 | 18823年 | 0 |
|
|
0 | 293年 | 47 | 376年 | 3 | 0 | 9939年 |
由于一些未知的原因,我们观察到三个学科的特点是异常低的分类精度值。表
分类精度平均在17个主题中可用
| 分类器 | 精度 |
|---|---|
| GMM | 93.5±6.0 |
| cHMM(1级) | 95.1±4.8 |
| cHMM(1 + 2级) | 95.1±4.8 |
分类精度的结果被发表在表
混淆矩阵获得比较嗯(1 + 2级)分类器输出(列)和实际活动的类标签后的数据被拒绝(行)。所有受试者的结果汇总。
| cHMM | 坐 | 站 | 走 |
|---|---|---|---|
| 坐 | 4973年 | 10 | 0 |
| 站 | 0 | 3989年 | 28 |
| 走 | 0 | 64年 | 2270年 |
虚假的数据的方法拒绝行动(见文本)所示。
分类和虚假的数据序列的拒绝
我们决定专注于活动的基本词汇是出于我们的正在进行的工作,旨在开发一种可佩带的传感器系统行人导航和人类运动康复。他指的是
测试分类器的泛化能力可以被认为是好的,因为,对于这两个数据集,采用leave-one-out-subject验证策略。尽管如此,分类精度很高,虽然变化的标准差在虚拟实验特别高
监督培训摘要追求的想法将估计的参数的过程cHMM-based分类器在两个不同的水平。二级培训过程是基于参数使用Baum-Welch reestimation算法。结果报告摘要Baum-Welch算法的影响是不确定的和有限的效用。然而,Baum-Welch算法是经典的方法对于HMM参数reestimation,即使一个很好的初始化监督培训是可用的
一个有趣的问题在我们的方法是相关管理方法的特征向量。大多数已发表的研究,包括(
cHMM-based分类器优于GMM分类器利用活动的统计信息动态。然而,HMM的统计利用带来了一系列的问题。这是明显的在分析处理的结果
总之,马尔可夫链的建模的适用性已经证明人类体育活动的分类。特别是,我们强调的重要性,利用统计学知识对人类运动动力学,可以“困”在马尔可夫链。该算法包含一个有效的设备拒绝虚假特征向量,这结果显示高敏感性和特异性的检测。
作者感谢教授Stephen s . Intille,允许他们使用他的加速度数据集计算机实验。他们也感谢匿名审稿人的宝贵意见,这有助于提高论文的质量。