研究文章|开放获取
苏珊娜Spinsante, Alberto Angelici Jens Lundstrom玛卡瑞娜Espinilla,伊恩·克莱兰德克里斯托弗·纽金特, ”一个移动应用程序,以方便设计和测试算法在工作场所监测身体活动”,移动信息系统, 卷。2016年, 文章的ID5126816, 17 页面, 2016年。 https://doi.org/10.1155/2016/5126816
一个移动应用程序,以方便设计和测试算法在工作场所监测身体活动
文摘
本文地址人类活动识别方法(HAR),目的是监视人们的体力活动在工作场所,通过智能手机应用程序利用可用的车载加速度计传感器。事实上,哈尔通过智能手机或可穿戴传感器可以提供重要的信息关于日常身体活动的水平,尤其是在久坐行为通常发生的情况下,就像在现代工作场所环境。坐时间显著增加与严重的健康疾病有关,和工作场所是一个适当的干预,由于久坐行为典型的现代工作。在这篇文章中,哈尔的最先进的组件进行了分析,以识别并选择最有效的信号滤波和身体活动监测窗口解决方案。分类器的开发过程是基于三个阶段;特征提取阶段,特征选择阶段,培训阶段。在训练阶段,公开的数据集是用来测试在不同分类器类型和学习方法。计算要求较低的用户友好的android智能手机应用程序开发领域运行测试,可以轻松地更改分类器下测试,并收集新数据集准备使用机器学习api。新创建的数据集可能包含额外的信息,比如智能手机的位置,它的方向,用户的物理特性。使用移动工具,基于决策树分类器最后设置和富含的引入一些鲁棒性的改进。 The developed approach is capable of classifying six activities, and to distinguish between not active (sitting) and active states, with an accuracy near to 99%. The mobile tool, which is going to be further extended and enriched, will allow for rapid and easy benchmarking of new algorithms based on previously generated data, and on future collected datasets.
1。介绍
无处不在的智能手机和他们一起不断增加计算、网络和传感功能已经改变了的人们的日常生活。等,活动识别,将原始传感器数据作为输入,并预测用户的活动,已经成为一个活跃的研究领域近年来(1- - - - - -3]。活动识别旨在理解行为和目标的一个或多个人类,从一系列的观察他们的行为和环境条件。事实上,人类活动识别(HAR)已成为一个极大的兴趣,特别是对医疗、军事和安全应用程序。例如,糖尿病患者、肥胖或心脏病往往要求执行一个定义良好的体能训练作为治疗的一部分。因此,能够自动识别活动,如散步、跑步,或休息时,成为一个强大的工具,鼓励病人和照顾者提供反馈他们的行为。哈尔应用领域包括(4)日常生活监控(5- - - - - -8)、个人生物签名(9],老年人和青少年保健[10- - - - - -12),和本地化13,14]。
系统旨在刺激身体活动的必要前提条件(PA)是监视功能启用HAR。促进人们PA的重要性,通过虚拟教练,是出于最近的研究结果,与久坐行为与“糖尿病,心血管疾病的风险升高,全因死亡率”(15]。其他健康状况恶化,如代谢综合征,2型糖尿病,肥胖,也与缺乏增加活动密切相关。不幸的是,现代工作场所通常是由几乎不活动密集的成年人花几个小时坐在(16],增加两个小时这种“职业”的相关活动已增加5 - 7%的健康风险突出以上(17]。只有一小部分的成年人(18岁到64岁)在发达国家与全球体育活动(GPA)指导方针,建议至少150分钟的“中度到剧烈”PA /周。体重增加,肥胖、懒惰的生活方式的另一个副作用:除了医疗费用,也会使相关的经济损失,由于错过了工作时间,降低了生产率,和残疾(18]。
根据前面的讨论,更换时间坐在工作场所和低强度的爸爸可能有助于预防慢性疾病。提出了一些奇异的解决方案,例如工作站,使工人站立或走路,使用专门设计的站或跑步机办公桌(19]。刺激巴勒斯坦权力机构通过一个虚拟教练可能是一个可行的解决方案,而且,这一目标,一个精确的监测工作场所的日常活动是一个非常重要的任务。
这项工作提出了一个移动应用程序,称为Actimonitor安卓作为快速和简单测试工具开发的算法旨在准确监测工作场所的日常活动。使用加速度计传感器车载主流智能手机,甚至实现的可行性复杂HAR系统在智能手机上。首先开发和测试工具在离线学习阶段。后来,它是一个移动平台上执行。典型smartphone-related约束,如可用的计算资源,内存和电池供电,提高具体挑战对于高需求的移动应用程序,像哈尔,需要特征提取,分类,和传输相关的大量的原始数据。此外,目前开源机器学习(ML)应用程序编程接口(api),如对知识的怀卡托环境分析(WEKA) [20.)和Java数据挖掘(JDM),设计既不,也不优化,与完整的功能在移动平台上运行。因此,相关问题解决在这工作是哈尔的移动实现系统响应时间、会议和能源消费需求。
本文的组织结构如下:部分2介绍了哈尔的问题,讨论的角色活动识别传感器和最先进的算法。节3数据集、工具和方法用于实验,哈尔的移动应用开发的算法设计。实验结果讨论了部分4;最后,部分5总结了纸。
2。人类活动的认可
2.1。回顾文献
经典毫升的方法是采用在哈尔系统中,分类是表现在从原始传感器数据中提取特征,正确收集、预处理,并安排到基于时间的片段。从数据的特性,一个抽象的过程,基于统计或频域属性获取合理的信息在每个数据段,养活一个标识符。选择的功能可能需要减少维度处理的数据分类算法设计培训在一个数据子集和评估测试数据子集。
大多数研究HAR通过移动设备进行了使用传感器收集的数据从智能手机但随后处理离线通过ML工具箱,如WEKA [20.]。正如前面提到的,智能手机与资源有限,传统上认为是设备的计算处理和电池寿命21]。虽然它仍然是重要的考虑这些限制为智能手机开发HAR系统时,这些设备变得越来越能够运行复杂的实时HAR。然而,挑战仍在哈尔的评估解决方案,尤其是在各种硬件和软件组件。而广泛的研究报告和审查离线HAR(例如,22,23]),几人已经完全实现HAR手机实时处理(24]。这应该包括传感、预处理和分类,所有本地设备上进行。
提供的数据一个加速度计和陀螺仪车载Android智能手机放在衣袋中已经被被使用et al。25),认识到简单的动作(坐,走路,跑步,和站),甚至更复杂的活动(清洁、烹饪、洗手和服药)。识别简单的行动已经达到93%的准确率,由多层感知器分类器和一两秒的时间窗口。包含复杂的活动数据集精度下降到50%,但这些结果承诺为当前工作,旨在识别简单的体育活动如散步,站着,和选址在办公室环境,智能手机使用数据从一个传感器。然而分类的研究是进行离线使用WEKA工具包,因此需要实时实现和测试。摘要通过金等。26]哈尔的解决方案开发评估身体活动和各建筑物的能源消耗。此解决方案,为Android设备开发的,公认的散步,登山和下行楼梯,跑步,没有运动。支持向量机(SVM)使用加速度计的数据,陀螺仪,和磁强计提供分类,实现精度高(98.26%)。
在分类器实现和测试在过去的几年中,手机可以提到决策树(DT) [22,23),支持向量机(27),最近的邻居(nn) [24),和朴素贝叶斯28]。多层或分层分类组合分类器以不同的方式获得。Reddy et al。29日)结合DT和动态隐马尔科夫模型(DHMM),达到93.6%的精度从十六岁的演员在一个数据集。在大多数的研究中,离线训练分类器,使用代表数据,因为培训是计算昂贵和不匹配的实时要求。然后,分类实时实现。最近,Google发布了一个实时活动识别API (30.];然而,这仅限于motion-related活动(步行,骑自行车,驾驶),不包括静态活动,比如站着还是坐着,都对这项工作的兴趣大减。
实时反馈给用户上下文意识和医疗应用程序的另一个重要方面,特别是当试图促进PA。然而,在大量的没有该特性研究[31日]。一个系统开发的车道等。28)通过动画的用户界面,提供了实时反馈反映用户的行为,这是一个慢动作的静态条件下,增加活动的和更有活力。在这个工作我们旨在刺激促使主体的PA,基于PA通过自我监控Actimonitor安卓应用程序。
以下部分提供HAR分类过程的细节讨论当前实践中的文学。包括数据采集、预处理、特征提取和分类的步骤。
2.2。问题定义
诉诸于(32)和借贷相同的符号,哈尔(竖琴)可能是数学问题和正式定义,从传感器收集的数据和索引在时间维度和假设异时活动:
定义1(琴)。给定一组的从一个特定的测量时间序列,每一个属性中定义的时间间隔,我们的目标是找到一个时间分区的基于输入的数据,和一组标签代表执行的活动在每个时间间隔(例如,坐和行走)。这意味着时间间隔是连续、非空的和不重叠的,这样吗。
非常大(甚至无限)的属性值的组合和活动及其一般未知时间防止确定性解决毫升的竖琴,需要使用工具。轻松的版本的问题因此,时间序列分为固定长度的时间窗口,如下。
定义2(放松竖琴)。给定一组的时间窗口拥有相同的大小和被完全或部分标记,这样每个包含一组时间序列从每一个测量属性,和一组活动的标签,我们的目标是找到一个映射函数可以评估所有可能的值,这样尽可能接近实际活动期间执行。
放松到模型引入了一些错误,但是对于大多数应用程序来说可以忽略不计。相关活动识别方法是结合不同模型的输出产生更精确的预测。这导致multiclassifier系统,证明是有效的,在增加计算复杂度为代价的。相结合的正式定义预测从几个学习者如下。
定义3(与multiclassifier竖琴)。给定一个特征空间分类问题和一组类,一个实例分类和预测为,从分类器,multiclassifier系统的目的是返回正确的标签敌我识别。
面临的一些挑战活动识别是常见的其他领域,但有几个具体问题的专门的计算方法已经开发出来。高度多样化的人类活动的识别需要选择,结合几个异构传感器,可以动态地添加或删除,基于应用程序的需求。合适的指标终于HAR系统性能评估定义。表1总结了期权在哈尔系统设计和实现。
|
|||||||||||||||||||||||||||||||||
2.2.1。活动
活动认识从传感器数据可以以不同的方式进行分类,例如,在他们的复杂性。一个简单的运动可以走路、慢跑、步行下楼,电梯,等等。复杂的活动通常是相关的行为(例如,汽车和驾驶),但甚至可能对应于某些身体部位的运动(如打字和挥舞的手)。一些活动可能指的是医疗的一般环境,如下降,锻炼和康复。基于位置的活动包括餐饮、购物和看电影。活动包括建立离开或进入一个地方。一个红外传感器可以检测用户移动或仍在,而家里协助机器人能够理解人睡觉时,服药,或做清洁4,33,34]。
解决方案为哈尔必须开发健壮的“同类”和“组内的可变性,前者发生在相同的活动是由不同的人以不同的方式执行的,甚至是同样的在不同的时间,而后者由于数据显示非常相似的特征,即使属于完全不同的类。并非所有的数据时连续流相关HAR,所谓的零类问题可能发生,这是困难模式,因为它代表一个理论上无限空间的任意活动。最常见的分类活动的目标HAR系统总结表2。
|
||||||||||||||||
2.2.2。传感器、数据预处理和分割
传感器的原始数据收集来源识别活动,他们可分为三类:视频、环境、和可穿戴传感器。
可穿戴传感器是小型移动设备设计,穿在人体日常活动。他们可以记录用户的生理状态、位置等的变化,移动方向,和速度。有许多可穿戴传感器车载智能手机:表3总结了实际(硬件)和虚拟(软件)传感器所提供在当前主流移动设备(4,34,35]。
|
|||||||||||||||||||||||||||||||||||||||
由于加速度计的固有特点,传感器定位设备的方法是由主体可能严重影响原始数据值。最常见的位置传感器用于文学手持,穿带,在裤子口袋里,和骨盆区域。敏感方向可能会解决通过添加另一个传感器,通过聚合技术。
从传感器收集原始数据预处理,以降低噪声的影响通过过滤方法,如平均平滑。此外,预处理使来自多个传感器的数据同步样品到达时,删除或工件。
可穿戴传感器信号的预处理等加速度可能需要校准,单位转换,规范化,重采样、同步或信号电平融合36]。数据分割允许识别的预处理数据流可能包含信息活动(活性检测或发现)。这通常是一个关键的步骤,哈尔,由于分离和鉴定活动的内在复杂性,人类通常执行没有分离的时间。
2.3。特性和最先进的算法
活动识别依赖于从信号处理特征提取和选择,通过适当的操作转换或者转换,从不同的领域。特性计算可以自动或来自专业知识。“功能空间”由总数的特性从数据中提取。如果提取已经执行,功能对应相同的活动应该出现明显集中在空间,他们应该清楚地分开,如果属于不同的活动。同样的,选择的特性好如果他们健壮的组内差异和不同的对象执行相同的活动。广泛的文学特性已确定,根据它们的数据类型中提取。其中,可以提到以下几点:ieee,身体模型,基于事件和多层次特征。另一个分类的特点是基于域有关的检查数据,详细表4。
|
||||||||||||||||||||||
为了限制分类过程的计算复杂度和所需的训练数据的参数估计,应该保存在特征空间维数最低,通过识别核心的一组特性,仍然允许目标所需的性能。这也减少了内存和带宽要求嵌入式系统的实时处理。
一旦最有效的特征提取,哈尔系统算法的一个基础部分需要分类记录数据的新实例(37]。算法输出的分类标签是由一个模型训练。提出了几种推理方法在ML和计算统计,如表中列出5。在监督ML算法,函数推断从一组地面truth-labeled训练的例子,目的是最小化分类误差,能够映射新的例子(测试的)。
3所示。材料和方法
3.1。数据集
的实验室和实际记录数据,这项工作为基础,从(38Kwapisz等人所使用的),在39),其中包含加速度计数据记录安卓智能手机放在裤子口袋里,在平均采样频率赫兹。这个数据集实际上是分为两个部分:一个较小的记录在一个受控的实验室环境和更大的记录和标记的用户,在实际设置。
实验室数据集记录使用智能手机的三种类型:Nexus One,HTC的英雄,摩托罗拉后空翻。的志愿者执行一组特定的活动(散步、慢跑,升序和降序楼梯,坐着,站在时间的),同时携带一个安卓智能手机在他们面前腿裤子的口袋里。数据集的时间总长度录音≈15 h,对应于平均≈25分钟记录为每个用户。
真实的数据集是由用户自由记录和标记在他们的日常生活,没有一个特定的协议。这个数据集也有几乎所有的人口统计信息用户(男性和参与试验的女性);他们在数据进行了总结1,2,3。的用户,声明有一个受伤影响他们走路的方式。这个数据集的时间总长度是≈42 h。在这个数据集,楼上和在楼下活动分为楼梯介绍了一个新的活动,也就是说,躺着
因为数据集与智能手机记录,采样频率不固定,在录音期间可能会有所不同。主要问题是分类器,来表达其最好的表演,有工作特性提取时间窗口相同的采样频率。其中一些可以改变太多,当采样频率是不同的,即使计算相同的活动。因此所有的时间窗口平均采样频率±2赫兹的目标价值已经被抛弃了。
需要考虑的另一个方面是窗口技术:因为所有的原始数据按顺序写在一个文本文件,重要的是要将它们正确,因为提取的时间窗口必须属于同一用户和相同的活动。重叠没有使用以来,设计解决方案是逐步填补在窗口文件读取操作(逐行,因为它们要求时间)和截断窗口,当一个活动或用户检测到变化。所有的窗户都用不到目标样本已丢弃。表6总结了配置用于处理数据集。然后计算特性是写在一个文件可以使用WEKA工具包。数据4和5总结的类分布数据集处理,一旦违规时间窗口被丢弃。
|
||||||||||||||||
3.2。培训和测试方法
训练和测试不同的分类器,使用一个共同的过程。每个分类器选择通过分类选项卡的WEKA explorer,一个标准的10倍交叉验证被用来获得更可靠的结果。
没有特定的实例有过滤的方法,实际上所有的窗户一定活动使用。分类器已经表现的评估,培训时间,生成的模型解释能力和模型文件的大小。最后一个特性是相关的目标实现分类器在移动应用程序。事实上,一旦训练,该模型必须序列化,反序列化,并存储在智能手机应用。特别是,表演已经通过最常见的指标用于评估ML -精度,还记得,和f值——但也通过分析获得的混淆矩阵,探讨可能的分类问题和算法的缺点。
3.3。实现移动应用的快速设计的身体活动监测算法在工作场所
主要的用例Actimonitor安卓应用程序跟踪用户的PA和允许记录和收集新数据,目的是创建并填充一个新的、更完整的数据集,对一个从文献检索(38]。移动应用程序只是一个更大的预期系统的一部分,旨在从许多用户收集数据,所以它也允许用户配置文件的管理(设置密码,电子邮件,和登录)。此外,这个应用程序是为了还用于同步数据和收集并存储在智能手机,一个在线远程web服务器。
3.3.1。数据采集和处理
类处理数据采集和处理是最重要的,因为他们是负责检索数据从传感器、计算功能,分类实例,编写最终结果在应用程序内部数据库和文件。主类,管理的所有操作BackgroundSensorsService一,其结构如图6扩展一个常规Android服务类。创建类并开始一旦用户激活录音,和它运行在后台执行传感器数据收集和跟踪活动,甚至一旦应用程序关闭。类只能通过应用程序来启动或停止。它也执行加载和反序列化的WEKA训练模型。
跟踪活动只有当屏幕附近,距离感应器检测到一个对象(即。,智能手机被公认为是口袋里)。一个单独的线程负责写在文件中收集到的数据(包括原材料数据),管理目录的创建将存储的文件,并更新智能手机的文件系统。
应用程序的性能是一个重要的要求,特别是对实时约束。问题是解决分裂和运行过程在不同的线程;这将导致一个更大的实时保证金和不影响智能手机的稳定性。
3.3.2。用户界面
应用程序用户界面开发的原则材料设计(40]。这个应用程序允许用户访问函数从顶部和侧选择菜单(图7)。点击一个条目的一个两个菜单开始一个新的接口所需的函数或可视化。特别是在当前实现中,菜单是用于访问应用程序的设置和顶部菜单提供了所有的实际功能。不同的接口是通过独立的实现Android的片段互相取代。
应用程序能够分类和跟踪用户的活动,使用之前训练分类器。用户的分类器训练的情况下把裤子口袋里的智能手机,用的上部设备针对面临的地面和屏幕的腿。因此,用户对智能手机的位置,选择正确的设置如图8。然后,通过访问接口的跟踪部分,录音可能开始,如图9。之后,用户对智能手机的口袋里。应用程序时将停止记录检测到智能手机不再在口袋里,将重新启动时自动检测到这种情况了。同时,通知会出现在智能手机locked-screen。
3.3.3。数据结构
完成所有的需求和轻松地管理工作流系统必须设计一些有用的数据结构,将传感器收集的数据和生成的应用程序本身。此外,内部数据库结构设计,永久将跟踪数据存储在一个有效的方法。
内部数据库主要是用于存储训练数据的跟踪和(原始数据),在不同的表中。要解决的主要问题之一就是大型的数据库在日常录音。然后数据库设计只存储基本数据。特别是,表来存储跟踪数据只包含窗口的绝对时间戳,标签,和少量的信息。对于原始数据,每一行包含一个时间戳,三轴加速度计的值(可选地,也气压值),和一个小的附加信息;这些行存储为每个窗口。所以并不是所有的计算存储特性,因为它们需要大量的内存,可以在一个简单的方法重新计算后,如果必要的。
数据库的大小增长估计离开应用程序工作几个小时,可以确认,仅供活动跟踪,在一个标准小时工作日,订单的增长是数以百计的KBs,同时,如果保存原始数据,该值可能会升至10 mb。由于这些原因选择离开用户自由选择存储的原始数据,通过应用程序的选项设置。此外,这种方式,假设定期同步与远程web服务器至少一周一次,数据库大小还不代表一个问题。解决另一个问题是所需的时间迅速写一组数据库中的元组一次。当使用提供的助手类安卓SDK,这个操作非常慢(≈1.5 s)。出于这个原因,来存储元组原始数据/ windows,基于低水平的方法SQLiteJDBC驱动程序。通过这种方式,可以降低时间只有≈100 ms。
3.3.4。分类系统实现
特征提取阶段由四个类实现(每组的一个特性),很容易在必要时只选择其中的一个子集。这些类被称为TimeDomainFeatureExtractor,FrequencyDomainFeatureExtractor,结构特征提取器和TransientFeatureExtractor。他们都扩展抽象类FeatureExtractor。存储计算功能,逐步为每个子群,在主FeatureSet类实例。
的分类阶段是WEKA库已经使用更广泛。一旦FeatureSet从目标时间窗,有必要把它翻译成WEKA实例代表一个例子被分类。这已经通过该方法toInstance es(实例)的FeatureSet类。该方法将WEKA作为输入实例类(一个Java接口的数据集和它的情况下,不与混淆实例)。特别是,这个想法是提供一个虚拟数据集(空的)的相同的头一个用来训练WEKA模型。这个软件可以检查FeatureSet包含所需的所有功能,如果不抛出异常。的实例类代表虚拟数据集通过阅读获得一个简单的文件存储在应用程序资源。
由于虚拟数据集和模型存储在文件中,他们必须在启动加载程序(准确地说,在启动或BackgroundSensorsService)。WEKA工具提供了这种操作的助手类。可以获得一个数据集的一个代表实例类。此外,反序列化模型,读辅助类的方法SeralizationHelper应用:通过阅读模型文件,它给回已经训练了吗分类器类实现的存储模型。
仅仅是通过分类器的分类方法classifyInstance(实例),作为输入实例进行分类并给出作为输出双值从来,在那里类的数量。算法1显示了一个简化的实现采用的分类过程,阐明了使用前面提到的类。
|
||||||||||||||||||||||||||
4所示。结果与讨论
4.1。基分类器的选择
分类器选择的第一步是选择从一个基础。因此,移动手机应用程序的实现之前,三个最常见的算法在文献中测试:DT,神经网络和神经网络。特别是,在WEKA中实现的类已经被使用,它们使用默认参数,总结在表7。训练分类器,所有的时间窗口从实验室记录中提取数据集(见图4)已被使用。
|
|||||||||||||||||||||||||||
绩效评估考虑到加权平均f值表明之间的神经网络分类器是最好的三个指数。性能的差异主要是由于误分类只有一个子集的活动。尤其是,最成问题的是楼上和在楼下活动,通常分为简单走。即使总体性能指标是好分类器,表中给出8,DT显示最糟糕的表现这两个活动,一个f值等于和,分别。混淆矩阵表中给出9显示这个子集之间的频繁的误分类活动。
| (一)DT | ||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||
| (b) 神经网络 | ||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||
| (c)神经网络 | ||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||
| (一)DT | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| (b) 神经网络 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| (c)神经网络 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
关于训练模型,所需的时间越快神经网络只有0.1秒,因为它是一个懒惰的分类器。DT也快,2.88年代需要训练分类器。神经网络的训练过程是慢得多,因为它需要967.16秒。模型的可解释性是另一个需要考虑的方面,针对移动应用程序工具开发。
最后,由于所选模型必须序列化并存储在一个智能手机应用程序,文件大小是一个重要的特点。DT和神经网络产生≈1 MB大小的模型,稍微大点的神经网络。神经网络给出了≈10 MB的模型。事实上,学习懒惰的缺点包括大空间需要存储整个训练数据集。此外,特别嘈杂的数据增加了需要设置不必要的,因为没有抽象是在训练阶段。
图10显示了三种分类器的特点的总结。DT的所有考虑的特点,给出了一个很好的妥协交易性能。然后,这是基分类器选择建立最终的PA监控系统,实现在移动应用程序的工具。
4.2。活动误分类问题
如上所述,主要的性能损失是由于错误分类的一些活动。在这个子集将被称为类小位移活动,相比之下静态的活动(坐着和站)和大位移活动(慢跑)。活动在这个子集的特性非常相似的特征和运动;提取的特征有相似的价值观,导致弱和容易出错的模型。
另一个问题,这主要是在测试阶段,分类是错误的缓慢的步行活动。这可能是由于这一事实走数据被记录在一个控制设置,也就是说,以一个固定的速度在跑步机上,然后步行活动不同的或不规则的速度有时分类错误楼上或在楼下。
由于这些原因,需要一个更精确的和更强的模型不仅能更好的区分小位移活动但也概括数据和认识到更大范围的步明显出现。产生一个更好的分类器两种解决方案测试,分级方法和广义数据方法,其中一个选择。
4.2.1。准备分层的方法
第一种方法测试是分层的,它允许分裂原问题在多个更小的子问题。这个想法是创建简单但之间的强分类器选择几个活动。在图11,这两个层次计划提出和测试显示,但只有图的结果11 (b)报告,因为它执行比图(11日)。选择的层次分类器是基于简单的DTs,困难相关的维度分类目标的活动。作为一个例子,使用的模型走楼梯平均的节点数量等于90,而jogging-standing只有3节点。
(一)模型1
2 (b)模型
考虑到主要对性能的影响是给定的小位移活动,该模型涉及到这三个是最重要的一个活动,影响整体性能。表10(一),10(b)10(c)显示这个较小的分类器的性能,但考虑到f值值,很明显,没有改善“较小”的模式。真正的问题是在数据选择训练分类器,而不是使用的分类方案。特别是,他们必须广义。
| (一)性能累积索引 | ||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
| (b)混淆矩阵 | ||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
| (c)详细准确的类 | ||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
4.2.2。数据泛化方法
泛化训练数据的一个解决方案是使用真实的数据集的数据,因为它们是收集的用户在现实生活条件和可以给一个更好的和活动的综合模型。假设最成问题的活动相关的行走动作和实际数据集不包含楼上和在楼下类,只有走窗户已经被使用。图12显示了新类分布,一旦走时间窗口包含来自现实世界的数据集。即使现在的类分布强烈不平衡、增加新的时间窗口是必要的,来识别不同的模式和步走,证实了实验。
表中提供的新结果11显示出改进的加权平均f值价值,从来,但两类影响明显的性能损失,也就是说,楼上和在楼下。原因是一些用户收集的数据通过将智能手机有不同的取向与实验室数据集。这个事实会产生误分类和性能减少对这些活动尤其是智能手机位置和姿态的影响。有需要加强模型和恢复上的分类性能楼上和在楼下活动,但保持概括介绍。
| (一)性能累积索引 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| (b)混淆矩阵 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| (c)详细准确的类 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
4.3。鲁棒性的改进
分类器必须更加对不同智能手机方向和可能的标签错误的现实世界的数据集。它必须是关于人们的使用方式也更不敏感,执行相同的活动,但仍保留类分离属性。这一目标,引导聚合和成对分类使用。前标识整体学习技术,其中装袋一个是使用和应用于DT分类器。后者分解分类成几个两问题,结合他们的输出通过投票技术(至于装袋)。如果类均匀填充,成对分类器是至少快速培训和其他多类方法(41,42]。此外,由于DT执行一个内在特征选择和考虑的难度区别这两个选择的活动,有一个简单的两级分类器允许创建模型的可接受的复杂性。DTs中的节点数量如上所述相同的数量级。
4.4。最终结果数据集
一旦描述方法和技术应用,可以欣赏加权平均的总体性能改善f值的价值。特别是,它改变和来和,因为楼上和在楼下,分别。
一个重要的视角分析是智能手机定位算法的灵敏度。为了测试这方面,两个数据集都被处理反相的轴加速度计和模拟智能手机在不同取向(颠倒)。然后训练模型试验中得到了这些数据。正如所料,性能下降到一个f值的,由于楼上和在楼下,但在特定的站类,取向高度影响的分类。
由于这些原因是有用的,创建一个模型只有两个活动减少。考虑的目标监测巴勒斯坦权力机构在一个工作场所,最低目标是区分不活跃的(坐着),活跃的(所有其他活动)。因为类分布也变得更加不平衡,坐着实例的真实数据集也被添加到测试和训练集;这个新类分布如图13。这个设置显示改善性能,根据表12,实现了平均加权f值的测试完成了,甚至颠倒智能手机方向。鉴于这些结果,该模型适用于实现即使在智能手机方向不是固定的,或没有方向的信息。进一步的解决方案可能是估计的方向特性,不受方向,像加速度大小43- - - - - -45),然后使用不同的分类器对于每个相关的位置。
| (一)性能累积索引 | ||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||
| (b)混淆矩阵 | ||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||
| (c)详细准确的类 | ||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||
5。结论
本研究的目的是解决简单和快速开发和测试使用的分类器在身体活动监测系统中,针对个人在他们的工作场所。这样的结果已经通过一个基于android系统的手机应用程序的设计,也展示了实现更复杂的HAR解决方案的可行性在主流设备如智能手机。本文提供了一个完整的概述的活动分类问题从多个角度,从传感器使用的类型和他们的立场最常用的分类技术在这一领域。哈尔的移动应用算法设计提出了使用最先进的机器学习工具,比如WEKA工具包。当时可能提供了一个广泛的绩效评估的一些最常见的分类器。后来,发生的主要问题的分析。这导致了一个系统的设计能够在一个简单而有效的方法克服这些问题。
特别是HAR实现系统设计用于在一个工作环境监控工人的体力活动,配备能力区分六个活动。选择分类器是基于DTs的层次结构的一些改进,增加和成对分类、应用,增加的平均表现。最终的分类器达到加权平均f值左右的。简化的方法能够区分活跃的和不活跃的状态进行了研究,为设备提供大幅减少敏感性取向;这是一个的能力f值到。这最后一种方法可以被使用,例如,在一个上了年纪的监控系统,因为它保证非常高的性能分类的简单活动,有助于检测病人的状态在一个房间里。
最终的算法已经被利用调谐通过一个测试和快速发展安卓特别开发的智能手机应用程序。所有的软件组件应用后实现了安卓设计模式和使用WEKA API分类系统的核心。这样的应用程序集的基础新算法的设计,因为它允许一个非常简单的分类器的更换,仅通过改变他们被序列化的文件。它可能是一个基准测试新算法实用和简单的工具,甚至和可扩展适用于不同的领域相比,PA监控。提供的应用程序甚至记录收集传感器数据的能力,创造未来新的哈尔和更丰富的数据集。
相互竞争的利益
本文的作者宣称他们没有利益冲突。
确认
这项工作是支持的成本行动IC1303 AAPELE,架构,算法和增强生活环境的平台。实验部分的工作在伊拉斯谟的框架进行+意大利和阿尔斯特之间的学徒。
引用
- d·j·库克和n·c·克里希南活动学习:发现、识别和预测人类行为从传感器数据2015年,约翰·威利和儿子。
- Aggarwal和m . Ryoo”,人类活动分析:审查。”ACM计算调查,43卷,不。3、第十六条,43页,2011。视图:出版商的网站|谷歌学术搜索
- f .矸石,穆罕默德,m . Dedabrishvili f . Chamroukhi l . Oukhellou y Amirat,“物理人类活动识别使用可穿戴传感器,”传感器,15卷,不。12日,第31338 - 31314页,2015年。视图:出版商的网站|谷歌学术搜索
- 苏x、h·通和p .霁”活动识别与智能手机的传感器,”清华科技,19卷,不。3、235 - 249年,2014页。视图:出版商的网站|谷歌学术搜索
- h . Alemdar c Tunca, c . Ersoy”日常生活行为监测健康评估使用机器学习:桥接域之间的差距,“个人和无处不在的计算,19卷,不。2、303 - 315年,2015页。视图:出版商的网站|谷歌学术搜索
- b·布鲁诺、f . Mastrogiovanni和A . Sgorbissa“诽谤联盟认可的公共领域数据集使用wrist-placed加速计,”学报》第23届IEEE国际研讨会机器人和人类互动交流(IEEE RO-MAN 14)英国爱丁堡,页738 - 743,,2014年8月。视图:出版商的网站|谷歌学术搜索
- t·r·贝内特j .吴n . Kehtarnavaz r .贾法里,“惯性测量单位可穿戴计算机辅助生活应用程序:信号处理的角度来看,“IEEE信号处理杂志,33卷,不。2,28-35,2016页。视图:出版商的网站|谷歌学术搜索
- n . Roy a . Misra d·库克,“环境和智能手机传感器辅助adl识别multi-inhabitant智能环境中,“环境智能和人性化计算杂志》上,7卷,不。1 - 2016页。视图:出版商的网站|谷歌学术搜索
- t .武田,k . Kuramoto s Kobashi, y哈塔,“可穿戴的压力传感器,生物识别技术个人识别”学报》第五届国际会议上新兴的工程和技术趋势(ICETET 12)IEEE,页120 - 123年,姬路城,日本,2012年11月。视图:出版商的网站|谷歌学术搜索
- s . Patel h .公园,p . Bonato l . Chan和m·罗杰斯“回顾可穿戴传感器和系统与应用程序在康复,”神经工程学和康复杂志》上,9卷,不。1,1卷,2012页。视图:出版商的网站|谷歌学术搜索
- p . Bonato“可穿戴传感器和系统”,IEEE,生物医学工程杂志卷,29号3,技能,2010页。视图:出版商的网站|谷歌学术搜索
- p . j . Merilahti Viramo i Korhonen,“可穿戴监测的物理功能和残疾的变化,昼夜节律和睡眠模式在护理之家居民,”IEEE生物医学和卫生信息学杂志》上,20卷,不。3、856 - 864年,2016页。视图:出版商的网站|谷歌学术搜索
- g . a . Farulla l . o . Russo s罗莎和m . Indaco”ORIENTOMA:自主平台和安全导航盲人和视力受损,”第十届IEEE国际研讨会论文集在纳米集成系统的设计和技术时代(dti的15),页1 - 6,那不勒斯,意大利,2015年4月。视图:出版商的网站|谷歌学术搜索
- 李y、m . Liu和w·盛”室内人体跟踪和状态估计,通过环境传感器和可穿戴传感器融合”《IEEE网络技术在自动化国际会议上,控制和智能系统(网络15)沈阳,页1468 - 1473年,中国,2015年6月。视图:谷歌学术搜索
- c . Tudor-Locke j . m . Schuna Jr . l . j .福雷山姆私下和m . Proenca“改变我们的工作方式:提升能量消耗与工作站的替代品,”国际肥胖期刊,38卷,不。6,755 - 765年,2014页。视图:出版商的网站|谷歌学术搜索
- j.y.洲,戴利,s·邓恩et al .,“坐立的有效性工作站改变办公室工人坐在时间:Stand@Work随机对照试验的结果飞行员,“国际行为营养学杂志和体育活动article127卷。11日,2014年。视图:出版商的网站|谷歌学术搜索
- f·b·胡t . y . Li g·a·科迪兹w·c·威利•和j·e·曼森”看电视和其他久坐行为与女性肥胖和2型糖尿病的风险,”美国医学协会杂志》上,卷289,不。14日,第1791 - 1785页,2003年。视图:出版商的网站|谷歌学术搜索
- x的歌,r·g·w·奎克s . r . Gandra k . a . Cappell r·福勒和z琮、“生产力损失和间接成本与心血管事件和相关的临床过程,”BMC卫生服务研究,15卷,不。1,第245条,2015。视图:出版商的网站|谷歌学术搜索
- b . t . MacEwen d·j·麦克唐纳,j . f .毛刺”的系统回顾和跑步机办公桌站在工作场所,“预防医学卷,70 - 58,2015页。视图:出版商的网站|谷歌学术搜索
- WEKA(怀卡托环境知识分析),2015年,http://www.cs.waikato.ac.nz/ml/weka。
- 答:卡罗尔和g·黑瑟”,在智能手机功耗的分析,”USENIX USENIX大会年度技术研讨会论文集(USENIXATC 10)USENIX协会,p。21日,波士顿,质量,美国,2010年6月,http://dl.acm.org/citation.cfm?id=1855840.1855861。视图:谷歌学术搜索
- h·马丁,a . m . bernardo j .·伊格莱西亚斯和j·r·Casar”活动日志使用轻量级分类技术在移动设备上,“个人和无处不在的计算,17卷,不。4、675 - 695年,2013页。视图:出版商的网站|谷歌学术搜索
- a . Anjum和m·伊卜拉欣-,“活动识别使用智能手机的传感器,”《IEEE 10日消费者通讯和网络会议(CCNC 13)919年,页914 -拉斯维加斯,内华达州,美国2013年1月。视图:出版商的网站|谷歌学术搜索
- m .高丝、o . Incel和c . Ersoy“在线识别在智能手机上,人类活动”车间的程序移动传感:从智能手机和衣物到大数据,页11 - 15号,北京,中国,2012年4月。视图:谷歌学术搜索
- 德恩巴赫,Das, n . c . Krishnan b·l·托马斯和d·j·库克,“通过智能手机的简单和复杂活动识别,”第八届国际会议上智能环境学报》(12)瓜,页214 - 221年,墨西哥,2012年6月。视图:出版商的网站|谷歌学术搜索
- t·s·艾。金,黄永发。曹,j·t·金,可持续性能源和建筑:诉讼的第四届国际会议在能源和可持续性建筑(SEB的12)22卷智能创新、系统和技术施普林格,柏林,德国,2013年。视图:出版商的网站
- a . m .汗,a . Tufail a . m . Khattak和t·h·莱恩”活动识别在智能手机通过传感器融合和KDA-based svm,”国际期刊的分布式传感器网络ID 503291条,卷。2014年,14页,2014。视图:出版商的网站|谷歌学术搜索
- n d·莱恩·m·林m . Mohammod et al .,”更好:传感睡眠、身体活动和社会交往促进健康,”移动网络和应用程序,19卷,不。3、345 - 359年,2014页。视图:出版商的网站|谷歌学术搜索
- Reddy, m . Mun j·伯克,d·埃斯特林·m·汉森和m·斯利瓦斯塔瓦”使用手机来确定运输方式,ACM传感器网络交易》第六卷,没有。2,13:1-13:27,2010页。视图:谷歌学术搜索
- 2016年Google活动识别API,https://developers.google.com/android/reference/com/google/android/gms/location/ActivityRecognitionApi。
- m . Shoaib博世,o . d . Incel h . Scholten和p . j . m .真的,做出“在线活动识别使用手机的调查,“传感器,15卷,不。1,第2085 - 2059页,2015。视图:出版商的网站|谷歌学术搜索
- m·a·拉布拉多和o·d·l·Yejas人类活动识别:使用可穿戴传感器和智能手机2013年,查普曼&大厅/ CRC,。
- 答:提高身价,布兰科,b . Schiele”教程人类活动识别使用穿在身上的惯性传感器,”ACM计算调查,46卷,不。3、第三十三条,2014年。视图:出版商的网站|谷歌学术搜索
- j·莱斯特,t . Choudhury n . Kern g .博列洛和b Hannaford”混合歧视/生成方法建模人类活动”19学报》国际联合会议上人工智能(IJCAI 05展出)l . p . Kaelbling和a . Saffiotti Eds。,pp. 766–772, Professional Book Center, Edinburgh, UK, July-August 2005.视图:谷歌学术搜索
- j . Parkka m . erm p . Korpipaa j . Mantyjarvi j . Peltola和i Korhonen”活动分类利用可穿戴传感器的真实数据,”IEEE在生物医学信息技术,10卷,不。1,第128 - 119页,2006。视图:出版商的网站|谷歌学术搜索
- d·菲戈,想一想p c .迪尼斯那样不知满足、d·r·费雷拉和j·m·p·卡多佐”从加速度计数据上下文识别预处理技术。”个人和无处不在的计算,14卷,不。7,645 - 662年,2010页。视图:出版商的网站|谷歌学术搜索
- n·c·克里希和d·j·库克”活动认识流传感器数据,”普及和移动计算B,10卷,第154 - 138页,2014年。视图:出版商的网站|谷歌学术搜索
- WISDM数据集、计算机和信息科学,福特汉姆大学,纽约,纽约,美国,2012年,http://www.cis.fordham.edu/wisdm/dataset.php。
- j . r . Kwapisz通用Weiss, s . a .摩尔”活动识别使用手机加速计,”ACM SIGKDD探索通讯,12卷,不。2、74 - 82年,2010页。视图:出版商的网站|谷歌学术搜索
- “材料设计为android,”2016年,https://developer.android.com/design/material/index.html。视图:谷歌学术搜索
- 工程学系。公园和j . Furnkranz“高效的成对分类,”机器学习:ECML 2007施普林格,页658 - 665年,柏林,海德堡,2007年。视图:出版商的网站|谷歌学术搜索
- c . Brunner, a·菲舍尔k Luig, t·蒂斯”成对支持向量机及其应用大规模问题,“机器学习研究杂志》上13卷,第2292 - 2279页,2012年。视图:谷歌学术搜索|MathSciNet
- n Yadav和c·爱”,准确的定位估计使用ahrs磁场失真的条件下,“传感器,14卷,不。11日,第20024 - 20008页,2014年。视图:出版商的网站|谷歌学术搜索
- a . m .汗·m·h·Siddiqi S.-W。李”,探索性数据分析选择轻量级和加速度信号的准确特性实时活动识别在智能手机上,“传感器,13卷,不。10日,13099 - 13122年,2013页。视图:出版商的网站|谷歌学术搜索
- e . m . Shakshuki A .到了m . Pomplun和d . A . Tran”研究人类活动识别从智能手机使用加速度计数据,”Procedia计算机科学34卷,第457 - 450页,2014年。视图:出版商的网站|谷歌学术搜索
- 2016年Android,传感器概述,https://developer.android.com/guide/topics/sensors/sensors_overview.html。
- i . h .威滕·e·弗兰克,m·a·霍尔数据挖掘:实用机器学习工具和技术爱思唯尔,阿姆斯特丹,荷兰;美国摩根考夫曼、波士顿、质量,第3版,2011年版。
- 程和r·格林尼人工智能的进步:14日两年一次的会议上加拿大社会计算研究的智能,人工智能2001渥太华,加拿大,2001年6月7号到9号,程序卷,2056在计算机科学的课堂讲稿施普林格,柏林,德国,2001年。视图:出版商的网站
- o·萨顿”,介绍k近邻分类和浓缩近邻数据减少,”2012年。视图:谷歌学术搜索
- j . Mantyjarvi j . Himberg, t . Seppanen“识别人体运动与多个加速度传感器,”《IEEE国际会议系统,人与控制论,卷2,页747 - 752,IEEE,图森,亚利桑那州,美国,2001年10月。视图:谷歌学术搜索
- d . Anguita a . Ghio l . Oneto x Parra,和j·l·Reyes-Ortiz“人类活动识别在智能手机使用多级hardware-friendly支持向量机,”环境辅助生活和家庭护理施普林格,页216 - 223年,柏林,海德堡,2012年。视图:出版商的网站|谷歌学术搜索
- m·希勒米和s m t . AlModarresi”,人类活动识别使用模糊推理系统,”学报2009年IEEE国际会议在模糊系统(FUZZ-IEEE ' 09),页1897 - 1902,济州岛,韩国,2009年8月。视图:出版商的网站|谷歌学术搜索
- j·a·伊格莱西亚斯·安格诺夫a .是因为Ledezma和山崎,“人类活动识别基于进化模糊系统,”国际期刊的神经系统,20卷,不。5,355 - 364年,2010页。视图:出版商的网站|谷歌学术搜索
- b .小d·j·库克,“回归树分类活动预测,智能家居”诉讼的ACM国际联合会议上普遍的和无处不在的计算(主要的14)ACM,页441 - 450年,2014年9月。视图:出版商的网站|谷歌学术搜索
- d·l·维尔·m·m·维罗索和j·d·拉弗蒂“条件随机域活动识别,”学报第六届ACM国际联合会议上自治代理和多重代理系统(AAMAS ' 07)页,235:1-235:8檀香山,夏威夷,美国,2007年5月。视图:出版商的网站|谷歌学术搜索
- 杰里科,c·纽金特,y Bi和s .吴”Clustering-based合奏学习活动识别在智能家居中,“传感器,14卷,不。7,12285 - 12304年,2014页。视图:出版商的网站|谷歌学术搜索
- a·道尔顿和g . Olaighin”比较监督学习技术在体育活动识别的任务,”IEEE生物医学和卫生信息学杂志》上,17卷,不。1,46 - 52点,2013页。视图:出版商的网站|谷歌学术搜索
版权
版权©2016苏珊娜Spinsante等。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。