医疗保健工程

在这一页上

文摘介绍实验结果结论数据可用性的利益冲突确认引用版权相关文章

特殊的问题

传感器系统对独立生活的人

把这个特殊的问题

研究文章|开放获取

体积2020年| 文章的ID8876782| https://doi.org/10.1155/2020/8876782

使用最大相关最小冗余算法特征选择的人类活动识别在智能家居环境中

Hongqing方 ,¹ 裴唐,¹ 和豪斯¹

学术编辑器: 伊万·米格尔·皮雷

收到了 2020年9月13日

修改后的 2020年10月17日

接受 2020年11月09

发表 2020年11月29日

文摘

本文最大相关性测量和最大相关最小冗余(mRMR)算法(dr)和D / R标准应用选择特性和组成不同的特征子集根据观察到的运动传感器事件对人类活动识别在智能家居环境中。然后,所选特征子集的活动和评估,识别准确率与两种概率算法相比:朴素贝叶斯分类器(NB)和隐马尔可夫模型(HMM)。实验结果表明,并不是所有的功能都是有利于人类活动识别和不同的特征子集产生不同的人类活动识别准确率。此外,即使是相同的功能子集对人类活动有不同的影响对不同的活动分类器识别准确率。人类活动是重要的人员执行识别考虑之间的特性和活动之间的相关性和冗余功能。一般来说,最大相关性度量和mRMR为特征选择算法是可行的和积极的行为识别。

1。介绍

人口的老龄化,越来越多的老年人选择生活在自己的(1- - - - - -3是一个不争的社会现实。实现目标,智能家居技术可以发挥重要作用,检测和分析卫生事件(4),并提供相应的医疗助理和照顾体弱的老年人和残疾人的人无法独立生活很长一段时间,在家里远离医院或家庭,例如,提醒他们时间吃药,看医生,帮助他们切断了水,关掉烤箱等。

实际上,准确评估人类活动的日常生活(ADLs)是智能家居的先决条件取得正确的服务,无论是长老或严重残疾的健康监测,或为他们提供其他相关的帮助。一旦检测到危险行为,智能家居本身可以应对和消除尽可能多的居民的风险。因此,人类活动的准确识别在智能家居具有重要意义,给出了模式的实现医疗为孤独的老人或残疾,这是最重要的过程将环境情报纳入智能环境中(5- - - - - -8]。

最近,人类活动感兴趣的发现和识别了很多由于其巨大的潜力在上下文意识到计算机系统,包括智能家居环境。人类活动的主要目标识别在智能家居环境中找到有趣的行为模式等收集传感器数据和识别模式。目前,人类活动识别的主要挑战之一是机器学习算法的选择在同一序列表现更好的传感器收集的数据智能家居环境中活动。在过去的几年,一些智能算法应用于人类活动识别在智能家居已报告。Singla,克兰德尔,库克等人描述一些概率算法的应用,包括朴素贝叶斯分类器(NB),隐马尔可夫模型和马尔可夫模型(毫米),(嗯)9,10]训练部分标记运动传感器事件数据获取先验参数的值,然后验证算法的性能测试的传感器数据的标签。刘等人提出了一个基于贝叶斯网络的概率生成框架艾伦的时态关系复杂的活动的原始事件来描述结构的可变性(11]。Gayathri等人提出了一种基于统计关系学习方法,增加本体活动识别概率推理通过马尔可夫逻辑网络(MLN) (12]。金等人提出了一种歧视和生成概率模型,条件随机场(CRF),作为一个更灵活的选择嗯(13]。朱等人提出了一个两层的CRF模型来表示动作片段和活动,以分层的方式,它允许两运动和各种环境的集成特性在不同级别和自动学习的捕获模式的统计特性(14]。陈等人介绍了一个基于知识的方法来持续的活动识别在智能家居(多传感器数据流15]。法希姆等人介绍了一种新颖的进化集合体模型(EEM)值小和主要活动独立处理它们,这是基于遗传算法(GA)来处理不确定性的本质活动(16]。Fleury等人提出的支持向量机(SVM)基于多通道的分类ADLs健康智能家居(17]。文和王结合潜在狄利克雷分配(LDA)演算法,共同培养一般活动识别模型部分带安全标签的数据时(18]。香港等人组成的混合模型的贝叶斯网络和支持向量机来准确识别人类活动(19]。

除了机器学习算法的合适选择,人类活动识别在智能家居的另一个关键是选择有效的特征从传感器事件在智能家居环境中收集的数据集。通常,传感器事件数据集包括大量的观察到传感器事件所产生的各种活动和任何活动带注释的数据集的各种特性,甚至冗余和不相关的功能(20.]。然而,这些特性在所有测试中选择一个方法,几乎和这些特性的影响分类器的性能很少解决。实际上,与活动无关的特征识别和初始特征之间的冗余活动识别之前需要被删除。此外,特征选择方法选择特征子集也是最有利于活动成功地识别和数据压缩。

最近,最大相关最小冗余(mRMR)特征选择算法已经广泛应用于许多研究领域,旨在实现最佳的分类性能,减少冗余的选择特性和最大化目标类的相关性。穆罕默德等人实施mRMR过滤和metaheuristic方法作为药物反应微阵列的特征选择过程分类(21]。格瓦拉等人提出了一种新颖的基于归一化互信息的特征选择方法的最大相关性和最小非线性分类或回归问题(常见的冗余22]。许等人提出了一种新的分布式监视方案集mRMR、贝叶斯推理,主成分分析工作流程(23]。李等人提供了一个细粒度的特征选择方法与一个mRMR标准基于互信息(MI) multilabel学习24]。Escalona-Vargas等人提出了一个方法,使用mRMR作为标准来自动选择参考频率相关减法的方法来减弱孕产妇和胎儿胎儿脑的心磁记录(25]。Mallik等人开发了一个新框架的统计上显著的表观遗传标志物的使用一览表就是给予一定标准mRMR特性(基因)选择multiomics数据集(26]。女子的加权距离改善预测性能计算g蛋白耦合受体科和亚科通过序列派生属性,以及mRMR的基于融合特征选择方法和其他监督过滤器(提供27]。陈和燕开发了一个优化多层前馈网络通过使用mRMR-partial互信息聚类结合最小二乘回归建立软测量控制石脑油干点(28]。王等人提出了一种多目标进化算法有评估候选人的帕累托最优特征子集,发现紧凑的特征子集最大相关性和最小冗余(29日]。Morgado和问题提出了一种多元过程能力选择nonredundant子集的特性明显快于其他类似的方法来诊断阿尔茨海默病及相关疾病在mRMR启发算法(30.]。Kamandar和Ghassemian使用一种修改mRMR作为高光谱图像分类的标准特征提取基于信息理论学习(31日]。Kandaswamy等人提取的最佳特性使用mRMR特征选择算法和随机森林算法用于预测细胞外基质蛋白(32]。金等人提出了一个新颖的健康监测方法和异常检测电子产品散热风扇的基于Mahalanobis距离mRMR特性(33]。除非等人提出了一个混合filter-wrapper特征子集选择算法基于粒子群优化的支持向量机分类。过滤器模型是基于互信息和复合测量的特征相关性和冗余的特征子集选择(34]。Zdravevski等人提出了一个通用的特性选择健壮的特性的工程方法从各种传感器,从最初记录的时间序列和一些新生成的时间序列(即。级一阶导数,δ系列,和快速傅里叶变换(FFT)基础系列);各种时间和频域的特征提取(35,36]。

受上述思想的启发,本文最大相关性测量和mRMR特征选择算法(dr)和D / R标准应用选择特性和组成不同的特征子集根据观察到的运动传感器事件对人类活动识别在智能家居环境中。然后,所选特征子集评价,和活动识别准确率与两个概率算法:NB分类器,嗯。

剩下的纸是组织如下:部分2描述智能公寓实验、数据收集和13特征观察到传感器事件对人类活动的认可。部分3介绍了信息熵的概念,互信息(MI)和最大相关最小冗余(mRMR)特征选择算法。部分4给出了训练和测试活动,最大的特征子集选择通过分析相关性度量,和mRMR特征选择算法。最后,我们展示活动识别准确率的比较结果与所选特征子集和NB分类器的性能措施以及嗯。部分5总结了主要的贡献。

2。智能公寓试验台和人类活动识别的数据收集

2.1。智能公寓的实验和数据收集

智能公寓本研究实验平台位于华盛顿州立大学校园和维护的高级研究中心自适应系统(卡萨斯)智能家居项目,其中包括三个卧室,一个浴室,一个厨房和一个客厅/饭厅。智能公寓配备了运动传感器分布式大约1米在天花板上的空间,如图1。此外,其他传感器安装提供环境温度读数和定制的模拟传感器提供阅读热水,冷水,炉子燃烧器使用。传感器数据捕获使用一个传感器网络,内部设计和存储在一个结构化查询语言(SQL)数据库。从智能公寓实验收集数据后,ADLs传感器事件注释,用于训练和测试活动识别算法(3,4,7,9,10]。

收集的数据卡萨斯智能家居是由以下参数,它指定的数量特性用来描述观察到的传感器事件。开罗数据集,数据集的广义语法(2009)日期时间SensorID SensorValue <标记>Night_wandering活动的数据集的一个例子是:{2009-06-10 03:20:59.08 M006 Night_wandering开始2009-06-10 03:25:19.05 M0122009-06-10 03:25:19.08 M0112009-06-10 03:25:24.05 M0112009-06-10 03:25:24.07 M012 Night_wandering结束}

这个例子表明,观察到传感器事件对应Night_wandering活动与具体的日期,时间,传感器ID,传感器值,和活动标签参数。

2.2。观察到传感器事件的特性

考虑到实际情况,每个活动的有13个特征观察到传感器事件:(1)传感器id的逻辑值的每个活动的传感器事件f₁。考虑到每个活动发生的地方是相对稳定的,因此,选择传感器id的平均意味着重点活动发生的地方。方程是在哪里意味着传感器id的活动吗我,传感器的数量,是传感器ID的活动我。(2)所有传感器id的方差由当前活动引起的,f₂,是 (3)星期,转化为一个值在0到6f₃。(4)之前的活动,代表的活动发生在当前活动之前,f₄。(5)活动长度,代表当前活动的长度测量的传感器事件f₅。(6)第一个传感器ID的逻辑价值引发了当前的活动f₆。(7)最后的逻辑值传感器ID当前活动引发的f₇。(8)当前活动的持续时间,这表明去年传感器之间的时间间隔,第一传感器当前活动引发的f₈。(9)当前活动的开始时间f₉。(10)当前活动的结束时间f₁₀。(11)下一个活动,代表的活动发生在当前活动后,f₁₁。(12)传感器id的模式价值引发了当前的活动f₁₂。(13)传感器id的中值由当前的活动f₁₃。

通常情况下,最优特征子集包含最少的维度,导致更高的识别准确率。因此,它是必要的,以消除剩余的和无关紧要的功能。

3所示。最大相关最小冗余的特征选择算法

3.1。熵

信息熵是一个更抽象的数学概念,它可以被理解为一些特定的信息的出现的概率。一般来说,更高的概率表明它是一种信息传播的更广泛更高度引用。因此,信息熵可以表示信息的价值。信息来源是消息的来源和消息序列。例如,最简单的离散信息来源 ,和一个给定的概率是 ;的熵X可以被定义为

3.2。条件熵,联合熵和互信息

3.2.1之上。条件熵

在信息理论中,条件熵量化所需的信息来描述随机变量的结果X考虑到另一个随机变量的值Y是已知的。如果X和Y相互依赖,的条件吗 ,条件熵X是

如果Y,那么条件熵X是在哪里p(x, y)的联合概率x和y。

3.2.2。联合熵

联合熵是衡量与一组随机变量相关的不确定性。假设两个随机变量X和Y并给出他们每个人一个有限值,然后,联合熵

联合熵是衡量的相关性X和Y。如果X和Y是独立的,那么,联合熵是吗

3.2.3。互信息

互信息(MI)是一个量的措施相似的水平以及相关的随机变量33,37]。假设两个随机变量X和Y和Y包含一些信息X,然后MI之间X和Y可以被定义为

心肌梗死通常定义为衡量两个随机变量的相互依赖。有更大价值的MI意味着一个更紧密的关系的两个随机变量之间有较大的相关性。如果MI的值是零,这意味着两个随机变量和独立无关。因此,在本文中,心肌梗死可用于测量之间的相似性特性和功能之间的关系和活动。

3.3。最大相关最小冗余(mRMR)算法

尽管MI是广泛应用于特征选择领域,仍然存在一些不足之处。大部分的特征选择算法只考虑特征之间的关系和分类类别但忽略特性之间的相互影响。相反,mRMR特征选择算法不仅应用于本文认为这些特性所提供的信息量为类别属性也之间的交互特征对分类的影响(37]。

小姐可以权衡信息特征变量之间的数量X和Y;此外,它可以测量量多少信息X可以提供Y对活动进行分类。因此,MI不仅可以显示每个特性识别活动的能力,而且测量中是否存在冗余功能。根据MI的特征,两种不同的标准可以扩展到评估特点:冗余和相关性。

3.3.1。冗余措施

之间的冗余测量利用MI的数量特征。如果MI的价值很大,这意味着有大量的信息两个特性之间的重复;即。,there are redundancies between the two features. A lower value of redundancy measure indicates a better feature selection criterion. Utilizing redundancy measure is to find the feature which has the minimal value of MI among all features.

根据这个想法,较小的冗余特性之间的信息的价值,更有利的是活动分类,可以表示通过最小化之间的MI特性,最小冗余条件在哪里特征在特征子集的数量吗年代和是MI之间的特性我和j。

3.3.2。相关措施

特征之间的相关性度量利用MI的价值和目标的活动。如果MI的值很小,这表明之间存在弱相关特性和目标活动。相反,大小姐的价值意味着特性有更大的信息量对活动进行分类。因此,有必要选择MI的最大值之间的特性和目标活动,最大相关准则,可以表示为在哪里c活动和目标吗之间的MI特性我和目标活动c。

特征选择基于相关性测量的最大值是构成最优特征子集选择MI目标活动。

3.3.3。算法设计

mRMR特征选择算法是基于上述相关性测量和冗余。它结合了功能和目标活动之间的相关性以及特征之间的冗余(33,37]。根据(9)和(10),测量和冗余的影响相关性已考虑在特征选择,全面。mRMR特征选择算法有两个评估标准,优化D和R同时,

假设有一个特征子集这是由米功能,下一步是提取最优(米+ 1)^th特性的特征子集根据(11)或(12),通过

mRMR特征选择算法的增量过程如下:步骤1。在原始特征集 ,最优特征可以选择的然后投入最优特征子集年代;步骤2。在特征子集 ,下一个最优的特性选择满足(11)或(12);步骤3。重复步骤2到找到最优特征子集年代最终满足尺寸要求。

4所示。实验结果

4.1。培训和测试活动

总共10活动进行卡萨斯智能公寓2志愿者提供NB的体能训练数据分类器,嗯。这些活动包括基础和临床发现更复杂的ADLs问卷。这些活动如下:(1)Bed_to_toilet(0)活动:床和厕所之间的转变发生在晚上时间(30实例)(2)早餐(活动1):居民早餐(48实例)(3)床(活动2):这是睡在床上的活动(207)(4)C_work(活动3):居民在办公室工作(46实例)(5)晚餐(活动4):居民晚餐(42实例)(6)衣服(5)活动:居民清理衣服使用洗衣机(10实例)(7)Leave_home活动(6):居民离开智能家居(69实例)(8)午餐(活动7):居民午餐(37实例)(9)Night_wandering(8)活动:居民在夜间(67实例)(10)R_medicine(活动9):居民需要医学(44实例)

卡萨斯的数据已经收集智能公寓试验台55天,导致这些活动的共有600个实例和647年,485年运动传感器收集到的事件。三倍交叉验证应用于NB的数据分类器和嗯在相同条件下,确保实验比较公平(38]。

4.2。特征选择与最大相关性度量

首先,最大相关性(MR)测量13的特性进行了分析。通常,MI是作为评价的标准。自从MI值较大的特征目标活动有紧密的关系,因此,MI的特性和活动之间的值必须计算。通过分析相关性度量,13个功能根据MI表中列出的值1,然后13特性已经在降序排列先后排序,分别由13个特征子集(39]。

它可以发现功能f₁₀MI的最大价值,这意味着f₁₀活动是最重要的特性来识别和目标活动的最亲密的关系。相反,f₃MI的最小值,这意味着什么f₃不歧视活动识别和目标活动最薄弱的一环。

然后,13个特征子集与奥步骤如下:1:特征子集(f₁₀)2:功能子集(f₁₀,f₉)3:功能子集(f₁₀,f₉,f₆)4:功能子集(f₁₀,f₉,f₆,f₈)5:功能子集(f₁₀,f₉,f₆,f₈,f₇)6:特征子集(f₁₀,f₉,f₆,f₈,f₇,f₁)7:特征子集(f₁₀,f₉,f₆,f₈,f₇,f₁,f₁₂)8:特征子集(f₁₀,f₉,f₆,f₈,f₇,f₁,f₁₂,f₄)9:特征子集(f₁₀,f₉,f₆,f₈,f₇,f₁,f₁₂,f₄,f₁₁)10:特征子集(f₁₀,f₉,f₆,f₈,f₇,f₁,f₁₂,f₄,f₁₁,f₅)11:特征子集(f₁₀,f₉,f₆,f₈,f₇,f₁,f₁₂,f₄,f₁₁,f₅,f₂)12:特征子集(f₁₀,f₉,f₆,f₈,f₇,f₁,f₁₂,f₄,f₁₁,f₅,f₂,f₁₃)13:特征子集(f₁₀,f₉,f₆,f₈,f₇,f₁,f₁₂,f₄,f₁₁,f₅,f₂,f₁₃,f₃)

识别准确率的活动可以分为两类:个体活动识别准确率(IARAR)和总活动识别准确率(TARAR)。的定义是

活动的结果识别准确率NB的13个特征子集分类器基于先生措施如表所示2嗯的,结果如表所示3,分别。

从表2和3,13个特征对分类器的识别准确率的影响可以发现不同。同样,NB分类器,嗯,TARARs不同不同的特征子集。一般来说,增加的特征子集的大小,活动提高识别准确率。TARAR趋向于稳定特征子集的大小最终变大。然而,这一趋势并不单调。具体为NB分类器,TARAR并不能提高特征子集7例(88.7%),介绍了功能f₇在特征子集6 (88.8%)。这意味着并不是所有的功能显然是积极的活动识别和不同组合的特性有不同的影响活动识别准确率。

它还可以发现TARAR NB的分类器的最大价值略高于嗯。12个特征子集,TARAR NB分类器达到最大价值的90.3%,同时,嗯,TARAR是88.0%的最大价值和13个特征子集。

此外,它的趋势可以看出IARARs NB的分类器和嗯是相似的;即。,with the increasing of the number of features in features subset, IARAR increases until a specific number. Again, the trends are not monotonic. For example, for activity 1, IARARs of NB classifier and HMM have risen along with the sizes of features subset. For NB classifier, the optimal value of IARAR is 100.0%, with features subset 8, and then drop down with the increasing of size of features subset. For HMM, IARAR reaches the optimal value of 93.8% with features subset 6 and then drop down with the increasing of size of features subset. Moreover, from IARARs of activity 1, it can be seen that the performances of NB classifier and HMM are different by introducing the same feature, such as featuref₄,与之相比,特征子集7(97.9%)和8 (100.0%);NB产生一个积极的结果与此功能;然而,HMM的识别性能没有提高,从89.6%减少到83.3%。即使有相同的特征子集,识别准确率可能完全不同于分类器的性能,可以找到更多的从每个活动的识别准确率。例如,NB分类器和嗯大相径庭的表演活动与特征子集1 0(0.0%比90.0%)和活动2特征子集3(88.4%比39.1%)。

此外,从表2,这是表明,相对更好的特征子集是不同的每个活动;如活动3、10个特征子集产生最好的结果,和准确率是76.1%,而特征子集2产生最好的结果的活动2,和NB的准确率是100.0%,分类器。特征子集10,IARARs活动3,4,5,6比或等于其他特性的子集;所有活动的比例是40%。然而,随着特征子集12和13日活动的IARARs 0到2,4,6到8优于或等于的特征子集10;比例是70%。因此,最优结果TARARs(90.3%)的特征子集12和13。相对来说,功能f₃和f₁₃不歧视和NB活动识别分类器。

嗯,它可以从表中找到310个特征子集生成最佳IARARs所有活动的比例最高,为40%。具体特征子集10,IARARs活动4、5、7、9都优于或等于其他的子集。然而,13日收益率最优特征子集TARAR为88.0%,这是略高于10的特征子集,87.3%。再次,它也可以得出结论:功能f₃不歧视活动识别嗯。

4.3。与mRMR特征选择算法

mRMR特征选择算法可以用来排序的13个特点和减少维度的特征子集。这是通过分析的相关性特征目标活动原始特征集删除无关的特性和保持功能目标活动有很强的相关性,分析所选特征的冗余减少维度的特征子集。

根据(11)信息的价值的不同特性,迭代的结果列在表中4dr判据。一开始,MI方程应用于获得第一个最佳特征和结果f₁₀。接下来的互动,仍然根据(11),功能f₆其他剩下的12个功能中是最优的特性。然后,每个特性的行列已经先后获得。

最后,的顺序排序功能f₁₀,f₆,f₅,f₁₂,f₁₁,f₁,f₄,f₇,f₈,f₉,f₂,f₁₃,f₃。再次,它可以发现功能f₁₀是最重要的特征和功能吗f₃不歧视活动识别。

类似地,可以获得不同的功能组的信息价值根据(12)和迭代的结果列在表中5在D / R准则。

的顺序排序的功能f₁₀,f₆,f₅,f₁₂,f₁₁,f₂,f₄,f₇,f₁₃,f₈,f₁,f₉,f₃。

虽然订单排序的特性与dr和D / R标准是不同的,仍然是第一个特征f₁₀,最重要的功能,第二个特性f₆,最后一个特性f₃,这不是歧视活动识别。

根据订单排序的特性与dr和D / R标准,13个特征可以通过添加一个特征子集以前每次先后特征子集。

13特征子集下dr标准如下:1:特征子集(f₁₀)2:功能子集(f₁₀,f₆)3:功能子集(f₁₀,f₆,f₅)4:功能子集(f₁₀,f₆,f₅,f₁₂)5:功能子集(f₁₀,f₆,f₅,f₁₂,f₁₁)6:特征子集(f₁₀,f₆,f₅,f₁₂,f₁₁,f₁)7:特征子集(f₁₀,f₆,f₅,f₁₂,f₁₁,f₁,f₄)8:特征子集(f₁₀,f₆,f₅,f₁₂,f₁₁,f₁,f₄,f₇)9:特征子集(f₁₀,f₆,f₅,f₁₂,f₁₁,f₁,f₄,f₇,f₈)10:特征子集(f₁₀,f₆,f₅,f₁₂,f₁₁,f₁,f₄,f₇,f₈,f₉)11:特征子集(f₁₀,f₆,f₅,f₁₂,f₁₁,f₁,f₄,f₇,f₈,f₉,f₂)12:特征子集(f₁₀,f₆,f₅,f₁₂,f₁₁,f₁,f₄,f₇,f₈,f₉,f₂,f₁₃)13:特征子集(f₁₀,f₆,f₅,f₁₂,f₁₁,f₁,f₄,f₇,f₈,f₉,f₂,f₁₃,f₃)和13个特征子集下D / R准则如下:1:特征子集(f₁₀);2:功能子集(f₁₀,f₆)3:功能子集(f₁₀,f₆,f₅)4:功能子集(f₁₀,f₆,f₅,f₁₂)5:功能子集(f₁₀,f₆,f₅,f₁₂,f₁₁)6:特征子集(f₁₀,f₆,f₅,f₁₂,f₁₁,f₂)7:特征子集(f₁₀,f₆,f₅,f₁₂,f₁₁,f₂,f₄)8:特征子集(f₁₀,f₆,f₅,f₁₂,f₁₁,f₂,f₄,f₇)9:特征子集(f₁₀,f₆,f₅,f₁₂,f₁₁,f₂,f₄,f₇,f₁₃)10:特征子集(f₁₀,f₆,f₅,f₁₂,f₁₁,f₂,f₄,f₇,f₁₃,f₈)11:特征子集(f₁₀,f₆,f₅,f₁₂,f₁₁,f₂,f₄,f₇,f₁₃,f₈,f₁)12:特征子集(f₁₀,f₆,f₅,f₁₂,f₁₁,f₂,f₄,f₇,f₁₃,f₈,f₁,f₉)13:特征子集(f₁₀,f₆,f₅,f₁₂,f₁₁,f₂,f₄,f₇,f₁₃,f₈,f₁,f₉,f₃)

验证了所选特征子集NB分类器和嗯认识活动。TARARs NB的分类器,嗯,每个特征子集,表中列出6,分别。

可以发现,尽管dr和D / R标准不同,特征子集具有相同数量的功能是相似的,即使是相同的,例如,如果特性的数量比6小。因此,它可以观察到相同的分类器的结果与相同数量的特性非常不同,在这两个标准。如果功能的数量大于或小于6 11日TARARs的结果是相同的。

此外,NB分类器的性能和嗯是不同的甚至用同样的特征子集。一般来说,增加的特征子集的大小,TARAR增加直到达到一定大小的值。不过,这种趋势并不单调。例如,优化结果与特征子集9日,12日和13在dr标准(90.3%),和最优结果特征子集下13 D / R标准(88.0%)、NB分类器。嗯,最优结果是13特征子集下dr(88.0%)和D / R(88.0%)标准。结果表明,NB分类器和嗯收益率相对较高TARARs特征子集5到13和NB分类器TARARs略高于那些嗯的特征子集8到13,但是更高的1到7,在同样的标准。

基本上,它既可以得出结论,dr和D / R标准可用于排序的特性,然后有效地组合特征子集。

表7和8(dr准则下)显示活动的最佳IARARs 0, 3, 5, 6, 9嗯高于NB的分类器,而最优IARARs活动1、2、7和8的NB分类器更高的嗯。活动的最佳IARARs 4是相同的两个分类器。一般来说,两个分类器的趋势几乎相同大小的增加的特征子集。的趋势并不单调。此外,它可以观察到,对活动识别不同的特性有不同的影响。例如,特征子集5意味着引入功能f₁₁4功能子集;IARARs得到改善的一些活动,如活动0、2、3、4和7到9;然而,其他活动的IARARs退化或不改善,NB的分类器,如表所示7。

嗯也有类似的结果。它也可以发现,根据不同性能特征的NB分类器和嗯,相同功能的添加对IARARs有不同的影响。例如,通过引入的特性f₅特征子集2到3组成特征子集,IARAR活动0在NB分类器显然已经有了改进但嗯退化。通过引入的特性f₁₁特征子集4到5组成特征子集,IARAR活动9 NB的分类器已经退化但改善嗯。

此外,从表7也表明,13个特征子集,IARARs活动0,1,2,4,6比等于这些其他的子集;所有活动的比例是50%。9与特征子集,比例是40%(活动1、5、6和9)。然而,与9个特征子集,IARARs活动1,3,5,6,7,9比等于13特征子集。因此,特征子集9日收益率的最佳TARAR 90.3%,也就是12和13子集的特性。不过,功能f₃不是歧视性和NB活动识别分类器。

它还可以从表中找到813,特征子集,IARARs活动2和8优于或等于其他特性的子集;所有活动的比例是20%,而13给出了最优特征子集TARAR为88.0%,这是略高于12的特征子集。此外,随着12特征子集,IARARs活动0,1,3 - 7和9优于或等于的特征子集13;这个比例是80%。再次,它也可以得出结论:功能f₃不歧视活动识别嗯。

在D / R准则下,表9和10显示活动识别准确率与每个NB分类器的特征子集,嗯。从实验结果可以发现,NB的表演与获得的特征子集分类器和嗯D / R标准类似于dr标准,分别。

例如,对于NB分类器,最优特征子集9 TARARs是90.3%,12日和13在dr标准,这是相同的特征子集的11日,12日和13 D / R准则。嗯,最优TARAR是88.0%,功能组13 dr准则下,是一样的,在D / R准则。

从表9NB分类器,这是表明,特征子集12和13日IARARs活动1,4,6,9比或等于其他特性的子集;比例为40%,为所有活动。11然而,特征子集,IARARs活动1,3,5,6,9比等于特征子集的12和13;这个比例是50%。特征子集11、12和13收益率相同的最优TARARs 90.3%。再次,特性f₃和f₁₃不歧视和NB活动识别分类器。

它还可以从表中找到10,嗯,有13个特征子集,IARARs活动1,2,4,8比或等于其他特性的子集。特征子集13日收益率的最佳TARAR 88.0%,这是略高于12的特征子集。实际上,与12个特征子集,IARARs活动0,1,3,4,5,6,7,9比等于特征子集的13;这个比例是80%。再次,特性f₃和f₁₃不歧视活动识别嗯。

表11的比较结果显示最佳IARARs TARARs NB分类器和嗯下三个评估标准(先生、dr和D / R)和所需的最小尺寸的特征子集,分别。

它表明尽管功能子集三个评价标准是不同的,然而,最优结果IARARs和TARARs类似于相同的分类器。例如,对于NB分类器,活动的最佳IARARs 0, 2, 4, 6, 7, 8先生领导下的标准是一样的那些在dr标准;此外,活动的最佳IARARs 2, 4, 6, 7, 8是相同的即使在三个评估标准,甚至最优TARARs是相同的。

同样,嗯,活动的最佳IARARs 0, 2, 6到8即使在三个评价标准是相同的。此外,最优TARARs也同样的三个评估标准。另外,它可以发现所需的最小尺寸的结果根据最优特征子集IARAR每个活动和最优TARAR也类似于相同的分类器。例如,对于NB分类器,所需的最小尺寸的特征子集的活动1 - 5和7到8,dr标准,以下D / R准则下的相同。此外,活动2、4、7和8,所需的最小尺寸的特征子集下是相同的三个评价标准。嗯,所需的最小尺寸的特征子集的活动0,2,6和8是相同的三个评估标准;这个比例是40%。除此之外,所需的最小尺寸的特征子集TARARs也同样的在三个评价标准。

很明显,最大相关性测量和mRMR特征选择算法(dr)和D / R标准是有效的为人类活动识别特征选择。

5。结论

本文应用最大相关性测量和最大相关最小冗余(mRMR)算法(dr)和D / R标准选择特性和组成不同的特征子集的基础上观察到传感器事件对人类活动识别在智能家居环境中。然后,所选特征子集被NB验证分类器和嗯认识到人类活动。通过实验结果,结果表明,并不是所有的特性有利于活动识别、估计。不同组合的特性导致不同的活动识别的结果。此外,即使是相同的功能子集对活动有不同的影响对不同的活动分类器识别准确率。它可以发现功能f₁₀(当前活动的结束时间)是活动最重要的特征识别和特征f₃(周)的日子不是歧视性行为识别。因此,事先必须选择合适的特征子集,和不合适的特性集的选择增加了计算复杂度并降低人类活动识别准确率。此外,它是重要的考虑的活动识别之间的特性和活动之间的相关性和冗余功能。一般来说,最大相关性测量和mRMR算法有利于NB的特征选择和积极的活动识别分类器,嗯。

数据可用性

收集数据的智能家居试验台位于华盛顿州立大学校园,这可以从库克博士的主页下载。

的利益冲突

作者宣称没有利益冲突。

确认

谢谢黛安·j·库克博士将积极和建设性的评论帮助提高文章的质量和演示。此外,作者欣然承认数据准备工作,是由库克的博士研究生。

引用

l . Liu e . Stroulia Nikolaidis, a . Miguel-Cruz和a·里奥斯林康”智能家居和家庭老年人的健康监测技术:系统回顾,“国际医学信息学杂志》上卷。91年,44-59,2016页。
视图: 出版商的网站 | 谷歌学术搜索
m·r·阿拉姆m . b . i Reaz, m·A·m·阿里“回顾智能homes-past、现在和未来,“IEEE系统,人,控制论,一部分C(应用程序和评论),42卷,不。6,1190 - 1203年,2012页。
视图: 出版商的网站 | 谷歌学术搜索
d·j·库克,“你家有多聪明?”科学,卷335,不。6076年,第1581 - 1579页,2012年。
视图: 出版商的网站 | 谷歌学术搜索
g . Sprint d·j·库克,r·弗里茨和m . Schmitter-Edgecombe”使用智能家居来检测和分析卫生事件,“电脑卷,49号11日,29-37,2016页。
视图: 出版商的网站 | 谷歌学术搜索
o·d·劳拉和m·A·拉布拉多”,一个关于人类活动的调查识别使用可穿戴传感器,”IEEE通信调查和教程,15卷,不。3、1192 - 1209年,2013页。
视图: 出版商的网站 | 谷歌学术搜索
t . Luor h, h . Yu, y,“探索智能家居的关键质量属性和模型,”matuitas,卷82,不。4、377 - 386年,2015页。
视图: 出版商的网站 | 谷歌学术搜索
j . Dahmen b·托马斯·d·库克,x王”活动学习作为智能家居安全监控的基础,“传感器,17卷,不。4 p。737年,2017年。
视图: 出版商的网站 | 谷歌学术搜索
h . m . s .侯赛因·m·a·a·h·汗和n .罗伊“主动学习活动识别,启用”普及和移动计算,38卷,不。2、312 - 330年,2017页。
视图: 出版商的网站 | 谷歌学术搜索
g . Singla d·库克,m . Schmitter-Edgecombe”跟踪活动使用智能环境技术在复杂的环境中,“国际生物科学杂志》上,精神病学和技术,1卷,不。1、25 - 35,2009页。
视图: 谷歌学术搜索
a . s . Crandall d·j·库克,“应对多个居民在智能环境中,“环境智能和智能环境杂志》上,1卷,不。4、323 - 334年,2009页。
视图: 出版商的网站 | 谷歌学术搜索
s . l . Liu, g . Su Z.-G。黄,m .刘”对复杂活动识别使用贝叶斯网络的概率生成框架,“模式识别卷,68年,第309 - 295页,2017年。
视图: 出版商的网站 | 谷歌学术搜索
k . s . Gayathri k . s . Easwarakumar,以利亚,“基于概率本体活动识别在智能家居使用马尔可夫逻辑网络,”以知识为基础的系统卷,121年,第184 - 173页,2017年。
视图: 出版商的网站 | 谷歌学术搜索
e . Kim, s·希拉勒和d·库克“人类活动识别和模式发现,”IEEE普适计算,9卷,不。1,48-53,2010页。
视图: 出版商的网站 | 谷歌学术搜索
朱y、n·m·Nayak和a . k . roy chowdhury“环境敏感活动建模使用分层条件随机域,“IEEE模式分析与机器智能,37卷,不。7,1360 - 1372年,2015页。
视图: 出版商的网站 | 谷歌学术搜索
l·陈,c·d·纽金特和h .王”活动的知识方法识别在智能家居中,“IEEE工程知识和数据,24卷,不。6,961 - 974年,2012页。
视图: 出版商的网站 | 谷歌学术搜索
m·法希姆。法蒂玛,s·李,Y.-K。李,“额:进化乐团活动模型识别在智能家居中,“应用智能,38卷,不。1,第98 - 88页,2013。
视图: 出版商的网站 | 谷歌学术搜索
a .百合花纹的m . Vacher, n . Noury”基于svm多通道的分类活动的日常生活健康智能家居:传感器、算法,和第一个实验结果,“IEEE在生物医学信息技术,14卷,不。2、274 - 283年,2010页。
视图: 出版商的网站 | 谷歌学术搜索
j .温家宝和z . Wang”学习活动识别标签数据有限,一般模型。”专家系统与应用程序卷。74年,19-28,2017页。
视图: 出版商的网站 | 谷歌学术搜索
黄永发。香港,j·拉莫斯和a·k·戴伊“个性化的活动识别系统semipopulation方法,”IEEE人机系统,46卷,不。1,第112 - 101页,2016。
视图: 出版商的网站 | 谷歌学术搜索
c . deb, a . Merentitis s Sukhanov m . Niessen n . Frangiadakis和a·鲍尔”智能家居监控日常生活活动:了解人类行为,”IEEE信号处理杂志,33卷,不。2、81 - 94年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
n s默罕默德、美国Zainudin和z阿里·奥斯曼”Metaheuristic方法增强mRMR过滤器使用药物响应微阵列数据的分类方法,”专家系统与应用程序卷,90年,第231 - 224页,2017年。
视图: 出版商的网站 | 谷歌学术搜索
j·格瓦拉,y, l .李x呗,s . Zhang和c·邓“最大相关最小常见的非线性数据的冗余特征选择,”信息科学卷,409 - 410,68 - 86年,2017页。
视图: 出版商的网站 | 谷歌学术搜索
赵c, s、f·刘”基于PCA的分布式工作流程监视以最小冗余最大相关性,”化学计量学和智能实验室系统卷。169年,63年53 - 2017页。
视图: 出版商的网站 | 谷歌学术搜索
d . f . Li苗,w . Pedrycz”颗粒多标记基于互信息的特征选择。”模式识别卷,67年,第423 - 410页,2017年。
视图: 出版商的网站 | 谷歌学术搜索
d . Escalona-Vargas e·r·西格尔·墨菲c·l·罗沃利和h . Eswaran”选择基于互信息的参考通道频率相关减法方法应用于胎儿生物磁效应的信号,”IEEE生物医学工程,卷64,不。5,1115 - 1122年,2017页。
视图: 出版商的网站 | 谷歌学术搜索
s . Mallik t Bhadra, Maulik,“表观遗传标志物的使用最大相关性和基于最小冗余的特征选择multi-omics数据,”IEEE生物科学,16卷,不。1,3 - 10,2017页。
视图: 出版商的网站 | 谷歌学术搜索
a . k .女子“预测g蛋白耦合受体及其亚科将各种序列特性纳入周的PseAAC将军”计算机在生物医学方法和项目卷,134年,第213 - 197页,2016年。
视图: 出版商的网站 | 谷歌学术搜索
陈c和x燕”,优化的多层神经网络通过使用最小冗余relevance-partial最大互信息聚类与最小二乘回归,”IEEE神经网络和学习系统,26卷,不。6,1177 - 87年,2015页。
视图: 出版商的网站 | 谷歌学术搜索
z . Wang m·李和j·李”的多目标进化算法基于互信息的特征选择与一个新的冗余措施,”信息科学卷,307年,第88 - 73页,2015年。
视图: 出版商的网站 | 谷歌学术搜索
下午Morgado m .对峙,“附近最小冗余最大相关性:应用程序׳年代老年痴呆症的诊断,“Neurocomputing卷,155年,第308 - 295页,2015年。
视图: 出版商的网站 | 谷歌学术搜索
m . Kamandar和h . Ghassemian线性特征提取的高光谱图像基于信息理论学习,”IEEE地球科学和遥感信,10卷,不。4、702 - 706年,2013页。
视图: 出版商的网站 | 谷歌学术搜索
k . k . Kandaswamy g . Pugalenthi K.-U。Kalies、e·哈特曼和t . Martinetz”EcmPred:细胞外基质蛋白的预测基于随机森林最大相关最小冗余特征选择,”理论生物学杂志》上卷,317年,第383 - 377页,2013年。
视图: 出版商的网站 | 谷歌学术搜索
x, e·w·m·马·l·l . Cheng和m . Pecht”健康监控基于Mahalanobis距离的冷却风扇mRMR特征选择,”IEEE仪表和测量,卷61,不。8,2222 - 2229年,2012页。
视图: 出版商的网站 | 谷歌学术搜索
a .除非a Murat, r . b . Chinnam”MR2PSO:最大相关最小冗余特征选择方法基于群体智慧的支持向量机分类,“信息科学,卷181,不。20日,第4641 - 4625页,2011年。
视图: 出版商的网站 | 谷歌学术搜索
e . Zdravevski p . Lameski诉Trajkovik et al .,“改善活动识别准确性ambient-assisted生命系统通过自动化特性工程”IEEE访问5卷,第5280 - 5262页,2017年。
视图: 出版商的网站 | 谷歌学术搜索
e . Zdravevski b Risteska Stojkoska, m . Standl h·舒尔茨,“自动基于机器学习识别的慢跑时间加速度计测量的青少年在野外条件下,“《公共科学图书馆•综合》,12卷,不。9 p . e0184216 2017。
视图: 出版商的网站 | 谷歌学术搜索
f·h·Peng长,c .丁”的基于互信息的特征选择:标准max-dependency, max-relevance, min-redundancy,”IEEE模式分析与机器智能,27卷,不。8,1226 - 1238年,2005页。
视图: 出版商的网站 | 谷歌学术搜索
h .方l .他h . Si p . Liu和x谢,“人类活动识别基于特征选择在智能家居使用反向传播算法,”ISA事务,53卷,不。5,1629 - 1638年,2014页。
视图: 出版商的网站 | 谷歌学术搜索
方p, h, h . Si”最大相关性特征选择的人类活动识别在智能家居”《2018中国控制与决策会议。(CCDC)沈阳,页4264 - 4268年,中国,2018年6月。
视图: 出版商的网站 | 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

2070年

下载

782年

引用