文摘
本文最大相关性测量和最大相关最小冗余(mRMR)算法(dr)和D / R标准应用选择特性和组成不同的特征子集根据观察到的运动传感器事件对人类活动识别在智能家居环境中。然后,所选特征子集的活动和评估,识别准确率与两种概率算法相比:朴素贝叶斯分类器(NB)和隐马尔可夫模型(HMM)。实验结果表明,并不是所有的功能都是有利于人类活动识别和不同的特征子集产生不同的人类活动识别准确率。此外,即使是相同的功能子集对人类活动有不同的影响对不同的活动分类器识别准确率。人类活动是重要的人员执行识别考虑之间的特性和活动之间的相关性和冗余功能。一般来说,最大相关性度量和mRMR为特征选择算法是可行的和积极的行为识别。
1。介绍
人口的老龄化,越来越多的老年人选择生活在自己的(1- - - - - -3是一个不争的社会现实。实现目标,智能家居技术可以发挥重要作用,检测和分析卫生事件(4),并提供相应的医疗助理和照顾体弱的老年人和残疾人的人无法独立生活很长一段时间,在家里远离医院或家庭,例如,提醒他们时间吃药,看医生,帮助他们切断了水,关掉烤箱等。
实际上,准确评估人类活动的日常生活(ADLs)是智能家居的先决条件取得正确的服务,无论是长老或严重残疾的健康监测,或为他们提供其他相关的帮助。一旦检测到危险行为,智能家居本身可以应对和消除尽可能多的居民的风险。因此,人类活动的准确识别在智能家居具有重要意义,给出了模式的实现医疗为孤独的老人或残疾,这是最重要的过程将环境情报纳入智能环境中(5- - - - - -8]。
最近,人类活动感兴趣的发现和识别了很多由于其巨大的潜力在上下文意识到计算机系统,包括智能家居环境。人类活动的主要目标识别在智能家居环境中找到有趣的行为模式等收集传感器数据和识别模式。目前,人类活动识别的主要挑战之一是机器学习算法的选择在同一序列表现更好的传感器收集的数据智能家居环境中活动。在过去的几年,一些智能算法应用于人类活动识别在智能家居已报告。Singla,克兰德尔,库克等人描述一些概率算法的应用,包括朴素贝叶斯分类器(NB),隐马尔可夫模型和马尔可夫模型(毫米),(嗯)9,10]训练部分标记运动传感器事件数据获取先验参数的值,然后验证算法的性能测试的传感器数据的标签。刘等人提出了一个基于贝叶斯网络的概率生成框架艾伦的时态关系复杂的活动的原始事件来描述结构的可变性(11]。Gayathri等人提出了一种基于统计关系学习方法,增加本体活动识别概率推理通过马尔可夫逻辑网络(MLN) (12]。金等人提出了一种歧视和生成概率模型,条件随机场(CRF),作为一个更灵活的选择嗯(13]。朱等人提出了一个两层的CRF模型来表示动作片段和活动,以分层的方式,它允许两运动和各种环境的集成特性在不同级别和自动学习的捕获模式的统计特性(14]。陈等人介绍了一个基于知识的方法来持续的活动识别在智能家居(多传感器数据流15]。法希姆等人介绍了一种新颖的进化集合体模型(EEM)值小和主要活动独立处理它们,这是基于遗传算法(GA)来处理不确定性的本质活动(16]。Fleury等人提出的支持向量机(SVM)基于多通道的分类ADLs健康智能家居(17]。文和王结合潜在狄利克雷分配(LDA)演算法,共同培养一般活动识别模型部分带安全标签的数据时(18]。香港等人组成的混合模型的贝叶斯网络和支持向量机来准确识别人类活动(19]。
除了机器学习算法的合适选择,人类活动识别在智能家居的另一个关键是选择有效的特征从传感器事件在智能家居环境中收集的数据集。通常,传感器事件数据集包括大量的观察到传感器事件所产生的各种活动和任何活动带注释的数据集的各种特性,甚至冗余和不相关的功能(20.]。然而,这些特性在所有测试中选择一个方法,几乎和这些特性的影响分类器的性能很少解决。实际上,与活动无关的特征识别和初始特征之间的冗余活动识别之前需要被删除。此外,特征选择方法选择特征子集也是最有利于活动成功地识别和数据压缩。
最近,最大相关最小冗余(mRMR)特征选择算法已经广泛应用于许多研究领域,旨在实现最佳的分类性能,减少冗余的选择特性和最大化目标类的相关性。穆罕默德等人实施mRMR过滤和metaheuristic方法作为药物反应微阵列的特征选择过程分类(21]。格瓦拉等人提出了一种新颖的基于归一化互信息的特征选择方法的最大相关性和最小非线性分类或回归问题(常见的冗余22]。许等人提出了一种新的分布式监视方案集mRMR、贝叶斯推理,主成分分析工作流程(23]。李等人提供了一个细粒度的特征选择方法与一个mRMR标准基于互信息(MI) multilabel学习24]。Escalona-Vargas等人提出了一个方法,使用mRMR作为标准来自动选择参考频率相关减法的方法来减弱孕产妇和胎儿胎儿脑的心磁记录(25]。Mallik等人开发了一个新框架的统计上显著的表观遗传标志物的使用一览表就是给予一定标准mRMR特性(基因)选择multiomics数据集(26]。女子的加权距离改善预测性能计算g蛋白耦合受体科和亚科通过序列派生属性,以及mRMR的基于融合特征选择方法和其他监督过滤器(提供27]。陈和燕开发了一个优化多层前馈网络通过使用mRMR-partial互信息聚类结合最小二乘回归建立软测量控制石脑油干点(28]。王等人提出了一种多目标进化算法有评估候选人的帕累托最优特征子集,发现紧凑的特征子集最大相关性和最小冗余(29日]。Morgado和问题提出了一种多元过程能力选择nonredundant子集的特性明显快于其他类似的方法来诊断阿尔茨海默病及相关疾病在mRMR启发算法(30.]。Kamandar和Ghassemian使用一种修改mRMR作为高光谱图像分类的标准特征提取基于信息理论学习(31日]。Kandaswamy等人提取的最佳特性使用mRMR特征选择算法和随机森林算法用于预测细胞外基质蛋白(32]。金等人提出了一个新颖的健康监测方法和异常检测电子产品散热风扇的基于Mahalanobis距离mRMR特性(33]。除非等人提出了一个混合filter-wrapper特征子集选择算法基于粒子群优化的支持向量机分类。过滤器模型是基于互信息和复合测量的特征相关性和冗余的特征子集选择(34]。Zdravevski等人提出了一个通用的特性选择健壮的特性的工程方法从各种传感器,从最初记录的时间序列和一些新生成的时间序列(即。级一阶导数,δ系列,和快速傅里叶变换(FFT)基础系列);各种时间和频域的特征提取(35,36]。
受上述思想的启发,本文最大相关性测量和mRMR特征选择算法(dr)和D / R标准应用选择特性和组成不同的特征子集根据观察到的运动传感器事件对人类活动识别在智能家居环境中。然后,所选特征子集评价,和活动识别准确率与两个概率算法:NB分类器,嗯。
剩下的纸是组织如下:部分2描述智能公寓实验、数据收集和13特征观察到传感器事件对人类活动的认可。部分3介绍了信息熵的概念,互信息(MI)和最大相关最小冗余(mRMR)特征选择算法。部分4给出了训练和测试活动,最大的特征子集选择通过分析相关性度量,和mRMR特征选择算法。最后,我们展示活动识别准确率的比较结果与所选特征子集和NB分类器的性能措施以及嗯。部分5总结了主要的贡献。
2。智能公寓试验台和人类活动识别的数据收集
2.1。智能公寓的实验和数据收集
智能公寓本研究实验平台位于华盛顿州立大学校园和维护的高级研究中心自适应系统(卡萨斯)智能家居项目,其中包括三个卧室,一个浴室,一个厨房和一个客厅/饭厅。智能公寓配备了运动传感器分布式大约1米在天花板上的空间,如图1。此外,其他传感器安装提供环境温度读数和定制的模拟传感器提供阅读热水,冷水,炉子燃烧器使用。传感器数据捕获使用一个传感器网络,内部设计和存储在一个结构化查询语言(SQL)数据库。从智能公寓实验收集数据后,ADLs传感器事件注释,用于训练和测试活动识别算法(3,4,7,9,10]。
收集的数据卡萨斯智能家居是由以下参数,它指定的数量特性用来描述观察到的传感器事件。开罗数据集,数据集的广义语法(2009)日期时间SensorID SensorValue <标记>Night_wandering活动的数据集的一个例子是:{2009-06-10 03:20:59.08 M006 Night_wandering开始2009-06-10 03:25:19.05 M0122009-06-10 03:25:19.08 M0112009-06-10 03:25:24.05 M0112009-06-10 03:25:24.07 M012 Night_wandering结束}
这个例子表明,观察到传感器事件对应Night_wandering活动与具体的日期,时间,传感器ID,传感器值,和活动标签参数。
2.2。观察到传感器事件的特性
考虑到实际情况,每个活动的有13个特征观察到传感器事件:(1)传感器id的逻辑值的每个活动的传感器事件f1。考虑到每个活动发生的地方是相对稳定的,因此,选择传感器id的平均意味着重点活动发生的地方。方程是 在哪里意味着传感器id的活动吗我,传感器的数量,是传感器ID的活动我。(2)所有传感器id的方差由当前活动引起的,f2,是 (3)星期,转化为一个值在0到6f3。(4)之前的活动,代表的活动发生在当前活动之前,f4。(5)活动长度,代表当前活动的长度测量的传感器事件f5。(6)第一个传感器ID的逻辑价值引发了当前的活动f6。(7)最后的逻辑值传感器ID当前活动引发的f7。(8)当前活动的持续时间,这表明去年传感器之间的时间间隔,第一传感器当前活动引发的f8。(9)当前活动的开始时间f9。(10)当前活动的结束时间f10。(11)下一个活动,代表的活动发生在当前活动后,f11。(12)传感器id的模式价值引发了当前的活动f12。(13)传感器id的中值由当前的活动f13。
通常情况下,最优特征子集包含最少的维度,导致更高的识别准确率。因此,它是必要的,以消除剩余的和无关紧要的功能。
3所示。最大相关最小冗余的特征选择算法
3.1。熵
信息熵是一个更抽象的数学概念,它可以被理解为一些特定的信息的出现的概率。一般来说,更高的概率表明它是一种信息传播的更广泛更高度引用。因此,信息熵可以表示信息的价值。信息来源是消息的来源和消息序列。例如,最简单的离散信息来源 ,和一个给定的概率是 ;的熵X可以被定义为
3.2。条件熵,联合熵和互信息
3.2.1之上。条件熵
在信息理论中,条件熵量化所需的信息来描述随机变量的结果X考虑到另一个随机变量的值Y是已知的。如果X和Y相互依赖,的条件吗 ,条件熵X是
如果Y,那么条件熵X是 在哪里p(x, y)的联合概率x和y。
3.2.2。联合熵
联合熵是衡量与一组随机变量相关的不确定性。假设两个随机变量X和Y并给出他们每个人一个有限值,然后,联合熵
联合熵是衡量的相关性X和Y。如果X和Y是独立的,那么,联合熵是吗
3.2.3。互信息
互信息(MI)是一个量的措施相似的水平以及相关的随机变量33,37]。假设两个随机变量X和Y和Y包含一些信息X,然后MI之间X和Y可以被定义为
心肌梗死通常定义为衡量两个随机变量的相互依赖。有更大价值的MI意味着一个更紧密的关系的两个随机变量之间有较大的相关性。如果MI的值是零,这意味着两个随机变量和独立无关。因此,在本文中,心肌梗死可用于测量之间的相似性特性和功能之间的关系和活动。
3.3。最大相关最小冗余(mRMR)算法
尽管MI是广泛应用于特征选择领域,仍然存在一些不足之处。大部分的特征选择算法只考虑特征之间的关系和分类类别但忽略特性之间的相互影响。相反,mRMR特征选择算法不仅应用于本文认为这些特性所提供的信息量为类别属性也之间的交互特征对分类的影响(37]。
小姐可以权衡信息特征变量之间的数量X和Y;此外,它可以测量量多少信息X可以提供Y对活动进行分类。因此,MI不仅可以显示每个特性识别活动的能力,而且测量中是否存在冗余功能。根据MI的特征,两种不同的标准可以扩展到评估特点:冗余和相关性。
3.3.1。冗余措施
之间的冗余测量利用MI的数量特征。如果MI的价值很大,这意味着有大量的信息两个特性之间的重复;即。,there are redundancies between the two features. A lower value of redundancy measure indicates a better feature selection criterion. Utilizing redundancy measure is to find the feature which has the minimal value of MI among all features.
根据这个想法,较小的冗余特性之间的信息的价值,更有利的是活动分类,可以表示通过最小化之间的MI特性,最小冗余条件 在哪里特征在特征子集的数量吗年代和 是MI之间的特性我和j。
3.3.2。相关措施
特征之间的相关性度量利用MI的价值和目标的活动。如果MI的值很小,这表明之间存在弱相关特性和目标活动。相反,大小姐的价值意味着特性有更大的信息量对活动进行分类。因此,有必要选择MI的最大值之间的特性和目标活动,最大相关准则,可以表示为 在哪里c活动和目标吗 之间的MI特性我和目标活动c。
特征选择基于相关性测量的最大值是构成最优特征子集选择MI目标活动。
3.3.3。算法设计
mRMR特征选择算法是基于上述相关性测量和冗余。它结合了功能和目标活动之间的相关性以及特征之间的冗余(33,37]。根据(9)和(10),测量和冗余的影响相关性已考虑在特征选择,全面。mRMR特征选择算法有两个评估标准,优化D和R同时,
假设有一个特征子集这是由米功能,下一步是提取最优(米+ 1)th特性的特征子集根据(11)或(12),通过
mRMR特征选择算法的增量过程如下:步骤1。在原始特征集 ,最优特征可以选择的 然后投入最优特征子集年代;步骤2。在特征子集 ,下一个最优的特性选择满足(11)或(12);步骤3。重复步骤2到找到最优特征子集年代最终满足尺寸要求。
4所示。实验结果
4.1。培训和测试活动
总共10活动进行卡萨斯智能公寓2志愿者提供NB的体能训练数据分类器,嗯。这些活动包括基础和临床发现更复杂的ADLs问卷。这些活动如下:(1)Bed_to_toilet(0)活动:床和厕所之间的转变发生在晚上时间(30实例)(2)早餐(活动1):居民早餐(48实例)(3)床(活动2):这是睡在床上的活动(207)(4)C_work(活动3):居民在办公室工作(46实例)(5)晚餐(活动4):居民晚餐(42实例)(6)衣服(5)活动:居民清理衣服使用洗衣机(10实例)(7)Leave_home活动(6):居民离开智能家居(69实例)(8)午餐(活动7):居民午餐(37实例)(9)Night_wandering(8)活动:居民在夜间(67实例)(10)R_medicine(活动9):居民需要医学(44实例)
卡萨斯的数据已经收集智能公寓试验台55天,导致这些活动的共有600个实例和647年,485年运动传感器收集到的事件。三倍交叉验证应用于NB的数据分类器和嗯在相同条件下,确保实验比较公平(38]。
4.2。特征选择与最大相关性度量
首先,最大相关性(MR)测量13的特性进行了分析。通常,MI是作为评价的标准。自从MI值较大的特征目标活动有紧密的关系,因此,MI的特性和活动之间的值必须计算。通过分析相关性度量,13个功能根据MI表中列出的值1,然后13特性已经在降序排列先后排序,分别由13个特征子集(39]。
它可以发现功能f10MI的最大价值,这意味着f10活动是最重要的特性来识别和目标活动的最亲密的关系。相反,f3MI的最小值,这意味着什么f3不歧视活动识别和目标活动最薄弱的一环。
然后,13个特征子集与奥步骤如下:1:特征子集(f10)2:功能子集(f10,f9)3:功能子集(f10,f9,f6)4:功能子集(f10,f9,f6,f8)5:功能子集(f10,f9,f6,f8,f7)6:特征子集(f10,f9,f6,f8,f7,f1)7:特征子集(f10,f9,f6,f8,f7,f1,f12)8:特征子集(f10,f9,f6,f8,f7,f1,f12,f4)9:特征子集(f10,f9,f6,f8,f7,f1,f12,f4,f11)10:特征子集(f10,f9,f6,f8,f7,f1,f12,f4,f11,f5)11:特征子集(f10,f9,f6,f8,f7,f1,f12,f4,f11,f5,f2)12:特征子集(f10,f9,f6,f8,f7,f1,f12,f4,f11,f5,f2,f13)13:特征子集(f10,f9,f6,f8,f7,f1,f12,f4,f11,f5,f2,f13,f3)
识别准确率的活动可以分为两类:个体活动识别准确率(IARAR)和总活动识别准确率(TARAR)。的定义是
活动的结果识别准确率NB的13个特征子集分类器基于先生措施如表所示2嗯的,结果如表所示3,分别。
从表2和3,13个特征对分类器的识别准确率的影响可以发现不同。同样,NB分类器,嗯,TARARs不同不同的特征子集。一般来说,增加的特征子集的大小,活动提高识别准确率。TARAR趋向于稳定特征子集的大小最终变大。然而,这一趋势并不单调。具体为NB分类器,TARAR并不能提高特征子集7例(88.7%),介绍了功能f7在特征子集6 (88.8%)。这意味着并不是所有的功能显然是积极的活动识别和不同组合的特性有不同的影响活动识别准确率。
它还可以发现TARAR NB的分类器的最大价值略高于嗯。12个特征子集,TARAR NB分类器达到最大价值的90.3%,同时,嗯,TARAR是88.0%的最大价值和13个特征子集。
此外,它的趋势可以看出IARARs NB的分类器和嗯是相似的;即。,with the increasing of the number of features in features subset, IARAR increases until a specific number. Again, the trends are not monotonic. For example, for activity 1, IARARs of NB classifier and HMM have risen along with the sizes of features subset. For NB classifier, the optimal value of IARAR is 100.0%, with features subset 8, and then drop down with the increasing of size of features subset. For HMM, IARAR reaches the optimal value of 93.8% with features subset 6 and then drop down with the increasing of size of features subset. Moreover, from IARARs of activity 1, it can be seen that the performances of NB classifier and HMM are different by introducing the same feature, such as featuref4,与之相比,特征子集7(97.9%)和8 (100.0%);NB产生一个积极的结果与此功能;然而,HMM的识别性能没有提高,从89.6%减少到83.3%。即使有相同的特征子集,识别准确率可能完全不同于分类器的性能,可以找到更多的从每个活动的识别准确率。例如,NB分类器和嗯大相径庭的表演活动与特征子集1 0(0.0%比90.0%)和活动2特征子集3(88.4%比39.1%)。
此外,从表2,这是表明,相对更好的特征子集是不同的每个活动;如活动3、10个特征子集产生最好的结果,和准确率是76.1%,而特征子集2产生最好的结果的活动2,和NB的准确率是100.0%,分类器。特征子集10,IARARs活动3,4,5,6比或等于其他特性的子集;所有活动的比例是40%。然而,随着特征子集12和13日活动的IARARs 0到2,4,6到8优于或等于的特征子集10;比例是70%。因此,最优结果TARARs(90.3%)的特征子集12和13。相对来说,功能f3和f13不歧视和NB活动识别分类器。
嗯,它可以从表中找到310个特征子集生成最佳IARARs所有活动的比例最高,为40%。具体特征子集10,IARARs活动4、5、7、9都优于或等于其他的子集。然而,13日收益率最优特征子集TARAR为88.0%,这是略高于10的特征子集,87.3%。再次,它也可以得出结论:功能f3不歧视活动识别嗯。
4.3。与mRMR特征选择算法
mRMR特征选择算法可以用来排序的13个特点和减少维度的特征子集。这是通过分析的相关性特征目标活动原始特征集删除无关的特性和保持功能目标活动有很强的相关性,分析所选特征的冗余减少维度的特征子集。
根据(11)信息的价值的不同特性,迭代的结果列在表中4dr判据。一开始,MI方程应用于获得第一个最佳特征和结果f10。接下来的互动,仍然根据(11),功能f6其他剩下的12个功能中是最优的特性。然后,每个特性的行列已经先后获得。
最后,的顺序排序功能f10,f6,f5,f12,f11,f1,f4,f7,f8,f9,f2,f13,f3。再次,它可以发现功能f10是最重要的特征和功能吗f3不歧视活动识别。
类似地,可以获得不同的功能组的信息价值根据(12)和迭代的结果列在表中5在D / R准则。
的顺序排序的功能f10,f6,f5,f12,f11,f2,f4,f7,f13,f8,f1,f9,f3。
虽然订单排序的特性与dr和D / R标准是不同的,仍然是第一个特征f10,最重要的功能,第二个特性f6,最后一个特性f3,这不是歧视活动识别。
根据订单排序的特性与dr和D / R标准,13个特征可以通过添加一个特征子集以前每次先后特征子集。
13特征子集下dr标准如下:1:特征子集(f10)2:功能子集(f10,f6)3:功能子集(f10,f6,f5)4:功能子集(f10,f6,f5,f12)5:功能子集(f10,f6,f5,f12,f11)6:特征子集(f10,f6,f5,f12,f11,f1)7:特征子集(f10,f6,f5,f12,f11,f1,f4)8:特征子集(f10,f6,f5,f12,f11,f1,f4,f7)9:特征子集(f10,f6,f5,f12,f11,f1,f4,f7,f8)10:特征子集(f10,f6,f5,f12,f11,f1,f4,f7,f8,f9)11:特征子集(f10,f6,f5,f12,f11,f1,f4,f7,f8,f9,f2)12:特征子集(f10,f6,f5,f12,f11,f1,f4,f7,f8,f9,f2,f13)13:特征子集(f10,f6,f5,f12,f11,f1,f4,f7,f8,f9,f2,f13,f3)和13个特征子集下D / R准则如下:1:特征子集(f10);2:功能子集(f10,f6)3:功能子集(f10,f6,f5)4:功能子集(f10,f6,f5,f12)5:功能子集(f10,f6,f5,f12,f11)6:特征子集(f10,f6,f5,f12,f11,f2)7:特征子集(f10,f6,f5,f12,f11,f2,f4)8:特征子集(f10,f6,f5,f12,f11,f2,f4,f7)9:特征子集(f10,f6,f5,f12,f11,f2,f4,f7,f13)10:特征子集(f10,f6,f5,f12,f11,f2,f4,f7,f13,f8)11:特征子集(f10,f6,f5,f12,f11,f2,f4,f7,f13,f8,f1)12:特征子集(f10,f6,f5,f12,f11,f2,f4,f7,f13,f8,f1,f9)13:特征子集(f10,f6,f5,f12,f11,f2,f4,f7,f13,f8,f1,f9,f3)
验证了所选特征子集NB分类器和嗯认识活动。TARARs NB的分类器,嗯,每个特征子集,表中列出6,分别。
可以发现,尽管dr和D / R标准不同,特征子集具有相同数量的功能是相似的,即使是相同的,例如,如果特性的数量比6小。因此,它可以观察到相同的分类器的结果与相同数量的特性非常不同,在这两个标准。如果功能的数量大于或小于6 11日TARARs的结果是相同的。
此外,NB分类器的性能和嗯是不同的甚至用同样的特征子集。一般来说,增加的特征子集的大小,TARAR增加直到达到一定大小的值。不过,这种趋势并不单调。例如,优化结果与特征子集9日,12日和13在dr标准(90.3%),和最优结果特征子集下13 D / R标准(88.0%)、NB分类器。嗯,最优结果是13特征子集下dr(88.0%)和D / R(88.0%)标准。结果表明,NB分类器和嗯收益率相对较高TARARs特征子集5到13和NB分类器TARARs略高于那些嗯的特征子集8到13,但是更高的1到7,在同样的标准。
基本上,它既可以得出结论,dr和D / R标准可用于排序的特性,然后有效地组合特征子集。
表7和8(dr准则下)显示活动的最佳IARARs 0, 3, 5, 6, 9嗯高于NB的分类器,而最优IARARs活动1、2、7和8的NB分类器更高的嗯。活动的最佳IARARs 4是相同的两个分类器。一般来说,两个分类器的趋势几乎相同大小的增加的特征子集。的趋势并不单调。此外,它可以观察到,对活动识别不同的特性有不同的影响。例如,特征子集5意味着引入功能f114功能子集;IARARs得到改善的一些活动,如活动0、2、3、4和7到9;然而,其他活动的IARARs退化或不改善,NB的分类器,如表所示7。
嗯也有类似的结果。它也可以发现,根据不同性能特征的NB分类器和嗯,相同功能的添加对IARARs有不同的影响。例如,通过引入的特性f5特征子集2到3组成特征子集,IARAR活动0在NB分类器显然已经有了改进但嗯退化。通过引入的特性f11特征子集4到5组成特征子集,IARAR活动9 NB的分类器已经退化但改善嗯。
此外,从表7也表明,13个特征子集,IARARs活动0,1,2,4,6比等于这些其他的子集;所有活动的比例是50%。9与特征子集,比例是40%(活动1、5、6和9)。然而,与9个特征子集,IARARs活动1,3,5,6,7,9比等于13特征子集。因此,特征子集9日收益率的最佳TARAR 90.3%,也就是12和13子集的特性。不过,功能f3不是歧视性和NB活动识别分类器。
它还可以从表中找到813,特征子集,IARARs活动2和8优于或等于其他特性的子集;所有活动的比例是20%,而13给出了最优特征子集TARAR为88.0%,这是略高于12的特征子集。此外,随着12特征子集,IARARs活动0,1,3 - 7和9优于或等于的特征子集13;这个比例是80%。再次,它也可以得出结论:功能f3不歧视活动识别嗯。
在D / R准则下,表9和10显示活动识别准确率与每个NB分类器的特征子集,嗯。从实验结果可以发现,NB的表演与获得的特征子集分类器和嗯D / R标准类似于dr标准,分别。
例如,对于NB分类器,最优特征子集9 TARARs是90.3%,12日和13在dr标准,这是相同的特征子集的11日,12日和13 D / R准则。嗯,最优TARAR是88.0%,功能组13 dr准则下,是一样的,在D / R准则。
从表9NB分类器,这是表明,特征子集12和13日IARARs活动1,4,6,9比或等于其他特性的子集;比例为40%,为所有活动。11然而,特征子集,IARARs活动1,3,5,6,9比等于特征子集的12和13;这个比例是50%。特征子集11、12和13收益率相同的最优TARARs 90.3%。再次,特性f3和f13不歧视和NB活动识别分类器。
它还可以从表中找到10,嗯,有13个特征子集,IARARs活动1,2,4,8比或等于其他特性的子集。特征子集13日收益率的最佳TARAR 88.0%,这是略高于12的特征子集。实际上,与12个特征子集,IARARs活动0,1,3,4,5,6,7,9比等于特征子集的13;这个比例是80%。再次,特性f3和f13不歧视活动识别嗯。
表11的比较结果显示最佳IARARs TARARs NB分类器和嗯下三个评估标准(先生、dr和D / R)和所需的最小尺寸的特征子集,分别。
它表明尽管功能子集三个评价标准是不同的,然而,最优结果IARARs和TARARs类似于相同的分类器。例如,对于NB分类器,活动的最佳IARARs 0, 2, 4, 6, 7, 8先生领导下的标准是一样的那些在dr标准;此外,活动的最佳IARARs 2, 4, 6, 7, 8是相同的即使在三个评估标准,甚至最优TARARs是相同的。
同样,嗯,活动的最佳IARARs 0, 2, 6到8即使在三个评价标准是相同的。此外,最优TARARs也同样的三个评估标准。另外,它可以发现所需的最小尺寸的结果根据最优特征子集IARAR每个活动和最优TARAR也类似于相同的分类器。例如,对于NB分类器,所需的最小尺寸的特征子集的活动1 - 5和7到8,dr标准,以下D / R准则下的相同。此外,活动2、4、7和8,所需的最小尺寸的特征子集下是相同的三个评价标准。嗯,所需的最小尺寸的特征子集的活动0,2,6和8是相同的三个评估标准;这个比例是40%。除此之外,所需的最小尺寸的特征子集TARARs也同样的在三个评价标准。
很明显,最大相关性测量和mRMR特征选择算法(dr)和D / R标准是有效的为人类活动识别特征选择。
5。结论
本文应用最大相关性测量和最大相关最小冗余(mRMR)算法(dr)和D / R标准选择特性和组成不同的特征子集的基础上观察到传感器事件对人类活动识别在智能家居环境中。然后,所选特征子集被NB验证分类器和嗯认识到人类活动。通过实验结果,结果表明,并不是所有的特性有利于活动识别、估计。不同组合的特性导致不同的活动识别的结果。此外,即使是相同的功能子集对活动有不同的影响对不同的活动分类器识别准确率。它可以发现功能f10(当前活动的结束时间)是活动最重要的特征识别和特征f3(周)的日子不是歧视性行为识别。因此,事先必须选择合适的特征子集,和不合适的特性集的选择增加了计算复杂度并降低人类活动识别准确率。此外,它是重要的考虑的活动识别之间的特性和活动之间的相关性和冗余功能。一般来说,最大相关性测量和mRMR算法有利于NB的特征选择和积极的活动识别分类器,嗯。
数据可用性
收集数据的智能家居试验台位于华盛顿州立大学校园,这可以从库克博士的主页下载。
的利益冲突
作者宣称没有利益冲突。
确认
谢谢黛安·j·库克博士将积极和建设性的评论帮助提高文章的质量和演示。此外,作者欣然承认数据准备工作,是由库克的博士研究生。