文摘

人们在公共场所经常出现在组。人与均匀粗粒度的活动可能会进一步划分成子组根据更细粒度的行为差异。自动识别这些子组可以受益群体成员的各种应用程序。在这项工作中,我们专注于识别同类活动组(即这样的子组。,一群人同时执行相同的粗粒度的活动)。提出了一种通用框架使用传感器构建大宗商品移动设备。具体来说,我们提出一个两阶段的过程,感知形态选择给定一个粗粒度的活动,其次是多模式聚类识别子组。我们开发一个早期融合和融合多元聚类算法。我们评估我们的方法使用多个数据集;其中两个是相同的活动,而另一个有不同的活动。multimodal-based提出的评价结果表明,该方法优于现有的工作,只使用一个单一传感模式和他们也工作场景当手动选择一个传感模式失败。

1。介绍

人们常常出现在组织和参与各种活动在公共场所。人与均匀粗粒度的活动进一步划分为子组基于更细粒度的行为差异。例如,在应急情况下,如消防疏散,人们有相同的粗粒度的活动,也就是说,走路或跑步向紧急出口。然而,人们可能会走向不同的出口和与不同的移动速度,和人在一起可以被认为是子群。通过监控这些子组,紧急控制中心可以更好的引导人们通过每个子群的路线。因此,分区相同的一组粗粒度的活动分成更小的基于特定活动的差异是非常重要的。同样,游客在公园散步,步行是一样的粗粒度的活动。可以区分不同行走羊群移动模式的游客;也就是说,人们在同一个小组应该有类似的方向和速度。导游可以很容易地管理旅游集团基于行走的羊群和定制的消息发送到不同的子组是去不同的景点。 Another example is people watching a game. Different subsets of the audience cheer for different teams in a game and the subgroups can be distinguished by the specific actions performed by them; that is, people in support of the same team typically perform certain gesture such as waving hands during the same time period when the team is performing well. Fans of the same team can be easily identified and they can be recommended to be friends to share information for future games. Partitioning groups with the same coarse-grained activity into subgroups based on specific activity differences is exactly the focus of this work.

很多工作已经完成检测和活动组识别使用移动设备,但手头的问题还没有完全解决现有工作详细的部分2。我们一直受divergence-based联系检测(DBAD)方法(1)提供了一个框架来识别集团所属给定一个传感模式用于一个活动。不同的小组活动识别问题,通常首先识别每一个用户的活动,然后分析他们的合作或协作关系在一组(2),该集团所属检测问题是如何确定哪些用户有类似的行为,而不是识别他们的特定活动。DBAD的一个限制是,一次只有一个传感模式可以用来区分多个子组,因此不能准确分区组当行为差异可以观察到只有通过多个传感模式。DBAD的另一个限制是,传感模式必须显式地提供框架,这是不实际的在许多情况下,因为它是不清楚的感知形态最好的工作。在这项工作中,我们专注于构建一个通用的框架,融合多通道传感器识别子组在一个均匀的活动组。换句话说,相同的粗粒度的活动的所有人提供先验知识的框架;这个框架将把这些人分成子组基于多个传感模式自动确定给定的粗粒度的活动。这也是不同的小组检测问题研究了现有的一些工作(3- - - - - -6节中详细2融合一些手动选择传感器特性comoving人群或设备。

细粒度划分的群体提出了几个有趣的挑战。

感应模式选择。现有的研究表明,用户的移动设备上的传感器产生相似的信号,当用户有相同的细粒度的活动(7];因此,组织关系可以通过监测传感器检测到信号的移动设备。然而,与多个传感模式可用,最好不清楚传感模式可以捕捉用户的活动相似。是更加困难的一个通用的方法,因为它需要检测组联系在任何活动。我们在部分解决这个问题3

在多个传感模式不一致窗口大小。降低成本(尤其是在能源消费方面)的数据收集和交换来衡量用户之间的相似度,有必要总结传感器数据时间序列到总传感器特性。我们选择使用概率分布函数(PDF)作为骨料传感器特性(1]。传感器数据时间序列的长度为总结显著影响相似度测量,所以我们需要确定每个传感测量时间窗口模式和处理不同的时间窗口大小结合多个传感的测量方法。我们在训练阶段(部分解决这个问题3所示。3)和测试阶段(部分4所示。1)。

多模式聚类。识别组织基于多个传感模式的相似性度量是重要的。通常,我们可以使用聚类算法相似图的所有用户。然而,由于大多数传感模式是相互独立的,我们不能随意权衡每个传感模式结合他们的相似性测量到一个值。我们在部分解决这个问题4所示。24所示。3

本文的主要贡献是,我们提出的方法来应对这些挑战在一个通用的框架中使用两个阶段:第一阶段是传感模式选择和二期是多通道组识别聚类。整个过程呈现在图1。我们评估我们的方法使用DBAD中提供的数据集和两个数据集收集。评价结果表明,我们的multimodal-based方法优于DBAD方法只使用一个传感模式10%组关系的准确性。虽然不是10%大幅增长,我们的方法是我们的特色可以自动选择正确的感应模式必须明确而有效的传感方法提供给DBAD,大大限制了其实用性。进一步,我们的方法有效地在各种活动工作。

集团所属检测和识别研究了装备传感器智能手机等移动设备使用。存在几种方式来识别组,例如,基于相互作用[8],接近[9],流动[3- - - - - -6)和活动(1,7]。大多数现有的工作依赖于移动集团检测,人有相似的轨迹是在同一组。例如,GruMon [4)决定了一群人在一个特定的位置是谁一起旅行在拥挤的城市环境。解决引线位置数据的不同程度的准确性使用蓝牙或无线网络和额外的数据,如语义标签和智能手机的传感器数据,和系统显示非常有前途的基于测试结果使用真实的数据集。在本文中,我们专注于基于活动的小组发现,在那些有类似的活动被认为是在同一组。例如,[7)确定活动团体基于人群排队等行为,堵塞和组的形成。推理的解决方案涉及到个人活动,亲缘成对活动,和全球行为推理。不同于mobility-based组检测、跟踪每个单独的位置数据随着时间的推移,不再是一个要求。更具体地说,我们定义了一个均匀的活动组作为一个群体的人同时执行相同的粗粒度的活动,是一种基于活动的组织(人们可以有相同的粗粒度的活动或不同的粗粒度的活动)。我们将使用术语“活动”来表示一个粗粒度的活动剩下的纸。

这项工作的识别子组在一个均匀的活动组织受DBAD [1]。DBAD方法使用概率密度函数(PDF)模型的传感器数据。每个移动设备计算差异邻国通过计算杰弗里的分歧当地PDF和邻居的PDF。DBAD方法也有一些局限性。首先,只有一个传感模式是使用一次,这必须手动选择。特别是,识别人走在不同的组,加速度计读数的大小是手动选择识别团体用不同的速度行走,和方位传感模式从手动定位传感器获得选定的群体认同不同的方向行走。然而,仅使用方位不工作当不同组的人在同一个方向走,但不同的速度;只使用大小可以不区分群体不同的方向。因此,多通道遥感有必要区分不同群体没有先验知识的分组的细节。第二,在DBAD实验中,可穿戴的移动设备连接到固定位置以减少噪声的人体传感器收集的数据。 This is not practical since people may put their phones in pockets or hold them in hand. It is not clear how DBAD performs when noise is present in the collected data.

在活动识别中,第一阶段往往是传感模式选择(即。、功能建设)。有许多现有的方法基于移动设备(10]。一般来说,基于领域知识的物理行为涉及或通过一些默认的假设,一组固定的传感方式是手动选择构建一个特定活动的功能。进一步,讨论了(11),大多数活动识别方法不是通用的,他们往往会导致解决方案绑定到特定的场景。因此,(11)提出了一种算法,嵌入功能建设到机器学习的过程。然而,这个泛型方法只适用于分类和回归问题,不能直接应用于聚类问题我们面对这项工作。

3所示。第一阶段:传感模式选择

为不同的活动,不同的传感模式可能代表最有特色。传感模式选择过程使用一个训练集对于一个给定的活动。训练集由一个时间序列对每个传感方式在每个移动设备。每个时间序列可能有不同的采样率和在不同时间窗口可能需要总结。选择的传感模式可以提供准确的集团所属检测结果,我们首先定义评分函数作为度量来找到最好的窗口大小为传感模式,然后确定传感模式是集团所属检测合格。

论文的最后列出符号。依赖于活动和感知模式的阈值。在这项工作中,我们使用我们的数据集确定这些阈值的实用价值进行各种活动。我们将活动详细确定的阈值的部分6在我们的未来的工作。

3.1。得分函数

我们使用概率方法来预测该集团所属检测准确性的传感方法

通过总结 在每个移动设备在一个时间窗口PDF格式,我们可以计算杰弗里的散度13)(相似的措施差距,相反)之间的每个设备。杰弗里的两个概率分布之间的分歧 是由

得分函数 (2)被定义为任何的设备的条件概率 设备的训练集是在同一组Jeffrey传感方式的他们之间的分歧 没有比 : 在哪里 表明 隶属于同一组而吗 表明你没有组联系。如前所述(1), 高度取决于所使用的传感方式和活动的不同而变化。

使用贝叶斯定理,(2)派生

PDF的传感方式可以计算使用的算法1假设分布函数类型传感方式而闻名。例如,大多数传感模式等3 d加速和3 d转速可以建模为标准高斯分布,和等传感模式取向数据循环特性和可以建模为·冯·米塞斯分布(14]。如果标准高斯分布函数类型参数的意思 和方差 一个向量的数值在一个时间序列。如果·冯·米塞斯是分布函数类型,参数是圆形的意思 和圆形的方差 矢量角的值在一个时间序列。

输入:时间序列 、时间序列长度 ,窗口大小 ,分布函数类型
输出:一系列混合模型参数
( )
( )使用期望最大化(12)计算的参数 对于价值观 在时间的向量
系列 ;
( ) ;
( )结束了

杰弗里的散度的计算成本的数量与集成在计算集成的步骤(1),集成的步骤可以确定基于时间序列的长度 。因此,计算的时间复杂度杰弗里的散度与长度的时间序列 是关于

3.2。感应模式选择

感应模式选择问题陈述如下。鉴于 移动设备或用户在训练集,每一个都有一组时间序列 (包含一个时间戳数据的时间序列对每个传感模式在一个给定的活动 ),考虑到评分功能 预测集团所属检测精度(即。,the ratio of group affiliations that can be determined correctly), find the set of sensing modalities as well as the best window sizes which may result in an accuracy higher than decision threshold 。因为概率小于0.5意味着集团所属检测有更多机会错误比正确检测发现, 应大于0.5。此外,根据不同的活动, 可能有所不同,以选择最重要的感知模式的最高分数。的决心 和最重要的感知模式将节中讨论5

算法2描述了如何选择候选人传感模式与相应的最佳窗口大小导致探测概率高于 。时间复杂度取决于传感模式的数量(常数),窗户的数量(常数),移动设备的数量 ,杰弗里的散度计算复杂性( )。因此,总体时间传感模式选择的复杂性

输入:时间序列的训练集 移动设备在活动 , 感应模式
在每一组时间序列,窗口大小范围 根据采样率
训练集,得分函数 、决策阈值
输出传感模式:设置的候选人
(1) ;
(2) ;
(3) ;
(4)
(5) ;
(6) ;
(7) ;
(8)
(9)
(10) ;
(11)结束了
(12)如果 然后
(13) ;
(14) ;
(15)如果
(16)结束了
(17)如果 然后
(18) ;
(19)如果 然后
(20) ;
(21) ;
(22)如果
(23)如果
(24)结束了
3.3。调整窗口大小

传感模式选择过程识别最好的和一些次要传感模式。每个候选人的窗口大小传感模式比较与最好的传感方法。对于任何候选人传感模式,如果新的得分函数在使用最好的感应窗口大小形态仍不小于 的窗口大小传感模式将被修改为一样的最好的传感方式;否则,它使原来的窗口大小。这种方法背后的基本原理是产生多通道融合的结果主要是基于最有效的传感方法和结果预计将提高了考虑二次感应模式。这个窗口大小匹配的目的是减少处理不同大小的窗口在多通道集群在第二阶段。

算法3调整窗口大小的描述了这一过程。类似于算法2调整窗口大小的时间复杂度

输入:时间序列的训练集 移动设备在活动 ,得分函数 、决策阈值 ,设置
候选人的感应模式
输出: 调整窗口大小
(1)
(2)如果 然后
(3)
(4)
(5) ;
(6)结束了
(7)如果 然后
(8) ;
(9) ;
(10)如果
(11)如果
(12)结束了

4所示。第二阶段:团体认同使用多通道集群

一旦我们已经确定一组候选人传感模式以及它们的窗口大小,接下来的过程是使用测试集来确定子组的成员有很高的相似性在这些传感模式在一个均匀的活动组。不同于precollected训练集,可以实时记录在测试集和传感器数据分布的移动设备可以定期(即。,according to the window sizes of the sensing modalities) sent to a central server in an infrastructure-based environment or collected by a sink node via data collection protocols in mobile ad hoc networks. Therefore, the group identification can also be done in real time in addition to using a precollected test set.

多通道传感器fusion-based团体认同问题实际上是多模式的聚类问题,已普遍使用早期融合或晚期治疗融合(15]。早期融合结合传感模式在一个特定的表示在聚类过程中,虽然后期融合首先聚类过程适用于每个传感模式分别从每个传感模式,然后结合结果。根据的比较16),早期融合的优点是,它只需要一个学习阶段,而缺点是困难结合多个传感模式共同表示。虽然后期融合避免了这个问题,它还有其他的缺点如高价以来学习每个传感方式都需要一个单独的学习阶段和潜在损失相关的多维空间。我们相信早融合可能比晚融合在某些情况下,而不是别人。因此,我们调查和比较两种聚类方法,概率聚类为早期融合和多数voting-based集群融合。

在我们讨论两种聚类算法之前,我们需要解释如何处理不同的窗口大小在不同传感模式选择。

4.1。处理不一致的窗口大小

我们使用最好的感应窗口大小为团体意识形态,所以最好的传感方式提供一个两两组关系导致每次团体认同的窗口,和二次感应模式提供多个或没有结果在这样一个时间窗口。图2显示了一个示例提供的三个候选人传感模式与时间序列移动设备, 是最好的传感方式 和窗口大小 用作识别时间窗口。每个传感的窗口大小形态是相同的所有移动设备。因此,通过收集所有人的信息传感模式在所有移动设备, 提供一个两两组关系导致的 窗户, (对应于 )提供一个或没有结果, (对应于 )提供一个或多个结果。

确定两两组一双移动设备之间的联系 杰弗里的散度对阈值进行比较 :如果 ,然后用暂时的结果 表示积极组织关系;否则,使用 表示没有组联系。此外,由于传感方法 可以提供多个结果或没有导致组识别时间窗 由,我们定义聚合的结果 在每一个 窗口 ,表明是否的总和 在窗口是正、零或负数。这是因为积极总和意味着大部分时间积极组织关系建议,反之亦然。聚合结果0可能是由于没有结果发表在这个时间窗口或多个结果取消了对方。在这种情况下,所产生的影响 在团体认同不需要考虑。因此,传感模式 考虑在一组识别时间窗只有当它提供了一个聚合结果1或−1。

4.2。早期的融合:概率聚类

我们提出早期融合多元聚类方法相结合成对集团所属的业绩,每组中所有传感模式识别时间窗口到一个结果。早期融合的一种常见方法是将权重分配给每个传感方法。然而,很难确定相应的权重,手动或使用搜索过程。此外,我们有感应模式交付成对集团所属不同精度的结果。直观地,最好的传感方式应该得到最高的体重早期融合的过程。如果我们分配一个百分比的重量为每个传感模式,然后总结,融合函数没有物理意义,更令人困惑的是比只使用最好的传感方法。另一方面,部分中讨论2,使用单一传感模式没有先验知识的分组信息不足等许多场景中不同组的人走在同一个方向,但用不同的速度。因此,而不是使用单一传感模式或任意提供重量不同的传感的方法,我们使用正确的成对集团的联合概率关系检测作为一种融合方法结合成对集团所属的业绩,所有选中的传感方法。

在一组识别时间窗口中,给定一组传感模式 ,每个提供一个两两组关系的结果 ,在那里 。正确的概率两两组关系(即检测。,the fusion function) is calculated as shown in what follows using Bayes’ theorem:

进一步,我们假设每个传感方式可以提供一个两两组独立关系的结果,所以我们可以重写(4), 的概率 以同样的方式计算的计算部分3所示。1使用训练集,这些预先计算的概率值可以直接应用于测试集的聚类算法被用于识别。

使用测试集,我们可以计算两两组归属概率 每组中识别时间窗口。我们用一个概率阈值 两两组归属概率转换成一个二进制矩阵 融合成对集团的关系的结果。移动设备相对应的值 在矩阵 表示为 。如果 ,然后 ;否则 为不同的活动也可能不同,其测定部分将讨论吗5

基于关系矩阵,我们可以使用现有的聚类算法在一维空间。我们应用联合密度聚类算法(DJ-Cluster) [17),使用现有的行人羊群检测(3)集群移动设备分成不同的组。

的过程中给出的概率聚类方法的算法4。请注意,传感方法 计算中考虑融合成对集团所属的结果只有当它提供结果呢 。时间复杂度取决于数量的设备对( ),选择的传感方式(常数)的数量,计算的 (复杂性计算杰弗里的散度是一样的,也就是说, ),DJ-Cluster算法( )。因此,总体概率聚类算法的时间复杂度

输入:时间序列的测试集 移动设备在活动 , 选择的传感模式在每组时间序列,
概率阈值
输出:设备组每组中识别时间窗口
(1)每个移动设备使用其本地时间序列来计算每个选定的pdf传感方式根据其窗口
大小;
(2)服务器或水槽节点收集来自所有的pdf文档 移动设备在每组识别时间窗口并运行
以下过程:
(3)初始化集团关系矩阵 ;
(4)每个设备对
(5) ;
(6)
(7)计算 ;
(8)如果 然后
(9) ;
(10)如果
(11)结束了
(12)计算 ;
(13)如果 然后
(14) ;
(15)其他的
(16) ;
(17)如果
(18)结束了
(19)DJ-Cluster算法适用于矩阵 ;
4.3。后期融合:多数Voting-Based集群

末提出了一种融合多模式聚类方法相结合所产生的集群每个组中的每个传感模式识别时间窗口。我们第一次使用DJ-Cluster算法来生成每个传感的集群模式。类似于算法4,一个感应模式 集群是考虑在最后确定了两个移动设备只有当它提供结果呢 。我们修改多数表决的方法用于3),融合计算的总结重量感应模式,对移动设备都聚集到同一组。这两个移动设备被添加作为一个集群在大多数解决方案如果总结重量大于50%。如果其中一个集群已经在一个解决方案,另一个连接相同的集群而不是添加一个新的集群。然而,在(3),它只是分配一个重量的50%的功能可能会给最好的精度,然后把剩下的50%的其他特性。它不寻找最好的权重赋值或自动训练这些权重。因此,重量分配仍然是一个问题在这个后期融合多模式聚类的方法。因为我们已经有一个传感模式选择过程在聚类过程中,只要传感模式很好地选择,所有选择的传感模式应该扮演重要角色组中识别。因此,我们在所有选择的传感模式应用相同的重量。

算法5给大多数voting-based聚类方法的过程。类似于算法4的时间复杂度,所有选择的传感模式是单独的集群 。的时间复杂度进一步应用在所有设备对多数表决 。因此,绝大多数的总体时间复杂度voting-based聚类算法 的概率是一样的聚类算法。

输入:时间序列的测试集 移动设备在活动 , 在每个组时间序列选择传感模式
输出:设备组每组中识别时间窗口
(1)每个设备对
(2) ;
(3)结束了
(4)
(5)初始化集团关系矩阵 ;
(6)每个设备对
(7)计算 ;
(8)如果 然后
(9) ;
(10) ;
(11)其他的
(12) ;
(13)如果
(14)结束了
(15)DJ-Cluster算法适用于矩阵 ;
(16)结束了
(17)每个设备对
(18)多数投票产生的集群感知模式 ;
(19)结束了

复杂性与DBAD。DBAD方法计算两两组从属关系在每个设备上。计算两两组的复杂性关系基本上是杰弗里的散度计算( )。每个设备都需要计算 两两组从属关系对其他设备。因此,DBAD的总体时间复杂度 。在我们的方法中,我们不仅计算两两组从属关系,而且识别分区。因此,我们的方法需要计算杰弗里的散度( )在所有成对的设备( ),导致整体的时间复杂度( )。的复杂性增加了我们的方法需要解决组分区问题。

5。绩效评估

5.1。性能指标

自从DBAD方法仅检测两两组关系,其评价只考虑两两组关系检测结果的准确性。相比之下,我们的最终结果是确定组;因此我们使用性能指标两两组关系的准确性和组成员相似性评价中间和最终结果,分别。团体认同,因为组织预配置,一个实验时不变,我们确定最终的组分组的结果是稳定的;即组保持至少5组识别时间窗口。组成员关系相似度计算的平均Jaccard相似(18)之间的识别组和相应的实际组。两两组关系计算精度比正确地确定集团的关系在两两组的总数当最后一组确定的关系。

3显示了一个示例组识别比较实际组的结果。我们第一场比赛每组确定一个实际组最常见的成员,所以 是匹配的 , , 。然后,Jaccard之间的相似性是1/3 之间,2/4 之间,2/3 。因此,组成员相似性是0.5(平均Jaccard相似)。与此同时,有 两两组关系,但只有9条(有或没有组从属关系)决定正确,也就是说, , , , , , , , , 。因此,两两组归属精度

5.2。数据集

在绩效评估中,我们首先使用DBAD[提供的数据集1活动的人走在一起。DBAD数据集包含传感器数据获得10均匀Android设备附加到每个人的臀部。实验进行不同配置(从1到10组)组,并且每个实验持续51分钟。每个传感器的采样率是25 Hz。计算活动相似的人一起散步,我们考虑下面的传感模式中可用数据集: 加速度, 加速度, 加速度和大小(从3 d获得加速度计);方位、俯仰、滚(从定位传感器获得)。级的平方和的平方根是3 d加速,DBAD评估使用它而不是三维加速度测量。有两种局限性DBAD数据集的讨论部分2:一是可穿戴的移动设备连接到人体的固定位置,以减少噪声传感器收集的数据;另一个是只有一个活动(即。,人们走在一起)。因此,我们也收集自己的datasets-one公园的场景和一个游戏场景中讨论部分1

公园场景具有相同活动DBAD数据集和使用相同的采样率,但以更少的控制手机的立场,允许更多的噪声数据和遥感模式允许考虑多个模式。自从DBAD数据集只包含加速度计和方向传感器,我们收集自己的数据集和更多的运动传感器在智能手机相同的活动,人们走在一起。它包含从8异构智能手机获得传感器数据(例如,Nexus和三星Galaxy手机)举行的手走在3组的人大约10分钟。这些团体有不同的方向走,步行速度略有不同。传感器记录3 d加速计,3 d陀螺仪,和方向传感器。我们认为以下传感模式: 加速度, 加速度, 加速度(从3 d获得加速度计); 旋转, 旋转, 旋转(从三维陀螺仪获得);方位、俯仰、滚(从定位传感器获得)。

游戏场景(即有不同的活动。,audience wave hands for different teams) from the DBAD dataset and it is used to demonstrate that our approaches are general and can handle different activities. The sampling rate is also the same. This dataset contains the sensor data obtained from 8 heterogeneous smartphones for about 10 minutes. Each group waves their smartphones in different time periods, mimicking the activity that audience cheer for the two competitor teams in a game. The sensors recorded are the same as in the park scenario dataset.

对于每个数据集,我们上半年分成两个部位的训练集传感模式选择和下半年的测试集的识别子组内同质的活动组。我们实现算法在Python中并运行算法23在训练集和算法45在测试集。

5.3。实验结果
5.3.1。结果使用DBAD数据集

在训练集,我们最小和最大窗口大小设置为5秒,50秒,分别。最低设置窗口大小根据采样率25赫兹,所以我们可以有超过100个样本在每个窗口计算PDF。的最大窗口大小不能太大(一分钟内);否则它花费的时间太长使分组的决定。表1显示结果为每个传感方式,最好的成绩是最好的得分函数窗口大小的传感方式和新的分数是重新计算得分函数使用最好的传感方式的最好的窗口大小。

作为讨论的部分3所示。2,决定阈值 应大于0.5。在这里我们设置 ;方位(窗口大小5 s), 加速度(窗口大小15秒), 加速度(窗口大小15秒), 加速度(窗口大小15秒)和大小(窗口大小15秒)。由于大小是一个冗余的传感方式的3 d加速和收益率非常相似的得分为3 d加速,我们使用3 d加速传感模式算法45而不是大小。我们下一个使用测试集来评估算法45

首先,我们考虑的概率阈值 在算法4。类似于决策阈值 ,还应该大于0.5。因此,我们改变它从0.55到0.95。图4(一)表明,组成员相似性略小于两两组关系的准确性。这是因为存在一些关键环节是基于聚类算法。如果一个关键环节是确定与不正确的集团所属的结果,这将大大影响团体认同的结果。一般来说,两两组关系精度增加时 增加。使用DBAD数据集, 导致成对集团所属最高精度和组成员关系相似度最高的。接下来,我们将使用概率聚类算法的比较结果 结果使用DJ-Cluster算法在每个单一传感模式以及使用大多数voting-based在所有传感模式聚类算法。

4 (b)显示了两两组关系的准确性和图4 (c)显示了组成员相似。我们把不同的传感方式的结果结合不同方法的结果不仅为了比较方法也多通道对每个传感方法。还注意到,因为大多数voting-based聚类算法输出最终集群基于集群计算从每个传感方式,它不输出组合成对集团所属的结果所有传感模式;我们只比较概率方法和每个传感通道成对集团所属的准确性。

在图4 (b),三维加速度传感模式导致精度约为0.6,而相关的方位方向传感器会导致精度约为0.76。这些结果与DBAD方法的结果一致,在方位提供最好的两两组关系的准确性。超出了他们的发现,我们的传感模式选择方法自动选择方位最重要传感方法。此外,概率的方法会导致一个精度约为0.86,这表明multimodal-based方法优于原DBAD方法使用一个传感方法。

在图4 (c),比较类似于图4 (b)。此外,概率方法优于多数voting-based方法使用DBAD数据集。这是因为除了方位传感模式没有高分,所以他们的贡献在大多数voting-based方法并不重要。然而,大多数voting-based方法仍然提供了一个组成员相似性高于单独使用3 d加速或方位。

5.3.2。结果使用公园场景数据集

我们使用相同的最小/最大窗口大小如表。DBAD训练集2显示了结果,其中方位角也会导致最好的成绩表1

我们也选择阈值决定 ,所以方位(窗口大小5 s), 加速度(窗口大小15秒) 加速度(窗口大小15秒)选择的传感方法。虽然 这里没有选择加速度,它不贡献显著结果DBAD数据集。图5(一个)显示了概率方法的结果,当我们改变概率阈值 从0.55到0.95。DBAD测试集的结果相似,组成员关系相似度略低于两两组关系的准确性,和两两组关系精度增加时 增加。我们选择 概率方法在以下比较使用的测试集。

5 (b)比较两两组关系精度的结果。类似于图4 (b),方位导致精度高于3 d加速,和概率方法导致了更高的精度比方位。图5 (c)比较了组成员相似的结果。比较符合成对集团所属的准确性。此外,大多数voting-based方法导致组成员相似性低于概率的方法,但仍高于使用的相似之处 加速度, 加速度,或单独方位。所有这些结果再次验证multimodal-based方法比原始DBAD方法适用于单一传感方法。进一步,与对照实验DBAD均匀的手机和固定电话的位置,我们的实验是更少的控制和有更多的收集传感器数据的不确定性。尽管所有这些,我们使用数据集仍然有前途的结果(例如,组成员相似概率方法仍高于0.8),表明我们的方法可以处理传感器数据噪音。这是因为传感模式中选择数据噪音的存在。

此外,结果使用公园的场景数据集符合那些使用DBAD数据集,因为它涉及到相同的活动。这表明同样的训练集相同的活动可能被用来测试数据集,如果训练集是收集和研究中涉及的参数算法好。

5.3.3。结果使用游戏场景数据集

3显示了传感模式选择的结果。不同于表12,三维旋转导致的最高分数。三维加速度可能仍然工作,但这个活动的方位并没有多大意义。这意味着DBAD的方法手动选择一个传感模式不会在这种情况下工作。

我们仍然可以选择阈值决定 ,所以 加速度, 加速度, 加速度, 旋转, 旋转, 选择旋转。图6(一)显示了概率方法的结果。类似的发现在DBAD测试集和公园场景测试集,我们可以选择 概率的方法来比较使用每个单一传感模式以及多数voting-based方法。

6 (b)表明, 旋转导致精度高于对方传感模式,和概率方法导致更高的精度比只使用 旋转。图6 (c)如图显示一致的趋势6 (b)。然而,不同于两个数字4 (c)5 (c),大多数voting-based组成员相似性方法导致略高于概率的方法。这是因为有几个重要传感模式(即, 旋转, 旋转, 这个活动的旋转),提供准确的结果。与活动,人们走在一起,只有方位使最终结果的重大贡献multimodal-based方法;这里所有的3 d旋转作出重大贡献;因此,多数投票是更重要的。

总之,活动显著影响传感模式选择以及团体认同的结果。这在部分验证我们的假设3需要选择过程来自动选择传感模式不同的活动。此外,概率方法的比较和大多数voting-based方法验证我们的假设4早期的多通道融合集群可能比晚融合在一些活动,但并非总是如此。认为所有的方法提出了这项工作(即。、算法2,3,4,5对各种活动)是有效的。

6。结论

在本文中,我们提出了一个通用的框架来确定子组在同类活动组装备传感器移动设备使用。我们首次提出了传感模式选择方法给出一个粗粒度的活动。我们有提供了一个方法来处理多个窗口的大小在所有选择的传感方法。通过设置组标识窗口大小一样最好的传感方式,我们有进一步发展两个多峰集群approaches-probability-based方法对早期融合和多数voting-based后期融合方法。最后,我们评估我们的方法使用一个公开的数据集,两人也收集了自己。评价结果表明,我们的框架的多通道方法优于原DBAD方法适用于单一传感模式,并为各种活动框架是有效的。

一些被认为是未来工作的改进。首先,在这个框架中,活动被认为是作为算法的输入。虽然我们还没有研究了传感模式选择每活动训练,我们的评估结果不同的数据集,但具有相同活动往往是非常相似,表明使用相同的训练集的活动和测试在不同的数据集有关这个活动是可能的。第二,在这项工作中,我们假定传感器数据分布的移动设备周期性地发送到中央服务器在一个轨道环境或水槽节点通过收集的数据收集协议在移动ad hoc网络。因此,中央服务器或水槽节点完整的信息在网络计算成对相似性,应用聚类算法组基于成对关系矩阵的相似之处。在未来的工作中,我们将进一步考虑纯p2p环境中相邻的移动设备交换他们的传感器数据分布。多次反射的邻居可能不是因为一些成对相似性计算由于啤酒花有限的数据交换,聚类算法需要修改相应的工作与当地部分集团所属矩阵每一个移动设备上。最后,我们会将杰弗里的散度直接应用到多个传感模式时提供了实用的数学方法。

符号

: 感应模式
: 窗口大小
: 得分函数
: 杰弗里的散度阈值(不同的形态和活动)
: 感应模式决策阈值(不同的活动)
: 组与多个传感模式概率阈值。

相互竞争的利益

作者宣称没有利益冲突。

确认

这个项目支持部分通过NSF资助cns - 0915574和国家自然科学基金的中国广东政府联合资助(2)超级计算机应用研究。