文摘
人类活动识别(HAR)吸引了相当多的研究关注在过去十年的发展可穿戴传感器技术和深度学习算法。然而,大多数现有的HAR方法忽略了空间关系的特征,这可能会导致识别错误。本文基于修正胶囊网络小说模型(m cn)提出了准确地识别各种各样的人类活动。这部小说模式由一个卷积块和一块胶囊,从而实现端到端智能识别。同时,特征的空间信息是保存在一个动态路由的过程。来验证模型的有效性,建立人类活动数据集将小腿上的惯性测量单元(IMU)的志愿者收集他们在日常生活中的活动数据,包括走路,慢跑,楼上,楼下,坡道,down-ramps。这个新方法的识别精度可以达到96.08%,而执行比卷积神经网络(CNN)的准确性达91.62%。此外,它是评估在两个公共数据集命名WISDM UCI-HAR,精度达到98.21%和95.28%,分别,这礼物的精度高于基准算法如CNN的报道结果。实验结果表明,该模型具有更好的活动检测能力和哈尔实现出色的性能。
1。介绍
人类活动识别(HAR)是许多领域的基础,已成为一个研究热点在过去十年的意义。目前,该技术已广泛应用于智能家居领域的(1[],室内导航2),身份识别(3[],人机交互技术4[],步态分析5),和互联网医疗保健的东西6,7]。识别精度的相应活动对这些应用程序具有重要的影响。为了提高识别的准确性,各种传感器技术已经用来收集活动数据和不同的方法构造根据数据特点,确定的活动。
活动数据收集方法主要分为两组:视频图像(8)和可穿戴传感器(9]。前获得一系列人类通过相机和运动图像提取运动特征信息从这些图像。常用的方法是基于Kinect传感器、图像处理方法可以提取深度移动目标的图像特征(10]。后者是把传感器放在一个特定的佩戴者的身体的一部分来获取运动信息。可穿戴传感器主要包括表面肌电图(表),足底压力传感器和惯性测量单元(IMU)或运动传感器融合获得更全面的信息。
然而,它有一些缺点和局限性(前面提到的数据收集方法9]。基于视频图像的方法需要在实验室条件下完成从一个特定的背景是必需的,和相机的价格通常是昂贵的。面肌电信号传感器需要与佩戴者的密切接触皮肤,所以它很容易受到汗水和导致不舒服穿。足底压力传感器易受不平的地面。随着传感器技术的发展,IMU越来越流行是由于轻的优势,廉价,精度高,并且很容易穿11]。此外,IMU传感器也嵌入到移动设备,如智能手机和smartwatches所广泛使用的人6,7,12]。显然,IMU收集活动数据是一个很好的选择。
根据不同方法获得的不同活动信号的特点,研究人员提出了不同的活动识别方法。机器学习算法是受欢迎的在一开始,如支持向量机(SVM) [13),随机森林(RF) (14),线性判别分析(LDA) (13),高斯混合模型(GMM) (15),和极端学习机(ELM) [16]。Tahir Hussain et al。13)提出了一种新的特征提取方法流程表,使用两个分类支持向量机模型和LDA的运动意图识别四个科目。是更健壮的方法与现有的方法相比,但需要11面肌电信号传感器位于下肢肌肉。此外,如前所述,多传感器融合的方法也是有效的活动识别(12]。习等。16)提出了一个内核级的数据融合方法和双参数优化基于一个极端学习机(DPK-OMELM)确定活动类型融合面肌信号和足底压力信号,实现了识别精度高。陈等人。5)提出了一个新颖的活动基于人体步态特征进行分类识别算法6活动使用智能鞋垫可穿戴系统集成足底压力传感器和IMU,低成本计算、精度高,并介绍了步态实验室日常活动。
然而,传统的机器学习方法依赖于手动提取功能,这就需要研究人员在相关领域拥有丰富的专业知识和经验,但是,目前还没有标准如何手动提取特征(17]。因此,这些方法都是耗时的,甚至无法实现。
深度学习基于神经网络提出了自2006年以来,(18),取得了杰出的表现在许多具有挑战性的计算机视觉等领域,自然语言处理,语音识别,自动车辆。神经网络,包括卷积神经网络(CNN)和长期短期记忆网络(LSTM)表现出强大的特征提取功能,可以自动从原始数据中提取特征对于分类和其他任务,(研究人员带来极大的方便19]。
因此,结合活动信息通过IMU和CNN或LSTM研究哈尔已经成为一个新的和有前途的趋势20.]。陈等人。21基于LSTM-CNN]提出了一种识别方法,结合LSTM和CNN模型的优势,并利用收集到的IMU运动信息分类五个常见的活动,取得了97.78%的平均精度。针对传统的活动识别方法的复杂性,朱et al。22)提出了一种新的卷积神经网络模型表示为DDLMI深处,这五种地形分类收集在大腿和小腿乌兹别克斯坦伊斯兰运动信息和识别准确率可以达到97.64%。Semwal et al。23)使用人工神经网络(ANN),极端的学习机器(ELM)和深层神经网络(款)确定六种运动加速度传感器收集的信息。款达到最好的识别精度。胡锦涛et al。(24)使用了六个IMU安装在身体训练三个深度学习模型,精度达到90%以上。实验结果进一步证明了使用深度学习模型和可穿戴IMU传感器步态分析中有巨大的潜力。Semwal et al。25)提出了一种深度学习框架基于集成学习分类收集的IMU七步法活动信息。实验结果表明,该框架表现优于其他方法。Bozkurt [26)使用各种机器学习方法和深度测试IMU数据集的学习方法,和结果表明,深度学习的方法达到最佳性能。
尽管CNN和LSTM显示领域的优秀性能HAR,他们仍有一些缺点如下:(1)CNN的池层失去了一些信息,这可能影响分类结果;(2)CNN平移不变性,泛化能力差;和(3)LSTM忽略空间特性和并行处理很差。针对这些缺点,Sabour et al。27)提出了一个胶囊2017年网络(CapsNet)模型。所谓的胶囊是一个矢量组成的一组神经元。传统神经网络使用单个神经元的输入和输出,而胶囊网络使用向量作为输入和输出。胶囊的长度代表实体存在的可能性和方向代表其特征特性。CapsNet实现编码地方特色和整体之间通过动态路由机制来保护功能的空间关系,所以翻译同质性,有能力克服CNN和LSTM称为不足之处。
到目前为止,只有少数研究人员应用CapsNet HAR。使用该框架的第一部作品的CapsNet哈尔是由范教授等。28)提出一个名为SensCapsNet的模型。实验结果表明,该方法优于CNN和LSTM。施等。29日)提出了一个基于胶囊的HAR系统和“远程”。系统可以实现远距离、低功率消耗和实时HAR。结果表明,该方法取得了精度高于CNN和递归神经网络(RNN)。哈立德et al。30.)提出了一个提高d-harcapsne CapsNet命名模型1。这提供了一个高效的智能决策支持方法HAR。太阳et al。31日)提出了一个新颖的方法叫CapsGaNet基于胶囊和门复发单元(格勒乌)注意机制。这种方法能够实现时空multifeature提取可穿戴IMU传感器的HAR。
与此同时,值得强调的是,不同的人类活动的特点有一些相似之处,和保护之间的空间关系特征可能更有利于区分不同的活动。为了进一步研究在哈尔胶囊网络的有效性和CNN和LSTM克服上述的缺点,本文提出了一种新的模型基于修改胶囊网络(m cn) HAR。这部小说模型由一个卷积块和胶囊。卷积块可以提取浅小卷积核活动特性。重量共享和卷积的小内核层允许更少的参数在反向传播训练。然后,胶囊块采用向量作为网络的输入和输出和矿山空间信息的功能。结果,该模型给出了充分发挥CNN和CapsNet的特征提取功能,保留空间信息同时深入挖掘活动特性。
这部小说来验证的有效性模型,进行了实验研究,包括以下两个部分:首先,镇定的数据集应用于测试m cn的学习能力。数据集包括三轴加速度计和三轴陀螺仪的信息的信息,收集的十个志愿者。此外,m cn模型的有效性验证通过比较实验与CNN。第二,公共数据集WISDM和UCI-HAR受聘进一步验证m cn模型的泛化能力。
总结了本文的主要贡献如下:(1)小说深刻的学习模型基于修改胶囊网络提出了人类活动的认可。该模型不仅可以实现端到端智能识别还保留功能的空间关系。(2)人类活动数据集构造基于IMU传感器信息。该模型数据集识别精度达到96.08%,高于91.62%的卷积神经网络。(3)该模型识别精度达到98.21%和95.28%在公共数据集WISDM UCI-HAR,分别。
论文的结构组织如下:胶囊网络模型并提出m cn模型提出了部分2。介绍数据集和数据预处理提出了部分3。比较实验和结果公布在部分4。节中给出了相应的讨论5。总结了本文的结论部分6。
2。方法
2.1。CapsNet模型
原来的CapsNet包括三层,即卷积层,PrimaryCaps层,DigitCaps层(27]。卷积层执行特征提取到256年卷积核的大小9×9,一个跨步,ReLU激活,然后输入到PrimaryCaps层。PrimaryCaps层进一步提取特征通过32×8卷积核的大小9×9和2的步伐。然后,生成1152胶囊的尺寸8,这是输入到DigitCaps层作为低级胶囊。DigitCaps层最后生成10胶囊的尺寸16通过动态路由机制。胶囊的最大长度是最终的分类结果。最后,正确预测胶囊通过三层完全连接神经网络重建输入。
动态路由是CapsNet的核心部分,输入和输出的胶囊是向量,通过它,CapsNet保留特征的空间信息32]。图1显示了胶囊之间的信息传递过程。
输入胶囊乘以权重矩阵获得预测胶囊 ,这是完成由以下公式: 在权重矩阵通过反向传播更新。
的加权求和和耦合系数胶囊可以获得深层的特征 。然后,是通过挤压非线性激活函数,所以短向量几乎是0和长向量是接近1,和输出胶囊吗获得,见以下方程: 在哪里耦合系数取决于迭代动态路由过程,可以通过中间变量更新 , 胶囊的向量输出吗j,是它的总输入。
更新和通过计算每个输出之间的相关性胶囊吗和预测胶囊 ,见以下方程: 的初始值在哪里是0。在得到 , 是更新。如果两个向量的一致性高,变得更大,不一致时,它变得越来越小。然后,和将被更新,最终的输出胶囊后将获得动态路由过程。
2.2。提出了m cn模型
卷积神经网络(CNN),在1998年首次提出,是一种前馈神经网络(33),在哈尔拥有杰出的表现。但在汇聚层的过程中,空间信息等特性的姿势和速度就会被丢弃。然而,通过动态路由过程,当地部分和整体之间的信息由CapsNet保存。因此,CapsNet可以分辨较小的特性不同的活动之间的区别。此外,LSTM并行处理的很差。向CNN和LSTM的缺点,基于深度学习模型修改胶囊网络,即m cn,提出HAR。
提出了m cn结构如图2,它可分为两部分:CNN块和CapsNet块。原胶囊网络相比,网络结构修改如下:第一,三层卷积层与内核大小3取代了单层卷积与内核层的大小9。这个可以实现参数共享和有效降低网络中参数的数量。此外,一批标准化(BN)层添加每次卷积后层。它可以加快神经网络的收敛34]。激活函数使用漏ReLU代替ReLU。这增加了神经网络的非线性,给所有负一个非零的斜率可以保存所有负值。辍学层添加到网络随机下降一些神经元在一定比例,可有效防止模型过度拟合。最后,由于不需要图像重建结果,三层完全连接层被丢弃,这进一步降低了网络参数,有利于网络的轻量级。
的具体过程提出了m cn模型如图2。首先,IMU数据预处理,然后输入到CNN块中。三层二维卷积后,输入到CapsNet块中。PrimaryCaps层和ActivityCaps层后,6个胶囊的尺寸16输出。最后,计算每个胶囊的长度。
CNN的块,考虑卷积的深入功能挖掘功能层,三层Conv2D内核大小为3×3被分配到提取浅特性。使用小型内核可以有效地减少训练参数的数量。每次卷积后层连接到十亿层和漏ReLU激活层,BN层可以加快网络收敛和活化层引入了非线性映射到网络。
CapsNet块,包括PrimaryCaps层和ActivityCaps层。PrimaryCaps层接收来自CNN的特征图块,这是一个二维卷积胶囊层与内核大小为2×2和2的步伐,进一步提取功能。之后,他们重塑低级胶囊的尺寸8和输入到ActivityCaps层。动态路由的迭代后,6个胶囊的尺寸16终于产生。最大长度的胶囊是由神经网络识别人类活动的结果。此外,一个辍学层添加PrimaryCaps层和ActivityCaps层之间的随机删除一些神经元概率为0.5,以防止过度拟合。由于输入被IMU数据,识别结果不需要重建。详细的网络参数将在第四节。
损失函数被定义为利润损失(27]。对于每个胶囊输出向量,计算损失函数如下公式所示: 在哪里= 1时类k活动确实存在,否则它是0, , ,和λ培训期间hyperparameters,值0.9,0.1,和0.5,分别。总损失的总和所有输出胶囊的损失。
此外,传统的CNN模型是专为比较实验。结构如图3。卷积模型由6层,包括三层,池一层和两层完全连接。每个卷积后十亿层和激活层添加图层。池层可以实现降维。完全连接层用于分类和输出通过softmax每个类别的概率值。最高的概率值是神经网络的识别结果。
3所示。数据集和预处理
3.1。收集的数据集
收集实验数据,10名志愿者(所有男性,25±1岁,体重70±20公斤,和身高170±10厘米)被邀请去学校。他们是健康的人没有任何低limb-related残疾。对于每个志愿者,六种不同的活动实验(步行、慢跑、坡道、down-ramps楼上和楼下)。在实验之前,实验通知每个参与者的性质,从每个志愿者获得书面同意。
在数据收集的过程,乌兹别克斯坦伊斯兰运动(模型:BWT901BLECL5.0、深圳wit-motion科技有限公司,深圳,中国)应用于收集活动数据,它可以收集加速度计和陀螺仪在三个正交轴在活动。乌兹别克斯坦伊斯兰运动传感器布局和坐标系如图4(一)。乌兹别克斯坦伊斯兰运动与志愿者的右小腿外侧带,不会引起不适的志愿者活动。执行数据收集在户外和室内,而不是在严格控制的实验室条件下。志愿者们走在自己的舒适的方式,每个活动图所示4 (b)。
(一)
(b)
在数据收集过程中,IMU的采样频率为100赫兹。运动信息发送到笔记本电脑通过蓝牙传输。生成一个文本文件并存储在每个活动后的笔记本电脑。最后,收集2015766个数据样本,每个活动的数据分布如图5。这个数据集的样本数量相对平衡,这有利于提高神经网络的泛化能力。
3.2。公共数据集
3.2.1之上。WISDM
WISDM数据集是由36名志愿者收集使用一个内置的三轴加速度计在前腿的Android手机的口袋里(35]。采样频率是20赫兹,和六个收集活动:走路,慢跑,楼上,楼下,站着,坐着。共1098209个样本记录,每个活动的分布如图6。可以看出,数据集是一个不平衡的数据集。
3.2.2。UCI-HAR
UCI-HAR数据集是由30名志愿者36]。19-48岁的志愿者把腰上的智能手机,完成共有六个活动在他们的日常生活。六个活动站,坐,躺,走路,楼上和楼下。加速度计和陀螺仪数据为每个活动收集的采样频率为50 Hz。这些实验录像方便手动标签的数据。最终,数据集产量748406个样本。每个活动的分布如图7。可以看出,数据集是一个平衡的数据集。
3.3。数据预处理
为了方便网络模型的训练,提高识别精度,需要进行预处理后原来的IMU数据。
3.3.1。数据归一化
活动数据的收集是通过蓝牙、无线传输和数据传输过程中可能会丢失。首先,如果有缺失值,整个行数据就会被丢弃。
加速度计和陀螺仪乌兹别克斯坦伊斯兰运动传感器收集的数据有不同的数值范围。直接使用数据训练神经网络模型训练的结果可能很差。因此,为了平等对待每个特性,有必要正常化IMU数据区间均值为0,方差为1。正常化过程移除任何总体偏差和IMU数据的不同范围的影响(37,38]。归一化公式如下所示: 在哪里规范化数据,是原始数据, , 原始数据的均值和方差,分别。
3.3.2。数据分割
收集活动数据,不建议直接使用每个样本进行模型训练,因为每个样本的数据是0.01秒,代表活动的瞬时状态,不能反映每个活动的特点。因此,在本文中,一个固定长度的滑动窗口应用于部分数据,并且每个窗口包含三轴加速度计和三轴陀螺仪的信息的信息。一个固定长度的窗口从一个采样点到另一个移动,每次前进的长度相同,同时保留一定比例的历史信息前面的窗口。然后单独每个窗口原始序列的特征提取。收集到的数据可以用样本矩阵年代如下面所示: 在哪里一个和B代表了加速度计和陀螺仪;x,y,和z代表加速度计和陀螺仪的三个频道;t代表了总样本矩阵的行数。假定滑动窗口的大小米,每个窗口的步长是步骤(步骤<米),样本矩阵年代可分为 相同的大小和细分结果如图8。
3.3.3。数据标签
一个炎热的编码方法应用于编码6活动,也就是说,在每一个列向量,除了一个是1,其余的都是0,可以解决分类数据的离散值问题。六个活动的编码结果见以下方程:
4所示。结果
实验使用PyTorch深度学习框架来实现m cn模型,它支持c++、Python、和其他编程语言,可以运行在CPU和GPU。实验的硬件配置是英特尔i5 - 8300 CPU、NVIDIA GeForce GTX 1050显卡,8 G RAM。这些实验是Windows 10系统上执行。Python 3.10,软件是anaconda3 PyTorch 1.11, CUDA 11.3。
为了评估m cn模型的性能,精度,精度,记得,F1-score,混淆矩阵(CM)作为评价指标,以及计算公式所示以下方程: TP在哪里数量模型的正确预测的积极类,FP是错误地预测模型的正类,TN是模型的正确预测负类,和FN的数量模型错误地预测负类。F1-score综合考虑精度和召回,所以这是一个公平的评价指标。值范围是[0,1]。值越大,模型输出越好。
可以从CM,实际标签的数量误认为其他标签的模型。CM定义如下: 水平轴代表真正的标签,纵轴代表了预测标签。对角元素代表的数量正确识别每种类型的活动,而非对角元素代表活动的数量错误地认定为每种类型的其他活动。因此,较大的对角元素的数量和非对角元素的数量越小,模型的识别结果越好。
4.1。收集的数据集
以下4.4.1。m cn模型评估和结果
摘要滑动窗口大小是128步长是64。也就是说,1.28秒的数据,和重叠率是50%。六个活动认识都是周期性的,1.28年代数据可以包含一个活动周期(14,21]。因此,本文选择1.28年代的数据作为训练数据分类器,以确保窗口的数据包含至少一个完整的活动周期,以便保留所有关于每个活动的信息。收集到的IMU数据预处理后,31495单通道生成“图像”,“图像”的大小为128×6。80%是随机作为训练集,其余20%作为测试集来评估模型的性能。随机选择20%的训练集作为验证集,这是用来监控培训过程中模型的影响。识别流程图如图9。
输入m cn模型的尺寸是128×6。卷积在三层,输入PrimaryCaps层。PrimaryCaps层后,32×62×1胶囊的尺寸8产生和输入到ActivityCaps层。经过ActivityCaps层,输出6胶囊的尺寸16。
有20157个样本进行训练,这绝对是足够了。BN层模型结构。此外,辍学层之间PrimaryCaps层和ActivityCaps层随机丢弃一些神经元概率为0.5。这些策略可以防止模型过度拟合训练。
优化器是亚当,最初的学习速率为0.001,批量大小是128,和培训时期的数量是100。在模型训练的过程中,该方法提供的动态调整学习速率PyTorch应用于确保模型更接近最优解在培训期间。
动态路由过程保留了空间关系的特征。动态路由的迭代次数是m cn模型的一个重要参数。迭代次数设置为2,3,4。的准确性93.92%,96.08%,94.09%达到测试集,分别,所以动态路由的迭代次数是3。详细的m cn模型的结构参数如表所示1。
当模型训练完成后,测试集是用来评估。精度达到96.08%,取得了良好的识别结果。其他评价指标和CM如表所示2和图10。
从表2,它的值可以看出,精度,回忆,和F1-score每个活动都超过0.9。为F的最小值是0.929 1-score down-ramps和慢跑的最大值为0.990。的平均价值F1-score是0.960,这表明,m cn模型提出了取得了很好的识别结果收集的数据集。
在图10,不难发现59 down-ramps样品误判为步行和41坡道样品误判为步行。所以,down-ramps和步行坡道很容易被混淆。可能的原因是,在这两个活动的开始和结束,斜率变得越来越小,这使得它很难区别于地面水平。也有一些down-ramps错误地认定为坡道和楼下错误地认定为down-ramps,可能是因为这些有相似的特性。
显示原始的特性和功能被m cn的每一层,t-SNE降维算法的可视化(39]。可视化结果如图11。
(一)
(b)
(c)
(d)
(e)
(f)
在图11,不同的颜色代表的点提取的特征从不同的活动。可以发现,随着网络的深入,逐渐聚集相似的活动功能。原始数据是分散的,后三个卷积层,相同类型的活动倾向于聚集在一起。经过CapsNet层,六个活动基本上是分离的特点。
4.1.2。CNN模型评估和结果
为了验证m cn模型的有效性,CNN模型用于比较实验。CNN的模型结构如图3。为了确保公平的比较实验,前三个二维卷积层的结构是一样的m cn。三卷积层之后,CNN模型通过max池层实现降维,和内核步幅的大小是2×2 2。然后,两个完全连接层代替m cn的CapsNet相连。辍学层还用于完全连接层,和一些神经元根据0.5的概率是随机丢弃。最后,CNN模型输出的概率值通过softmax每个活动。在培训期间,除了使用交叉熵的损失函数,其余的设置是一样的m cn,最后,测试集上的准确性为91.62%,低于96.08%的m cn。
4.2。结果在公共数据集
为了进一步验证m cn模型的泛化能力,评价实验也在公共数据集上执行WISDM UCI-HAR。
4.2.1。准备WISDM数据集
窗口大小是128步长是64。数据预处理后,生成17158个样本。70%的样本用于培训和其余的用于测试。输入m cn模型的尺寸是128×3。优化器,最初的学习速率和批量大小是一样的镇定的数据集。详细的结构参数如表所示3。后100时代的训练,测试集上的准确率是98.21%。其他评价指标和CM如表所示4和图12。t-SNE降维算法还采用可视化特性提取每一层,如图13。
(一)
(b)
(c)
(d)
(e)
(f)
在表4,站达到最佳的识别效果,所有评价指标是1。数据集是一个不平衡样本数据集,但是F每个活动1-score超过0.9,平均为0.978,这也进一步证明了m cn模型的有效性。
从图12可以看出,站着和坐着都是正确地识别。15楼上楼下样品被误判,23楼上楼下样品并被错误地归类为可能,因为两个活动的特性太相似了。
4.2.2。UCI-HAR数据集
滑动窗口大小是128(2.56),和重叠率是50%。因此,生成10299个样本。其中,7352个样本来自21个志愿者被用于训练,和2947年9志愿者样本用于测试。训练集输入到m cn模型的维数128×9。优化器,最初的学习速率和批量大小是一样的镇定的数据集。详细的结构参数如表所示5。同样的训练后,获得95.28%的准确率测试集。其他评价指标和混淆矩阵如表所示6和图14。每一层的功能可视化结果如图所示15。
(一)
(b)
(c)
(d)
(e)
(f)
从表可以看出6,召回和楼下都是1。的F1-score坐在为0.885,略低,其余也高于0.9。走最高F1-score 0.992的平均水平F1-score是0.952。
在图14,可以看出,楼下都是正确地识别,但61年并被错误地归类为常务会议,24楼上楼上误认为,21会议并被错误地归类为楼上。
5。讨论
在这项研究中,研究CapsNet申请哈尔和模型提出了基于修正胶囊网络称为m cn。为了说明模型的有效性,进行了数据收集使用IMU传感器和数据集。这项工作是在自然条件下进行,志愿者在自己舒适的方式在不同的地形条件下。是有些武断而不是收集在一个受控的实验室。最后,这个数据集模型取得了96.08%的准确率。m cn的有效性比较实验表明本文所提出的方法比美国有线电视新闻网CNN和识别效果。表7列出一些其他研究人员的识别方法和准确率。可以看到,这个结果是类似于其他引用。然而,这个精度是只有一个IMU传感器实现的。它不涉及不同类型的传感器数据的融合。
为了进一步验证m cn的有效性,实验也进行公共数据集WISDM和UCI-HAR。最后,在UCI-HAR WISDM精度是98.21%和95.28%。表8列出了其他研究的方法和结果WISDM。其中,CapsNet也申请了哈尔在引用(29日- - - - - -31日]。精度高于引用(29日,31日),但略低于文献[30.]。因为WISDM数据集是一个很不平衡的数据集,随机攻击算法在文献[30.处理数据集的不平衡问题,哪个更有利于训练网络模型。表8还表明,m cn模型提出了研究优于CNN, WISDM LSTM,他们的组合。
表9列出了其他研究的方法和结果UCI-HAR。可以看出m cn模型也实现了更高的精度比其他一些研究人员。总之,通过一系列的对比实验,验证,提出了m cn模型具有识别精度高、鲁棒性好。
6。结论
本文深入学习模型基于一个名为m cn提出的修改胶囊网络。相比,传统的机器学习方法,该模型的复杂的过程可以节省人工从原始IMU数据特征提取。与CNN和LSTM相比,该模型保留了空间信息的特性,这可能是更有利于活动的认可。对比实验已经进行了三个数据集来评估模型的有效性。收集的第一个数据集是自己,这是一个平衡在自然条件下收集的数据集使用单一IMU传感器。该模型的识别精度为96.08%,高于4.46%的CNN。此外,F1-score是0.960。第二个数据集是公共数据集WISDM命名,这是一个不平衡的数据集。该模型达到98.21%的精度和一个F1-score 0.978。这个精度高于最相似类型的模型。第三个数据集是公共数据集UCI-HAR命名,这是一个平衡的数据集。该模型达到95.28%的精度和一个F1-score 0.952。三个数据集上得到了满意的结果。通过t-SNE降维算法,提取的特征,每一层由m cn模型可视化。与其他研究者的结果进行比较,进一步说明提出m cn模型可以获得更高的识别准确性和检测能力有更好的活动。
该模型在实验过程中,取得了令人满意的表现,但在现实生活中没有测试。因此,在未来的工作中,模型参数的优化和重量轻将被认为在嵌入式设备检测的实际部署模型识别效果。
数据可用性
WISDM和UCI-HAR数据集的网站https://www.cis.fordham.edu/wisdm/dataset.php, https://archive.ics.uci.edu/ml/datasets/Human使用+ +活动+识别+智能手机。
同意
知情同意是获得所有受试者参与这项研究。
的利益冲突
作者宣称没有利益冲突。
确认
这项研究是由天津技术专家项目批准号22 ydtpjc00480。作者要感谢编辑和审稿人的宝贵评论这篇文章和志愿者参与了数据收集。