文摘

随着多媒体技术的发展,计算机辅助系统已经成为日常的田径训练的有效手段。本文设计一种数据采集和分析系统,田径运动员。系统采用传感器模块连接到运动员的身体收集运动数据进行分析。整个系统由边缘计算架构实现。为了减少平均响应时间,DDPG算法来优化资源配置的边缘层。实验结果表明,该算法的响应时间可以控制在1 s。同时,边缘服务器上的支持向量机算法分类数据,安排和整体识别精度超过90%。

1。介绍

田径运动是一个很大的范畴,其中包括各种各样的子事件,比如竞走、跑,掷标枪。运动员需要花很多的时间和精力发展技能和促进耐力。英国研究机构进行了一项调查100多名精英运动员的训练时间。结果表明,为了准备2012年奥运会在伦敦,他们每天训练6小时,每周6天,12个月平均每年,甚至一些运动员居然花了10000小时在4年里,平均每年消耗110万卡路里。田径运动员的科学训练方法提高他们的竞争力水平是至关重要的。教练的个人经验和教学技能培训过程中发挥至关重要的作用。然而,随着信息技术的发展,运动员训练可以有效地通过利用大数据和软件分析1]。

有研究田径运动辅助训练系统。Cucco [2)开发了一个系统的评估和提高运动员的性能特征,如速度、敏捷性和速度。他们利用智能传感器检测运动员的相对位置与培养目标和显示结果。马等。3)开发了一种C / S模式在运动员训练过程监控系统,基于人工智能的移动技术。这个系统使用GPS提供的运动员和获取实时位置信息实时指导。郭(4)设计了一个虚拟现实系统训练运动员掌握self-balance通过检测脚压力数据。作者设计了整个系统的虚拟现实游戏刺激运动训练的热情。

受上述相关工作,基于边缘的数据采集和分析系统计算和强化学习田径训练是本文设计了。可穿戴传感模块的系统是用来收集活动数据或物理的运动员和使用数据进行进一步分析。考虑到这些设备的电池寿命和内存资源是有限的,移动边缘计算体系结构(MEC)介绍,适合解决我们面临的问题的场景。作为一个云计算的辅助技术,MEC可以弥补的缺点云计算和有效地解决大规模数据的压力带来的物联网。在很多应用场景MEC起着重要的作用。例如,毛等。5]研究了移动设备的功耗之间的权衡和计算任务在一个多用户MEC的执行延迟系统。他们提出了一个基于李雅普诺夫的在线算法优化确定本地执行计算或卸载边缘节点。李等人。6)关注QOE-optimized边缘计算环境下视频交付;他们提出了一个包含整数线性规划算法(独立)公式来解决这个问题。王等人。7)使用边缘处理社交网络数据计算结构。同时,为了优化部署策略和经济效益最大化,他们设计了一个混合优化模型项目,以减少计算成本。

边缘计算是一个扩展云计算的概念。它的主要目的是减少用户和计算处理节点之间的通信传输成本。然而,当用户数量的增加,计算来自多个用户的请求可能超过服务器的能力,导致网络拥塞。此外,边缘服务器的性能总是波动和变化的影响下任务请求负载的实时变化,电源、网络环境,确保任务执行的性能带来挑战。这种情况可以抽象地描述为一个分布式资源优化问题,并强化学习是一个典型的解决这个问题。2015年,谷歌DeepMind自然界中发表了一篇论文(8],它提出了一个模型,结合强化学习(RL)和深度学习(DL),名叫深强化学习(DRL)。其突出表现在游戏AI领域很快使DRL的一个新的研究焦点。因为有各种各样的任务在边计算,如何计算请求转移到适当的服务器,以最小化的成本是一个主要的优化问题。使用简单的模型来解决这个问题是相对低效。RL算法可用于边缘计算环境下优化资源配置,为用户提供更高效的服务。

这项工作的贡献总结如下:(1)数据收集和分析系统,为田径运动是设计(2)深决定性策略梯度(DDPG)算法用于减少服务响应时间通过计算边缘结构

剩下的纸是组织如下:在部分2介绍,更多的相关工作,包括信息计算结构和边缘DDPG算法。部分3描述了系统的主要结构。节4的实验结果报告系统的关键性能指标,和部分5给出了本文的结论。

2.1。基于可穿戴田径辅助训练系统

随着信息技术的发展,利用多媒体帮助运动员在训练中。甚至游戏的实时战术分析系统情况已经众所周知。投掷项目训练计算机辅助系统已经出现在美国1970年代初以来。该系统利用摄像机来记录运动员的技术动作;然后分析了记录得到的角数据当投掷运动员的手。最后,它与标准数据相比提高投掷项目的技术动作。MEMS的日益成熟,有更多的体育援助系统选择收集运动员活动数据和其他相关信息通过可穿戴设备。托马斯et al。9)开发了一个游泳培训监控系统,多个感应器被放置在人体的关键职位,和半马尔科夫模型(多发性骨髓瘤)是用于系统准确地细分和标签与高精度游泳活动。Valkova et al。10]问75智力障碍的运动员穿GT3X活动记录器,记录他们的活动数据在比赛前两天,得出的结论是,当地特殊的奥运项目是有利于人们精神残疾。李和德雷克(11)采访运动员20余人,他们把体育训练和性能与个人相关数据的收集和评估,以更好地了解自己的能力,和研究还探讨了个人关系,技术运动员和他们的数据。Wachowicz和Mrozek12]对齐智能可穿戴设备收集的活动数据和气象数据探索的影响天气对运动员的现场性能和模糊加入技术用于这项工作。一个句子中,随着智能设备的继续发展,随着越来越多的功能集成到这样的辅助系统,该系统将因此变得不堪重负。

2.2。边缘计算

边缘计算是分布式计算的一种形式,主要处理和数据存储是放置在网络的边缘节点。边缘节点提供服务的原则与快速响应请求的智能设备,以满足基本需求实时业务、安全、隐私保护等。计算层的顶部边缘的物理实体。MEC结构,大量的小型专用服务器部署在网络的边缘靠近移动用户。用户可以将边缘云计算密集型任务有效地接近他们,他们自己的移动终端上运行应用程序。一个常见的MEC架构如图1,主要由3层。底层由物联网节点,包括各种各样的智能设备和传感节点进行数据收集,包括运动数据,体征数据,和环境状态数据,监控对象。简单处理原始数据可能在该层进行;否则,数据缓存和直接转移到边缘计算层进行进一步的数据分析。计算边缘层接收数据和流程简单的任务和反馈结果到智能设备显示给用户,而一些复杂的任务被上传到云计算层。

边缘计算一直是近年来在各领域的应用。例如,烹调的菜肴等。13)开发了一个辅助系统与智能药品箱,叫做备忘录箱系统,以帮助治疗抑郁症。整个工作由边缘计算架构实现,提高了系统的实时性能。刘等人。14)改进的算法巡逻机器人系统和部署在边缘计算体系结构,大大缩短了系统信息传输的延迟。5 g网络的逐渐普及,边缘服务器面临更大的负载,以及如何正确地优化资源配置将成为一个新的研究热点。

2.3。强化学习

强化学习是机器学习的一个分支方法,及其最重要的特性是“学习互动。“代理不断学习知识后根据他们获得的奖励或惩罚与环境的相互作用。RL范式以来的学习非常类似于人类如何学习知识,RL被视为一个重要的方式来达到普遍的人工智能。结合RL和DL,深问网络(DQN)取得了惊人的成就游戏人工智能领域的机器人。例如,Yoon和金15]DQN算法应用于视觉的战斗游戏,游戏AI的训练,他们在比赛中取得好成绩。实验结果显示的潜力DQN双人的即时战斗游戏的方法。沈和Kurshan16)提出了一个增强的阈值选择策略对欺诈警报系统通过应用DQN欺诈检测系统的算法。这种方法不仅减少了欺诈造成的损失,而且还提高了预警系统的运营效率。此外,DRL也可以扮演一个角色在组合优化问题,如资源分配和任务调度。例如,吴et al。17)提出了一个基于DQN混合学习策略的多用户多服务器MEC网络。仿真结果表明,该混合方法达到更低的成本比其他类似的组织。Yihang et al。18)设计了优先记忆深Q-Network (PM-DQN);该算法应用于解决认知无线电的联合路由和资源分配问题特设网络传输延迟和功耗最小化。马(19)构建应用程序布局优化策略命名min-cost解决布局问题的智能公共交通应用程序有效。根据仿真结果,提出的策略可以有效降低项目的总服务成本的基础上保证服务延迟。

3所示。方法

3.1。总体结构

这项工作是设计数据采集和分析系统的田径运动员。本文实现了整个系统使用边缘计算整个系统的架构和优化资源配置使用DRL算法,DDPG。整个系统架构如图2

根据图2主要的操作系统可以大致分为以下步骤:(1)数据采集:从运动员收集各种数据,包括加速度、角速度,通过传感器模块和心率的运动员。上的数据缓存在传感模块和准备转发到上边缘节点。(2)请求提交:传感模块传输数据和请求信息边缘节点根据预设策略。(3)请求转发:转发后续任务的节点到其他节点处理后的任务请求的一部分。在这一步中,节点可能会发现自己已经不堪重负,并将请求均匀的节点D进行处理。(4)任务执行:边缘节点计算任务并生成最终结果信息。(5)结果反馈:边缘节点发回结果到智能设备,负责数据分析结果显示给用户。

根据上面的步骤提出了,边缘服务器的压力主要是来自多个用户的请求。太多的请求在一段时间内可能会导致交通拥堵边缘节点。因此,如何优化资源配置的整个边缘层至关重要。

3.2。数据收集和分析

本节介绍了运动员的细节的活动数据收集和分析,微处理器9250模块集成到传感节点如图3

模块的加速度范围±2 g,±4 g,±8 g,和±16 g,陀螺仪范围±250±500±1000±2000 / s,磁强计高达±4800 UT。根据先前的实验,该节点可以用于2周左右如果是间歇性使用,如果连续使用24小时。节点可以通过usb接口进行开发。

节点的采样频率预置50赫兹。运动员穿5 - 10的这些模块数据收集放在腿和手腕等身体部位。同时,传感器记录心率和EMG信号使用。所有数据通过蓝牙发送到网关节点,然后转发到边缘计算层。

为了减少能源消耗的传感设备,所有进一步的数据处理进行计算边缘层。不同类型的任务都有自己的处理方法。在这里,本文以活动分析基于惯性传感数据作为一个例子。计算节点同步数据的时间戳和边缘部分使用滑动窗口算法的数据。需要的数据特征提取,形成特征向量集,以减少输入的维数。在这篇文章中,常用的特征提取,包括均值和方差,以及他们的计算公式可以在表1

计算特征向量集后,pretrained机器学习模型部署活动分析,如识别当前活动的范畴。这里,本文选择使用支持向量机(SVM)算法来识别活动,最后输出活动属于的标签。整个过程总结如图4。虚线内的地区都是由边缘节点处理。

3.3。DDPG-Based动态部署算法

整个系统的稳定运行取决于合理的系统资源分配。提出了一种基于DDPG动态资源部署算法。

3.3.1。问题的映射

动态资源部署的问题是调整边缘的部署策略服务资源分配给服务请求的负载在不同的时间或在不同的服务器上。这个问题用一个例子如图5

任务负载在不同时间点的A和B两个边缘节点图所示5。左边的数字指的是不同类型的服务请求。较暗的颜色,服务请求。例如,有许多服务4节点请求的时间T,但有许多请求节点B在同一时间。一个适当的分配策略应该传播未来请求服务4节点B节点的负载,从而降低B和确保整个边缘网络的服务质量。

在这里,假设场景边缘服务器的数量N和服务请求类型的数量。在连续的时间内,根据移动用户的所有服务请求记录边缘服务器,动态服务的部署策略σ获得,即矩阵xN×计算出每一段时间,见公式(1),每个元素pijX代表服务资源部署服务的比例年代j在边缘服务器节点上

基于x,整个服务层通过一定的政策调整服务部署;然后y所示的定义是 Y代表了一种特定的服务分配调整的服务。例如, 是转发的请求的数量th节点的j节点。系统部署策略的功能σ是建立之间的关系xy;也就是说,当系统状态x的概率,采取行动y

也就是说,σ代表的条件概率分布系统执行y操作x状态。与此同时,变量r定义评估系统行为,所示 在哪里ct是边缘层的平均响应时间。当ct≤0意味着时采用的策略t可以缩短响应时间,然后呢r是正的。否则,r是负的。的最终目标r是最小化平均服务响应时间。

为了简化模型,提出了以下假设:(1)没有交互或服务之间的依赖关系(2)在网络传输中,请求消息和响应消息的长度大约是相同的(3)单位传感模块和边缘节点之间的传输延迟是固定的,所以边缘节点之间的延迟和其他边缘节点

3.3.2。算法描述

RL方法主要有两个分支,即基于策略的方法和价值的方法。DDPG算法相结合的两个分支,它们的优点。

如图6DDPG算法主要由环境、经验回放记忆单元,演员网络模块和评论家网络模块。环境的交互空间代理。在交互期间,代理取得样品并将它们存储在的交互经验回放记忆单位培训网络。为了优化学习过程,DDPG算法需要DQN算法的概念和构建的人工神经网络具有相同结构的网络,即在线和目标。在线网络用于培训和更新网络参数,而目标网络使用周期软更新策略遵循在线网络和协助在线网络培训。最终目标是优化部署策略σ在前一节中讨论。

根据图中所示的过程6描述,整个算法步骤如下:系统开始运行并进行初始化。演员和评论家的网络参数初始化,和在线网络参数复制到目标网络,也就是说, 设置大小回放记忆的经验U和minibatch观测数据的大小V对于每一个时期,我们有以下:根据策略σ和当前系统状态 ,选择一个行动 并指导系统执行的行动。在这里, , 随机噪声。系统执行 和获得的奖励价值 通过计算,然后进入了一个新的资源配置状态 一个状态转换的数据集的大小V是随机抽样从经验回放记忆作为一款在线训练数据集政策网络和在线网络。集合中的每个元素表示为 ,+ 1≤V在线计算的梯度网络,这是表示为 类似于监督学习方法,均方误差(MSE)来计算损失。公式如下: 在哪里是国家行动的价值函数,其表达式 在哪里c代表执行行动的成本y当系统状态x 的概率是系统变得 后的行动yV贝尔曼最优状态值函数获得的优化方程,这个公式是什么 最后,基于该标准的反向传播方法, 是获得。更新的值 通过优化器和评论家网络。政策网络的梯度计算,表示为 这个公式是 更新的值 和演员通过优化网络。软更新目标政策网络和目标网络;也就是说, 在哪里 是一个很小的值,这有利于在更新目标网络的稳定性。

4所示。实验和结果

4.1。介绍实验数据

本文计划测试资源部署算法的有效性和测试系统的分析能力通过运动员的活动数据的识别结果。首先,数据从40田径运动员在不同的事件收集,包括短跑、竞走、掷标枪,撑杆跳,跳高,跳远。数据收集3分钟从每个运动员,和获得的数据集作为训练数据分类器。培训后,支持向量机分类器部署在边缘节点等待处理的任务请求。表2支持向量机的参数配置。

然后,三个培训现场周围的边缘服务器部署到处理服务请求。服务器配置如表所示3

最后,DDPG边缘服务器部署算法,以及算法的参数设置如表所示4

同时,我们建立了两个对照组与DDPG-based算法进行比较。一个是average-based部署算法,我们的想法是,为每个服务,资源在服务器上部署的比例是相同的。另一种是frequency-based算法,根据历史服务请求分配资源。

4.2。DDPG-Based动态部署算法的性能
4.2.1。准备算法收敛性

本实验主要测试算法的收敛性。我们添加一个隐藏层与演员128个神经元网络和评论家DDPG网络算法。图7显示功能丧失的趋势在10000集的训练。

根据图7,损失价值网络的波动很大程度上在第一个几百集。随着网络训练集的数量增加,损失值逐渐降低。基本上达到5000集后,损失值收敛于(0,1),和波动就变小了。它表明,算法的收敛性基于DDPG提出了可以保证。

4.2.2。算法的比较实验

为了比较资源分配算法,我们几天收集用户请求数据,并使用上述三种算法在边缘节点上进行资源分配。

Average-based方法不考虑历史服务请求信息,所以它直接设置边缘服务器服务的资源比例是相同的。Frequency-based方法确定当前资源配置基于前期的配置。DDPG-based方法分配资源基于预设的网络参数。这三种算法进行了同样的测试集,和服务器的平均响应时间记录,如图8

结果在图8表明DDPG算法的平均响应时间是最低的,可以控制在1 s。此外,在整个观测期间用户请求是相对稳定的。相对,有更多的请求和响应时间是相对较高的只在8:00-11:00在早上和13:00-15:下午00。最后,DDPG算法可以实现更好的部署策略通过学习和探索。它表现良好在田径场景在我们的工作。

4.3。支持向量机的性能

为了测试系统对经济活动分析的能力,收集到的数据识别的分类算法在边缘节点部署。除了支持向量机算法,我们还将介绍另外两个分类器:决策树(DT)和k最近的邻居(资讯)算法。他们经常用于模式识别的工作原理类似,这是典型的机器学习分类器。我们把分类结果混淆矩阵张挂9

在图9,A01-A06代表6种活动:短跑,竞走,掷标枪,撑杆跳,跳高,跳远。较暗的颜色块矩阵的对角线上,活动的识别精度越高。SVM对所有类别的识别准确率达到88%以上,高于DT和资讯。A01资讯的准确性是略高于SVM。考虑到整体识别的准确性,SVM(93.5%)比DT(82.3%)和资讯(86.0%)。最好是使用支持向量机来完成数据分析任务在我们的场景中。

5。结论

本文使用边缘计算技术来实现数据采集和分析系统的田径运动员。优化资源配置,降低响应延迟,本文介绍了DDPG算法实现动态资源分配算法。对照组与其他算法相比,该算法有较低的平均响应时间,在1 s下的测试环境。与此同时,支持向量机算法的边缘服务器部署在活动分析。然而,这项工作是讨论的类型的活动相对较小。因此,活动将在未来的工作扩展集。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。