现代科学技术的进步极大地促进了体育科学的进步。先进的技术方法已经广泛应用于运动训练,不仅提高了科学训练水平也促进了体育科技的持续增长和竞争的结果。随着体育科学的发展和体育实践的逐步深化,科学的训练方法和监测方法的使用改善了运动训练和运动员的性能的影响。本文以冲刺为研究问题,构建基于机器学习的图像短跑运动员的行为识别。针对传统的缺点dual-stream卷积神经网络处理长期的视频信息,该time-segmented dual-stream网络,基于稀疏采样,用于更好地表达长期运动的特点。首先,连续视频帧数据分为多个部分,包含用户操作和短序列数据是由随机抽样的每段视频帧序列。其次,是应用于dual-stream网络特征提取。光流影像提取参与dual-stream网络使用Lucas-Kanade算法实现的系统。摘要系统已经在实际场景中测试,结果表明,该系统设计满足预期要求的短跑运动员。
科学合理的运动训练(
为了解决缓慢的信息反馈的问题和糟糕的体育视频分析系统的可操作性,本文以冲刺为研究问题,使用计算机作为工具,并采用文献和专家访谈考虑测量,软件工程建模的运动(
使用运动识别技术的方法来分析短跑运动员的技术动作在锻炼提高训练的质量逐渐吸引了人们的注意力。通过识别运动视频在训练过程中,可以抓住人们的运动状态,和计算机分析和识别是同时使用。更直观地反映得到的相关参数的标准化程度的运动员的训练动作,帮助教练和运动员技术动作进行分析,发现问题,从而提高运动员的质量培训。
本文中的系统采用客户机/服务器架构设计。客户端数据采集模块获取并显示实时视频并将其传输到服务器同步。服务器接收到数据后,它执行动作识别和反馈识别结果。客户端和服务器使用多线程技术进行数据同步。本文的主要贡献如下:
针对传统的缺点dual-stream卷积神经网络在处理长期的视频信息,该time-segmented dual-stream网络基于稀疏采样用于本文能更好地表达长期运动的特点。首先,连续视频帧数据分为多个部分,包含用户操作和短序列数据是由随机抽样的每段视频帧序列,然后应用于dual-stream网络特征提取。
本文使用Lucas-Kanade算法提取光流图像,因为它包含了目标的运动和时间信息,可以有效地代表像素的运动在连续帧图像的不同区域。
提出了各种各样的数据增强方法和网络pretraining策略来缓解网络训练过程中的过度拟合的风险。
分析的特征融合方法多个dual-stream网络,网络融合在卷积层采用三维卷积和池操作用于执行功能聚合操作,这样网络可以更有效地表达行为的时空特征。因此,它保证了较高的识别精度。
剩下的纸是组织如下。节
近年来,在运动领域的识别中,商业机构和科研院所取得了非常重要的结果。根据分类的数据采集方法,常用的动作识别方法可以分为基于可穿戴设备和视觉两种类型。在乒乓球等体育运动,因为它是一个球游戏由手臂运动,长期使用可穿戴设备运动监测和分析将不会有利于运动员的训练效果。因此,基于机器视觉的运动识别方法(
的重要来源之一,人类感知外部环境的视觉信息。人类行为识别涉及机器视觉等许多领域,特征选择和模式识别。这是一项具有挑战性的运动视觉分析先进的处理方法(
视频环境的背景因素的影响,往往很难避免一个更复杂的背景视频中。杂乱的背景因素会有不同程度的影响在这个问题上的行动。因此,它更难以识别和分析在这种情况下采取行动。此外,照明等因素变化的视频,是否有阻塞,视角也会影响的偏差的特性表现不同程度的行为。特征提取和分析的行为将变得更加复杂,导致最终的识别结果难以达到预期的精度。
数据和类之间的差异:不同的科目做同样的行为,仍有一定的姿势和规模的差异。因此,对于更复杂的操作,数据差异类动作识别的难度。为了有效改善行为动作识别的影响,有必要充分考虑数据变化和类之间的影响。
区别视频操作数据库和真正的视频数据:目前,为了方便有效的培训和效果验证的各种研究方法,大部分的研究是基于一些公共视频进行操作数据库。然而,相比之下,各种类型的视频数据收集在现实生活中,视频大小,质量,和其他方面是不同的,缺乏丰富的变化。
近年来,社区的研究已经投入很多热情探索解决上述问题。随着机器视觉技术的快速发展,识别和分析人类活动已经从一个开创性的人工方法表示基于深度学习方法的研究领域。它已经能够从数以百万计的视频和适用于几乎所有日常活动先进的解决方案。看视频的研发行为和动作识别算法(
此外,由于卷积神经网络(
在本部分中,首先,我们讨论系统设计部分
我们的系统的设计基于客户机/服务器(C / S)体系结构。客户端和服务器通过局域网连接,套接字是用来实现前后两端之间的数据通信。系统分配算法的数据计算和处理服务器来完成,和客户端主要是用来显示和控制的载体。这种设计方法可以降低客户的存储和计算能力的开销,有效地提高了系统的实时性能。此外,服务器multiclient共享算法的设计理念有助于系统集群设计的扩张。系统的总体结构如图
系统的总体结构。
在这个图中,客户端程序主要负责显示和操作视频数据的集合。实时视频流捕获的视频数据采集模块(如图
实时视频数据收集冲刺。
系统的详细工作流程如图
系统的详细工作流程。
在本部分中,首先,我们讨论了dual-stream卷积神经网络(CNN)其次是光流特征提取短跑运动员的动作视频数据。
近年来,大部分的研究工作一直受到dual-stream卷积神经网络相结合的时空信息从RGB图像和光学流图像中提取的视频和提取两种类型的功能通过两个单独的卷积神经网络。我们需要识别和生成最终的预测结果。视频信息包含两个部分:空间信息和时间信息。与静态图像相比,视频提供了额外的运动信息的时间序列分量表示时间动作识别。空间信息的视频每一帧图像的位置,代表了空间信息,如目标和现场视频;视频帧之间的时间信息是指改变并连续视频帧之间的目标运动信息,包括相机的运动或运动目标对象的信息,等等。实现视频的想法行动识别主要包括两类,即提取视频时空特性的方法对视频识别和再培训的方法通过使用人类骨骼节点信息作为网络输入数据。本文系统使用普通相机设备收集运动视频识别,所以dual-stream卷积神经网络主要用于提取视频时空特性进行动作识别和分析。
如图
Dual-stream卷积神经网络模型。
实际上dual-stream卷积神经网络利用dual-stream通路在人类大脑的视觉信息处理系统,它可以有效地捕获目标的局部运动信息的视频和改善的卷积神经网络解决行动识别问题的能力。然而,也有一些缺点。首先,因为操作的预测的平均预测采样获得的视频视频剪辑,中长期时间信息仍缺乏学习的特性。其次,由于训练数据样本是随机抽样得到的视频剪辑,可能有不正确的标签分配的问题对于每一个类别的数据。最后,使用dual-stream卷积神经网络需要预先计算的光学流图像并保存作为输入的一个网络。网络培训需要单独的单帧RGB图像和多帧叠加光学流图像,所以网络是难以实现端到端的培训。
光流代表了速度矢量对象的视频,包括瞬时运动方向和速度的像素信息。它可以用来代表视频的短跑运动员的运动信息。光流特征结合图像的静态信息和动态信息和性能是一个很好的特性来描述短跑运动员的行为。本节将详细描述光流特征提取算法的设计思想引入客户实时视频数据采集模块。在数据同步到服务器通过网络通信,光流图像提取为短跑运动员动作特征提取和数据处理过程。数据预处理由数据增强技术可以有效地避免过度拟合的风险在网络训练由于小小的行动数据集。
物体运动的本质是之间的相对位置运动对象和场景。当观察者观察移动物体时,现场的移动物体将形成一个不断变化的图像在眼睛的视网膜上,似乎通过眼睛的视网膜流;因此,它被称为光流。光流表示图像像素的瞬时速度场,包括位置、瞬时速度、方向,和其他的信息移动目标的某些像素的视频。光流法来提取前景目标的运动信息的视频,和运动前景可以独立监控没有预先知道场景的任何信息。光流计算主要是为了确定相同的像素的变化在两个相邻帧估计像素的时域变化在不同地区的两帧图像和像素之间的相关性。接下来,移动目标在一个图像的向量场是获得实现图像中对象的运动估计。
最著名的两个方法计算光流Hom-Schunck算法和Lucas-Kanade算法。Hom-Schunck算法是基于事实对象的灰度图像保持不变在很短的时间间隔,假设某个特定街区的速度矢量场的变化缓慢,和全球平滑约束的光流场。然而,由于该算法是基于平滑的假设,可能有大错误矢量光流估计在图像的边缘区域或闭塞地区的存在。Lucas-Kanade算法使用当地的平滑约束,即。,byassuming that all pixels in a small neighborhood have similar motions, and then realizes the estimation of optical flow. Compared with the previous algorithm, the Lucas–Kanade algorithm is simpler to implement and has lower computational complexity. Therefore, the system uses the Lucas–Kanade algorithm for the calculation and estimation of optical flow. The realization of this algorithm first needs to satisfy several assumptions:
外面有一个恒定的光强度,以避免外部光线的强度造成的变化图像中像素值相同的点。
相邻帧图像之间的时间足够短,这样像素帧之间的差别可以忽略在考虑运动变化。
移动目标的图像像素执行类似的运动在同一个小区。
假设像素点的亮度
根据假设目标对象的运动时间很短,上述方程可以Taylor-expanded获得以下方程:
忽略高阶项
根据Lucas-Kanade算法的假设,所有像素在一个小区域有类似的运动。基于基本的光流方程,可以获得一个超定的方程如下:
光流估计误差被定义为
光流计算公式可以通过最小二乘拟合的方法:
从这个的价值
本文使用一个time-segmented卷积神经网络基于稀疏采样策略。其结构如图
动作识别网络模型。
对于一个给定的操作视频帧数据,首先,把它分成
在本节中,我们讨论了实验环境之后,本研究中使用的数据集。此外,我们还讨论模型的训练过程,到目前为止我们已获得初步的模拟。
因为本文中的实验需要深神经网络训练,因此规模大,结构更加复杂,计算规模是巨大的。神经网络训练过程需要使用GPU加速计算。实验环境配置如表所示
实验的硬件平台和软件模拟环境。
| CPU | 英特尔®核心™i5 - 4200 m CPU @ 2.50 GHz |
|---|---|
| 内存 | 16.00 GB |
| 操作系统 | Centos 8.0 |
| 开发环境 | PyCharm 2020.2 |
| 编程语言 | Python 3.6.5 |
在我们的实验工作中,数据集是一个100米的短片的项目,共有5000个视频,每个视频操作持续大约2 - 10秒,分辨率是320
的学习网络参数是通过一个小批梯度下降算法,与批量大小设置为256和动量设置为0.9。梯度下降法在小批量可以加速矩阵和向量的计算和更新的方差参数可以减少获得更稳定的收敛性。使用一个批处理,每次可以减少迭代收敛,同时使收敛的结果更接近梯度下降的影响。对于传统的梯度下降算法,如果实际的目标函数平面部分凹表面,然后将使它指向一个负梯度陡的位置。这种情况在当地的目标函数的最优值将导致收敛速度慢。在这个时候,有必要给梯度势头,以便它能跳出局部最优,继续优化梯度下降的方向,这样网络模型可以更容易地收敛于全局最优。
使用的时间分割dual-stream网络在此系统中,设置空间流卷积神经网络的初始权重的初始重量1和1.5流卷积网络的时间。网络的学习速率训练设置较小:设置的初始值空间卷积神经网络流向0.01每2000迭代调整到十分之一;设置初始值的时间流卷积神经网络0.005;调整到十分之一后,12000年和18000年网络参数的迭代。此外,总耗时的数据训练如下:空间流媒体网络需要大约2小时和流媒体网络大约需要11个小时的时间。
空间的价值流动卷积神经网络设置为0.01和2000次迭代后调整到十分之一。接下来,我们设置的初始值时间流卷积神经网络0.005调整到十分之一,12000年和18000年网络参数的迭代。此外,总耗时的数据训练如下:空间流媒体网络需要大约2小时和流媒体网络大约需要11个小时的时间。
在图
动作识别网络模型。
实验结果。
| 类型 | Spatial-stream网络(%) | 时间流网络(%) | 双河(%) |
|---|---|---|---|
| 经典 | 72.6 | 73.5 | 85.6 |
| 空间流 | 75.2 | 81.6 | 88.7 |
| 交叉模式 | 77.1 | 82.6 | 92.6 |
数据
在不同的帧识别结果。
不同的输入决议对模型性能的影响。
本文以冲刺的形象为研究对象,构造基于机器学习短跑的动作识别。然后,针对传统的缺点dual-stream卷积神经网络处理长期的视频信息,该time-segmented dual-stream网络使用基于稀疏采样,可以更好地表达长期运动的特点。首先,连续视频帧数据分为多个部分,包含用户操作和短序列数据是由随机抽样的每段视频帧序列,然后将其应用于dual-stream网络特征提取。光流影像提取参与dual-stream网络使用Lucas-Kanade算法实现。光流包含目标的移动信息,可以有效地代表像素的运动在连续帧图像的不同区域。由于少量的操作视频数据(测试数据),本文采用大量数据增强方法在数据处理和网络pretraining策略缓解网络训练过程中的过度拟合的风险。摘要系统已经在实际场景中测试,结果表明,该系统设计符合预期的要求。
使用的数据来支持本研究的结果包括在本文中。
作者宣称没有利益冲突。
这项工作是由江西科技大学哲学社会科学繁荣计划培养项目”研究山地体育城的建设江西省”(批准号FZ18-YB-18)。