文摘gydF4y2Ba

人工智能识别人类的行为被用于各个领域。本文基于深度学习和改进动态时间正则化算法研究足球动作姿势。提出了一种分层的复发性网络对于理解团队体育活动在形象和位置序列。层次模型,本文将提出时间序列上的多个以人为中心的特性基于LSTM输出。为了实现这个计划,介绍了举办国家作为外部LSTM可控的州之一,和分层LSTM扩展到包括集成机制。测试结果证明适当的推荐框架,其中包括进步LSTM以人为本的好处。在这项研究中,参考模型的改进的双柳LSTM-based显示方法。具体来说,通过结合以人为本的特性和元信息(例如,位置数据)到postfusion框架提出了本文,本文还证明了行动类别增加了,和观察增强鲁棒性的波动足球运动员的数量。实验数据显示,67.89%的足球运动员的姿势这个算法可以被改进的动态时间规整算法。gydF4y2Ba

1。介绍gydF4y2Ba

21世纪之初,人工智能是不断被使用在各个领域,计算机视觉也是它的一个重要组成部分。它可以帮助和捕获相关的视频序列。人类行为识别是当前研究热潮的算法,它可以广泛应用于生活的很多领域,如视频监控、娱乐、人机交互、视频搜索画像。结合深度学习和识别人类的手势现在是一个重要的切入点。gydF4y2Ba

针对当前视频监控和判断在足球比赛中,它只呆在人工判断。本文法官和分析足球行动基于深度学习和改进的动态时间规整算法。虽然目前人工准确率相对较高,人工判断和精力毕竟是有限的。是不可能观察到整个足球场上的每一个动作细节,更不用说,人们会经历心理和视觉疲劳。与电脑和监控设备的连续操作,算法可以用来做出合理的分析和判断行动的足球视频中,这大大减少了体力消耗。gydF4y2Ba

近年来,深度学习大型科技公司一直在快速发展,已成为一个热点话题的研究。Trabelsi等人提出一种新颖的手静脉人体识别的模式识别方法。手静脉特征可以被认为比其他生物识别技术更可靠的生物识别技术领域(如掌纹、指纹)自静脉位于体积,使功能更耐用测试环境。提取手静脉模式,这项工作提出了一种旋转不变纹理描述符被称为圆不同方向和统计模式(CDSDP)。它的直方图可能被认为是一个属性向量。统计方向的船CDSDP中包含的信息,这是一个加权循环的差异(gydF4y2Ba1gydF4y2Ba]。陆等人在目前的有效性普遍群变换移动构建移动美国有线电视新闻网cnn和提供了一些原则。这项研究提供了完全与卷积神经网络(CNN基于这些规则(FSC-Nets)) (gydF4y2Ba2gydF4y2Ba]。J.D. Freitas获得信息和详细的见解从所有这些定制的医学信息来源是一个大问题,然后下一个医疗部署。深度学习指的是神经网络的一种机器学习技术,允许成功的建模,表示,学习从高度复杂和多样化的数据集gydF4y2Ba3gydF4y2Ba]。gydF4y2Ba

本文的创新在于,(1)通过研究深度基本神经网络在人类行为识别中,并进一步具体的判断足球运动和姿势的收集模板视频,深度学习的基础上,进行相关研究和识别操作。(2)在理论思考,上述模拟证实了分析和判断的行为和行动识别通过深入学习。(3)视频的时间序列模板结合卷积神经网络实现足球的不同角度的分析和判断的行为。并通过人类骨骼动态时间正规化的识别方法,通过比较单个行动之间的相似性序列和一个模板,它可以确定人的复杂行为踢足球。gydF4y2Ba

2。分析足球动作识别方法gydF4y2Ba

2.1。极端的学习机器模型gydF4y2Ba

假设{gydF4y2Ba ,gydF4y2BatgydF4y2Ba我gydF4y2Ba},gydF4y2Ba ,gydF4y2Ba 是知识聚集在训练集,gydF4y2Ba 生成样本的总数,gydF4y2BaxgydF4y2Ba我gydF4y2Ba∈gydF4y2BaRgydF4y2BadgydF4y2Ba的确是恢复浓度和属性,这是密集的轨迹特性,而指的是复制样本的数量。gydF4y2BatgydF4y2Ba我gydF4y2Ba∈gydF4y2BaRgydF4y2BadgydF4y2Ba是实际的行动集合类,根据深度学习特点的运动信息,在哪里gydF4y2Ba 是类的总量计算训练集。当一个隐藏层的激活函数是定义在哪里gydF4y2BaggydF4y2Ba(gydF4y2Ba ),gydF4y2Ba然后隐藏层神经元通常有l。gydF4y2Ba

是输出向量相关中心的封闭的障碍,当HIJ真正的输出呢gydF4y2Ba 约束层组件,而习近平表示限制层节点方程gydF4y2Ba 。gydF4y2Ba

下面的公式可以用来解决公式gydF4y2Ba(1)gydF4y2Ba,根据图书馆(gydF4y2Ba4gydF4y2Ba]。gydF4y2Ba

似乎是全面反转状态矩阵的表达式。最初的学习机器的想法是应付简单的缺陷不透水元素的反馈神经网络,但是后来,大量的与工作相关的个人扩张过度的想法没有神经网络学习问题,确认的极限。学习机器的相关要求不太严格的矢量和最小二乘机制(gydF4y2Ba5gydF4y2Ba),与无监督算法一样。过度拟合意味着模型的预测是非常准确的训练数据,预测是对未知的数据非常贫穷。过度拟合主要是由于训练数据中的异常点,这明显偏离正常位置。多个小卷积核是用来代替大的卷积核,和nxn卷积内核分为1 xn和资料片卷积核。这种方法可以减少参数,加快操作,减少过度拟合的现象。gydF4y2Ba

极端的学习机器的基本开发解决问题是用下面的公式。gydF4y2Ba

的约束gydF4y2Ba

在方程中gydF4y2Ba 是正则化变量,gydF4y2Ba 是类似行动收集的偏差矩阵的实例习吗gydF4y2Ba 输出层。遇到的优化问题可以使用Kadoyili翻译成以下方程的条件(gydF4y2Ba6gydF4y2Ba]。gydF4y2Ba 似然比矩阵是用在哪里gydF4y2Ba 。gydF4y2Ba输出数据的质量是使用下面的公式计算。gydF4y2Ba

结果,极端的学习机器的输出功能可能被描述为下面的公式。gydF4y2Ba

确实,因为学习算法技术和支持向量原理已经如此相似,你可以如上所示资讯转换成一个无监督算法,然后限制在何种情况下可以工作。的条件限制输出可能转化为连续性的公式使用Merece定理。gydF4y2Ba

公式的应用程序可能分类和量化显卡后转发简化处理。gydF4y2Ba

深度学习支持大量的数据和计算相当多数的困难。优化神经网络训练的影响,大量的迭代和数以百万计的参数需要调整为每一个培训过程。的Amax xg - 48201 g网络引擎是选为机器学习这门学科,因为它必须分析软件平台的大量信息,构建和测试多层感知器。Amax xg - 48201 g网络引擎可以支持多达8 GPU卡,提供强大的性能与100 CPU服务器节点,铺平了道路在癌症研究中最复杂的应用研究,气候模型建筑,能源、人工智能、等等。表gydF4y2Ba1gydF4y2Ba描述了平台的具体配置:gydF4y2Ba

2.2。动态时间扭曲gydF4y2Ba

操作研究的一个重要组成部分,动态规划(DP)是一种数学计算方法来找到最优解,达到优化的目的。动态规划算法与分治法的方法。它的基本思想是要解决的问题分解成几个子问题。首先求解子问题,然后得到原问题的解从这些子问题的解决方案。在1950年代,美国著名物理学家发现了举世闻名的优化方法(最优原则PO)在分析最优解的优化问题(多步决策过程,MDP)。计算密集型和复杂的问题分成许多小的分支。这些分支比最初的问题一定要简单得多,因此解决问题和最优solution-dynamic编程。因此,动态时间扭曲是一种思考方式优化问题,相对应的输出标准模板和相关功能。分析获得的规划功能,当两个变量进行了比较。最初的创始人AKOE动态时间规整算法。 He proposed it in the 1980s to solve the problem of people’s classification of time in a large number of sequences in the process of language recognition. Algorithm concept: The basis of measuring similarity is to use a dynamic program to calculate the distance between time series of different lengths and to solve the problem that the Euclidean distance cannot calculate due to different lengths. Similar with traditional time series, Sakoe provides various route optimization schemes and distance calculation strategies. Dynamic time planning is mainly used to match text data. Speech processing and image shape recognition are given two time series 和gydF4y2Ba 的长度和距离矩阵gydF4y2Ba 他们之间gydF4y2Ba

曲线的曲线和路线被指定为路线gydF4y2Ba 被描述为一个不间断的矩阵集合元素之间不同的连接在不同长度的时间序列分析数据系列吗gydF4y2Ba 。gydF4y2Ba

满足下列条件的弯曲的路径:gydF4y2Ba(1)gydF4y2Ba有界的gydF4y2Ba (2)gydF4y2Ba定义边界gydF4y2Ba (3)gydF4y2Ba连续性gydF4y2Ba (4)gydF4y2Ba单调性gydF4y2Ba

禁止出现在同一时期。gydF4y2Ba

确定最佳路径的增量计算使用以下规范。gydF4y2Ba

2.3。光流法gydF4y2Ba

当人眼观察到的运动目标在三维世界。持续热门的移动目标的形状创建一组视网膜上不断变化的图像。这些常数的变化通过人类的视网膜。类似光流的类型,它是相同的,所以它被称为光流的目标探测。光流是指灰度模式的运动表面的图片。对象上的飞机,这是真正的双四维矢量场的翻译目标车辆。运动检测不仅提供其流动性小对象的细节表达视频的位置变化和趋势。它也显示了运动目标的运动趋势,这样可能会决定。光通量可能被认为是创造的速度流场的流动灰色像素在图像平面,鉴于现在的视觉环境是不间断和时空的通航。设置曝光的主要目的(gydF4y2Ba ,gydF4y2Ba )gydF4y2Ba在这幅画gydF4y2Ba (gydF4y2Ba ,gydF4y2Ba ,gydF4y2Ba )gydF4y2Ba因为协调分散的形象gydF4y2Ba (gydF4y2Ba ,gydF4y2Ba )gydF4y2Ba和gydF4y2Ba (gydF4y2Ba ,gydF4y2Ba )gydF4y2Ba可能被视为网站(gydF4y2Ba ,gydF4y2Ba )gydF4y2Ba一旦在解构主义运动参数gydF4y2BaxgydF4y2Ba和gydF4y2Ba 轴是分解。的位置(gydF4y2Ba ,gydF4y2Ba )gydF4y2Ba这里转移到照片位置(gydF4y2Ba )gydF4y2Ba在很短的时间微分dt,gydF4y2Ba ,gydF4y2Ba ,gydF4y2Ba基于光度相等的概念,这似乎是,每一帧内相邻点以及特别需要曲线具有相同的灰度值。这幅图描述了光流体速度和空间之间的联系灰色单色的图像。因此,gydF4y2Ba 和gydF4y2Ba 是图像中未知特性约束方程。所以只有一个约束方程,排放强度不能以独特的方式计算。建立gydF4y2Ba 和gydF4y2Ba ,gydF4y2Ba必须应用进一步限制。新技术确定光输出时将会出现不同的局限性。微分图像特征技术,通常称为散度的方法,是最广为人知。获得目的地的路径从图像中每个像素,其中大部分依靠灰度梯度值的范围。Horn-Schunck代码(gydF4y2Ba7gydF4y2Ba)和Lucas-Kanada算法(gydF4y2Ba8gydF4y2Ba)是基于两个最普遍的梯度光流算法。限制Horn-Schunck算法是基于这样一个前提:也许与整个流程,规范限制是在恒定强度的情况下实现的。认为光通量的变化在整个画面是常规,即。,移动目标的运动向量是正常的。因为邻近像素相同的速度变化,这种方法决定了浓密的光通量。因此,当地的空间速度变化率为零。角提出的应力状态的基本思想是,应尽可能光滑光通量减少平滑限制约束。Lucas-Kanada代码是研究在1980年代早期。算法有一个非常重要的和固定的条件是保持收集运动向量不变在一个狭小的空间里(gydF4y2Ba9gydF4y2Ba,gydF4y2Ba10gydF4y2Ba),然后,所有由此产生的向量加权最小二乘法。L-K算法假设的一致性像素运动在一定地区取代了平滑的速度。稀疏等浮电缆领域需要限制在三个假设:gydF4y2Ba(1)gydF4y2Ba移动目标的外观图像之间的像素在恒定的亮度保持不变。对于灰度图像,它假定像素亮度在跟踪期间保持不变gydF4y2Ba(2)gydF4y2Ba时间持续的运动图像相比时间非常缓慢。在实际使用中,这意味着时间的比例相对于图像中的运动是足够小。和目标相邻帧之间的运动是相对较小gydF4y2Ba(3)gydF4y2Ba区域一致性相邻点的运动在同一表面在同一场景是相似的,和这些点在图像上的投影也在邻近区域。路的光流的方法,另一方面,需要使用比边缘。确认向量逆转的n次方gydF4y2Ba n窗口上面也保证图像序列极限公式有一个解决方案。结果,路光通量计算技术必须结合边界角和实时数据,以产生一个稀疏光传播向量(gydF4y2Ba11gydF4y2Ba,gydF4y2Ba12gydF4y2Ba]。gydF4y2Ba

3所示。实验数据收集gydF4y2Ba

3.1。两层核心极端的学习机器gydF4y2Ba

本文将极端放射性教学引擎项目划分为两个主要类别。第一层,如图gydF4y2Ba1gydF4y2Ba,结合深度学习函数与手册的核心功能的核心。特征的估计价值核心3是第一层的结果。分类器训练在第二层。预测分数被映射到最终运行的所有类别。gydF4y2Ba(1)gydF4y2Ba融合的核心特征gydF4y2Ba

主要属性的不同组合可以结合不同的视频的属性维度。因此,本文结合了手动的核心功能和深度学习的核心功能,并使用L2通用计算线性内核。L2正规化所有权的平方和的体重增加gydF4y2Ba 参数,迫使所有gydF4y2Ba 尽可能接近零,但不为零。每个拟合点的正则化函数需要考虑,因为有一个大的波动在最后的正则化函数的拟合点。线性内核所需的线性模型。多项式内核是相似的,但是定义的边界是任意的顺序。通过确定特征提供核心矩阵的整体平均水平。计算图像对的核心。功能核心合并后,三个轴有:深度学习功能的核心。然后手动功能轴使用内核限制机计算的预期执行数内核函数。(gydF4y2Ba13gydF4y2Ba,gydF4y2Ba14gydF4y2Ba]gydF4y2Ba(2)gydF4y2Ba深度学习依赖加速器的特点gydF4y2Ba

认识到人类活动,这项研究提供了一个视觉运动数据的描述。它强调了运动的意义在不同时间的数据域。提高视频材料的低频行动歧视。图gydF4y2Ba2gydF4y2Ba说明了这个模块的总体设计。gydF4y2Ba(3)gydF4y2Ba运动方案表示运动识别gydF4y2Ba

同步模型可以恢复整个运动序列图像的。因此,时间模型是本文中所使用的物理变化。时间框架设计通过计算电影的分级频率测量。和使用视频图像之间的差异来计算图像之间的运动数据。这个图中可以看到gydF4y2Ba3gydF4y2Ba计算视觉运动能量(美),然后呢gydF4y2BaμgydF4y2Ba2计算视觉形象的历史(MHI)。梅所有加速度计在时频域分配相同的重量gydF4y2BaμgydF4y2Ba1只是保持联系,gydF4y2BaμgydF4y2Ba2只是一个非线性累积函数。因此,三菱重工插入视频的末期最重要的一个部分。gydF4y2BaμgydF4y2Ba3似乎是最不重要的最后一个视频,因为这是一个直接迭代函数。gydF4y2BaμgydF4y2Ba4分配优先级最高的序列,将视频在时间域的中心。最终,程序gydF4y2BaμgydF4y2Ba2,gydF4y2BaμgydF4y2Ba3,gydF4y2BaμgydF4y2Ba4关注时间域的开始,结束,和中部地区,因此。gydF4y2Ba

3.2。人体运动信息获取gydF4y2Ba

评估如何识别拟议的行动。当前流行的行动提供的数据集MSRA action3D是微软公司在美国。这是选择评估的性能测试(gydF4y2Ba15gydF4y2Ba,gydF4y2Ba16gydF4y2Ba]。平均的模板表示动作和鞠躬表示方法相结合的多核学习,增强特性的贡献两个调整通过引入学习重量;通过以上两个改进,行动提高识别的准确性。这个系统的捕获图所示gydF4y2Ba4gydF4y2Ba:gydF4y2Ba

同行action3D是一个公开的数据集提供的美国微软公司。骨骼数据集包含的信息和数据,由20个行动的10个人和2或3的迭代序列。深度数据的分辨率gydF4y2Ba 。gydF4y2Ba20的操作数据和实验分类如表所示gydF4y2Ba2gydF4y2Ba:gydF4y2Ba

与现有的方法提供了一个公平的比较。因此,在本文的实验设置被应用。在每一组动作,一套动作1 (S1),一组行动2 (S2),和一组行动3 (S3),随机选择一半的数据作为行动模式。剩下的一半将被用作测试的输出样本信息。gydF4y2Ba

3.3。抓住位移光学流网络gydF4y2Ba

作为网络的输入,单模光学循环系统覆盖两个视频帧图片。卷积有九层在整个网络。完全卷积系统自动选择图像特征信息从不同的图片使用的特殊实现方法两个数据帧叠加在一起。整个网络结构图如图gydF4y2Ba5gydF4y2Ba:gydF4y2Ba

具体的网络结构安排如下:gydF4y2Ba(1)gydF4y2Ba网络的输入是两个叠加视频帧图像。视频帧图像需要被转换成一个数据库文件在被输入到网络。同时,图像大小重置为三通道彩色图像与一个统一的大小为320gydF4y2Ba 256像素gydF4y2Ba(2)gydF4y2Ba一层复杂的“conv1”加上一个池平面“pool1”第一个卷积操作。卷积操作内的“conv1”卷积gydF4y2Ba 像素的大小,每一层包含6像素。卷积核的步长是一个传统的单位,和边界补偿是其中之一。结果,回旋的特征尺寸,估计是320gydF4y2Ba 256;“pool1”层利用最大的downsampling层,而“pool2”层使用最小的最佳选择,和22的窗口大小设置为共享层的设置风格,整个窗口的移动位移距离是2,的总体设置池层是相同的,和下采样后的图像大小是160gydF4y2Ba 128年,是作为下一层的输入gydF4y2Ba(3)gydF4y2Ba事先“conv2”和池层“pool2”占第二卷积层。特征映射是由计算64内核的5gydF4y2Ba 5在每一层长度。池层后的图片尺寸为140gydF4y2Ba 168个像素,总共68gydF4y2Ba 84像素gydF4y2Ba(4)gydF4y2Ba第二个cnn模型由两个卷积层(conv3和conv3 1)以及汇聚层(pool3)。卷积运算在这两个旋转的大小4gydF4y2Ba 4所示。“conv3”处理元素有64卷积核,而“conv3 1”卷积层双conv3卷积操作,共有128名。卷积核的默认步长是1图像,边缘修正也是1像素。特征映射的宽度可能确定为40gydF4y2Ba 32像素gydF4y2Ba(5)gydF4y2Ba第四个卷积层有两个卷积层(conv4和conv4 1)以及汇聚层(pool4)。深层网络由两个激活功能表面面积4gydF4y2Ba 4所示。“conv3”处理元素有128卷积核,而“conv3 1”卷积层有256个卷积核,这是两倍”conv3“卷积层。的默认步长内核大小是一个像素。卷积功能大小可以计算为20gydF4y2Ba 16岁的占1像素gydF4y2Ba(6)gydF4y2Ba卷积第五层包含两个卷积层“conv5”和“conv5_1”和池层“pool5”。卷积核的卷积两层都是3gydF4y2Ba 3;“conv3”体积,产品层和卷积“conv3_1”层,包含了512个卷积核。通过假设卷积核的步长是1,功能图的大小可以计算8gydF4y2Ba 10gydF4y2Ba

选择数据集拦截的动画和比较它和真正的光流计算输出光流影像的影响。如图gydF4y2Ba6gydF4y2Ba,这是一个比较真实的光流和光学流输入光流计算的网络形象。可以看出,光流影像输入光流计算的网络可以大致估计的主题移动目标的运动趋势,但移动目标的轮廓比较模糊,忽略很多细节的运动,也不是反映在小位移的运动。显然,即使目标信息与小位移。gydF4y2Ba

佛罗里达中央大学的创建UCF101,动作游戏dataframe行动分类任务(gydF4y2Ba17gydF4y2Ba,gydF4y2Ba18gydF4y2Ba]。这个数据收集由15412从YouTube视频剪辑,包括一个广泛的活动类型,包括妇女与产品交互的镜头,镜头的人与他人互动,视频的人演奏弦乐器,以及不同体育视频。在数据集的创建过程中,视频的格式标准化。表gydF4y2Ba3gydF4y2Ba显示了UCF101数据集的个人视频特征以及数据集的规模:gydF4y2Ba

有更少的视频数据有越轨行为UCF101数据集的行动视频类别,包括更频繁的场景在生活中包括运动场景和演奏各种乐器。CASIA行为数据集添加到实验过程中为了实现建筑的异常行为数据集。CASIA应用行为数据库包含1446监控录像从三个校准不当固定摄像机同时拍摄的。这些数据分散在整个外部世界水平,倾斜,和空中的角度,对消费者行为研究的观测证据。信息分为两类:单人和多人交互行为。走路,短跑,扭曲,攀爬,蹲,死亡,有困难,破坏汽车都是人类活动的例子。共有16人参与每一幕。沉重的球,传球,追求球,让球,面对,会议,通过球都是行为干预的例子。表gydF4y2Ba4gydF4y2Ba显示人看过电影的数量一次或两次,视频的特点,和大小的CASIA系统数据库数据集:gydF4y2Ba

dual-stream系统设计在UCF101信息源丰富的行动分类评价的效率深刻ResNet足球的识别工作的行为。网络转移到深两倍后,多年来开发,模型构建。体育动作识别和分类的工作已经完成在CASIA行为数据库(gydF4y2Ba19gydF4y2Ba]。gydF4y2Ba

4所示。数据分析gydF4y2Ba

4.1。UCF101数据集的实验分析gydF4y2Ba

UCF101收集的数据可能会在互联网上找到。训练数据集有一个高水平的复杂性。所有的电影都有清晰和杂乱的背景,和UCF101特性102年创纪录的16420视频剪辑操作子类。为示例,本文采用三个分区技术从默认的测试阶段。对于每一个得分模式,7的26视频序列将被选为测试序列,和其他19个视频将被用作训练序列。这些测试将被执行如上所述的默认three-segment模型UCF101信息集合,和正常的三个信息集将有关插图最后测试的后效。来评估distinguishment执行从声称这个算法UCF101信息集,看看这个计算其他活动distinguishment算法,即基于卷积神经系统(CNN)活动distinguishment算法(gydF4y2Ba20.gydF4y2Ba),依赖于这些计算升级厚轨迹(IDT) distinguishment依赖深刻(C3D),和人类活动distinguishment计算的神经系统协会(CNNT) distinguishment运动算法的时空网站域名和向量系统(支持向量机)。gydF4y2Ba

4.2。采样频率的影响测量系统的映射gydF4y2Ba

为了分析测量系统的采样频率的影响映射,激光跟踪器的采样频率设置为25赫兹,50赫兹,和80赫兹,两套轨迹数据。20条数据点,40双数据点,和68对数据点被替换成ISO算法,DTW算法和CDTW算法分析采样频率的影响在三种映射方法。实验结果如表所示gydF4y2Ba3gydF4y2Ba。ISO算法用于轨迹之间的映射。随着采样频率的增加,采样点之间的距离变得越来越小,轨迹切线变得陡峭,轨迹点映射错误增加。从表可以看出gydF4y2Ba3gydF4y2Ba当采样频率增加到25赫兹到80赫兹,轨迹精度降低从1.160毫米到1.532毫米,和标准差增加从0.304毫米到0.535毫米。采样频率的增加会导致减少轨迹的准确性后ISO算法映射,并增加总体误差波动范围。DTW算法是一种点对点的映射。随着采样频率的增加,轨迹点的密度增加,和轨道之间的一对一匹配点可以更好地实现。从表gydF4y2Ba3gydF4y2Ba,可以看出DTW映射方法正好相反的ISO映射方法。当采样频率增加到25赫兹到80赫兹,轨迹精度增加从0.678毫米到0.508毫米,和标准偏差减少从0.242毫米到0.159。毫米。采样频率的增加导致了改进后的轨迹的准确性DTW算法映射,和整体误差波动幅度减少。gydF4y2Ba

4.3。分析空间流网络的特征gydF4y2Ba

pretraining GoogLeNet神经网络调整的模型用于卷绕和总体外观图片和相应的光流特征的视频在一个给定的时间窗口层的层。然后,与高层语义特征的时空序列流重要的结构是通过使用多层递归网络cross-perception长期和短期记忆。在获得时间流网络的特点和空间流网络的剩余网络dual-stream结构,时态特征合并。第四章通过分析的融合方法,加权平均融合方法用于融合多个视频帧的概率向量的概率向量整个视频,空间流网络的权重系数是作为1/4,空间流网络的权重系数是作为2/5,合并这两个网络的识别精度,最后识别分类结果是88.94%。为了证明dual-stream结构模型和深层残留网络是有用的,适用于行动识别,最终识别结果与精度相比基于UCF101行为数据集在其他文件和加深到101 -层dual-stream深层残留与其他方法相比,UCF101行为识别效果的提高网络上的数据集,因为光流特征提取结合光学流网络更准确,行为特征信息提取。gydF4y2Ba

5。结论gydF4y2Ba

通过实验,可以发现,当认识到一些小小的行动,大量的数据需要在后台的视频分析和判断。双核极端的第一步学习机器使用轨迹密度的方法和学习特征来确定踢足球的行动。进行分析,可以充分描述行动。第二步结合视频的时间序列模板的卷积神经网络来实现不同角度的分析和判断足球行动。并通过识别方法的动态时间人类骨骼的正规化,系统识别的复杂行为时一个人踢足球比较单一动作序列之间的相似性和模板组。本文的缺点主要是算法识别足球操作太复杂或不够简单而高效,快速反应,没有标准,所以该算法仍然需要优化和加强。前景后续研究:首先,在数据采集领域,我希望得到尽可能多的数据。在收集数据时,现场不能太单一,多个站点需要替换来实现数据的普遍性。此外,不同专业人员校准和收集所需的模板序列的视频,所以,当数据比较后,单个模板可以更妥善对应的操作视频模板。gydF4y2Ba

数据可用性gydF4y2Ba

没有数据被用来支持本研究。gydF4y2Ba

的利益冲突gydF4y2Ba

没有任何潜在的利益冲突在我们的纸上。gydF4y2Ba

作者的贡献gydF4y2Ba

所有作者看到了手稿和批准提交你的日记。我们确认手稿的内容没有被发表或投稿。gydF4y2Ba