文摘
一个系统被称为行人识别利用几个摄像头识别周围地区和快速识别和匹配目标人群。基于行人识别,图像模型,行人的特性,和其他信息,功能开发有高度的概括性,特殊性,准确性。行人通过的应用方法提出了基于深度学习的众多特性。提出的方法成功地保留了高层语义信息,这有助于网络成员中提取所有的行人属性。作为外部材料和语义信息横向和纵向相结合,环境干扰减少,人们创建网络的能力增强。介绍了演讲的语音频道系统,以充分利用全球信息网络,和之间的连接通道是仔细处理以提高全球信息网络的表达能力。零卷积减少操作识别信息的连续性。增加数据的一致性,卷积多层次空间结构与整个图像合并。经过无数次的实验中,三组分别为89.5%,89.5%,和89.1%,分别比1501年,DukeMTMC-reID, CUHK03,和其他中间团体,和实验结果分别为85%和89.5%,分别。多模反馈MP3模块从MP3模块为了获得更多、更密集的多模功能信息。 Comparing the module’s initial response level (RANK1) with the various cycles yields the average accuracy for each cycle (catalog). The experiment demonstrates that the two mixed pile groups can enhance the modulus of the mixed pile group and get better results. The multi-level multi-scale pole function effectively combines the characteristics of pedestrians in various scales, and the addition of the ASP module enhanced the network context information’s overall ability to be represented, aided in this chapter’s research method’s ability to more thoroughly analyze scene structure, and increased the precision of pedestrian re-recognition.
1。介绍
深度学习的快速发展,深度学习赢得了伟大的模式识别领域的竞争条件和行人通过。这一历史性的考察提供了一个紧凑的总结工作,其中大部分可以追溯到一千多年。浅深学习者和学习者之间的区别在于他们的信用知识的深度轨迹,这是一个因果链之间可以学习行为和效果(1]。深度学习使多层处理通过多层抽象表达相关研究模型样本。相关研究方法已经大大提高了在许多领域,如人行》,视觉识别,药物检测和基因组学对象检测(2]。深度学习的研究领域,行人通过的相关研究,特征方法做出了很大突破通过组合功能领域的深入学习。许多研究表明,深度学习建立了相关研究模型特征识别行人通过。实验表明,深度学习领域的数据分析和解释人行》(3]。深度学习也是一个强大的机器学习形式。在欧洲,人们越来越关注生物科学,使计算机来解决感性形象和语音识别等问题。这些深度学习技术,如人工神经网络,使用多层加工技术来查找非常大的数据集的模型和结构(4]。最新的数字技术的发展,数据集的规模太大,传统的数据处理和机器学习技术无法有效应对。然而,分析复杂、高维、noise-contaminated数据集是一个伟大的挑战,这是非常重要的开发新算法,可以总结,分类,提取重要信息,并将其转换成可以理解的形式。为了解决这些问题,深度学习(DL)模型已经显示出良好的性能在过去十年(5]。最近,深度学习在许多领域取得了杰出的表现。与传统的浅模型相比,深度学习方法使用一个更深的架构模型真实数据集的复杂分布更有力。本文提出了两种融合方法基于深度学习,可两个分支网络的熔合成一个独特的功能(6]。在传统的基于先验知识(ROI)检测方法,全局搜索的解决方案通常是用来处理高分辨率遥感图像,从而导致计算太复杂。为了解决这个问题,本研究提出了一个更快更有效ROI检测算法基于多尺度特征融合,,输入图像的处理以及两个渠道特性:强度和方向(7]。在面对面》,提取图像特征检索行人图像是一个重要的一步。目前,大多数的方法只提取行人图像的全局或局部特征。学习图像特征时,一些不显眼的细节很容易被忽视,这是效率低下或健壮的场景以极大的差异。此外,行人的特征融合相对模型通过描述行人状态的再认识,提出了合成》根据判断(8]。因为行人是关键监测目标在视频监控系统中,许多研究关注cross-camera行人通过监测算法。》目前,行人模型不仅面临网络模型训练的难度,因为大量区别不同类型的训练样本,但是还需要减少大量视觉性能差异的影响在模型识别精度9]。对象跟踪与多个函数不执行在复杂的场景和闭塞。轨迹所代表的对象是在线性加权融合的特性,并提出了一种新的方法来估计融合系数根据重量分布和空间所有粒子的浓度,从而提高可靠性的特征融合(10]。目前,图像检索的准确性是一个困难的问题,主要是因为存在的特征提取方法。为了提高图像检索的准确性,一种基于性质的商标图像检索方法(基于基本特征综合分析)提出(11]。在本文中,为了提高re-ID的鲁棒性和性能,我们建议一个re-ID方法。(即通过重新排序精制re-ID结果。,initial list) obtained by kernel-local Fisher discriminant analysis (kLFDA) and marginal Fisher analysis (MFA), the probability of correct targets in the initial result list can be improved and the robustness can be enhanced [12]。行人》(即,re-recognition) is an essential prerequisite in multi-camera video surveillance research. The premise is that pedestrian targets should be accurately re-recognized in multi-camera networks with non-overlapping visual fields before other post-event advanced utilization (i.e., tracking, behavior analysis, activity monitoring, etc.,). Driven by the latest development of deep learning technology, important re-ID problems are usually solved by deep discriminant learning or deep generative learning technology [13]。》在实践中,行人通常使用自动探测器获取限制行人的图像。然而,在这个过程中,有两个探测器中的错误:过度的背景和部分丢失(14]。距离测量方法基于深度函数:首先,该决议CN特征提取的最后一层,和每个位置确定的位置和通道。最后,从图像中提取图像的质量。其次,使用一种新的改进方法,卷积扩张方法,和滑动框架变换函数法,定性解决低信道矢量。第三,远程教育算法基于图像提出了判别分析。最后,融合方法研究,人工深度分辨率的合作任务完成(15]。
2。深入学习和行人通过
2.1。深度学习的概述
近年来,教学深度的改善促进了许多研究主题的发展。研究人员快速和深入搜索方法应用于行人识别,这是准确的和有效的比传统的行人识别方法。深度学习被广泛使用之前,研究人员使用机器学习来解决相关问题。数据必须被处理在特征提取和选择,才能使用。这是很难完成学习任务,但这并非如此。当相关系数的边缘深度学习神经网络是一个主人,和网络的重量太大了,被升级。但作为科学家改进神经网络,模型优化变得更容易,让越来越多的人意识到自己的深入研究。深度学习尤其意味着添加许多隐藏层在传统的人工神经网络。然后,对隐层执行非线性操作解决机器学习问题如隐层的增加和神经元连接体重的增加,导致整个神经网络参数和不对称的复杂性。对于这个问题,一些学者将控制律和非控制性的法律来解决这个问题。 The subjects were initialized using unsupervised learning of the deep learning training process to provide better initial values. Then, the control method was used to determine the appropriate learning speed and to adjust the network parameters to accelerate the convergence speed.
2.2。行人》
行人识别是一种技术,这种技术可以比较行人识别相机相同的或不同的相机在不同的角度,时间,和立场,和输入训练和提取图像可能属于同一行人从候选图像集。行人识别通常是一个图像搜索技术,也就是说,没有行人在训练集测试集。基于这一特性,行人识别被认为是一个分类的任务训练,这被认为是一个研究问题的训练。时间和空间的复杂性和准确性的两种最常用的指标是绩效评估。在大多数情况下,时间复杂度集中在时间复杂度,需要实时性能的重要算法。甚至牺牲时间更好的性能。时间复杂度的比较是基于一个一致的硬件基础设施,否则比较是没有意义的。准确度和精密度通常是基于相同的数据集。如果不同的算法相比,大量的样本可以获得准确的分类和预测。因为要求高深入学习、深入学习硬件,硬件的组成人员是不同的行人识别算法的研究。因此,在评估识别结果,它不是时间复杂度,但是该算法的准确性。这是强调。 The corresponding RANK-k represents the probability value that the first k-bit pedestrian sample images in the similarity sorting result of the pedestrian sample database contain the target pedestrian for the target pedestrian to be searched. At present, when evaluating the performance of pedestrian re-recognition algorithm, the commonly used values ofk3、5、10和20。同样,k位越大,网络模型的性能越好。与1级相比,k位可以更好地评估模型的性能,它反映了全面的检索能力模型的行人图像数据库中找到目标。目前,常见的性能指标测量行人识别性能是正确的平均速度和准确性。在本节中,详细介绍了上述两种绩效评估指标。初始匹配率和1级匹配率代表目标探测的相似性,行人模型库函数和配置和初始的行人模型图像属于目标的似然值。所示的公式计算等级1 (1)是图像的数量聚集在行人模型基础:1级第一个匹配率,第一个匹配的速度代表了概率值,第一个行人样本图像属于目标搜索后比较行人sample数据库的功能相似性画廊,从小型到大型排序。
相应的分类结果表明,第一个行人样本图像的粗分类的结果行人样本库是目标的概率值行人。当评估现有的行人识别算法的性能,典型的值k3、5、10和20。更高的分类也表明样本网络的良好的性能。与1-classifier相比,k-classifier可以更好的评估模型的性能,反映模型的综合搜索能力的行人图像库。由于多种因素,如先前识别硬件行人平均的影响模拟精度,用于网络模型训练样本图像通常是用更少的训练样本收集的两个摄像头。所有的行人都可以检测毒蛇一样准确的数据仓库和行人模型数据库。对于这些简单的数据集,k位曲线和CMC可用于综合评价网络模型的性能。随着计算机科学的迅速发展,CNN在行人识别技术的应用克服了许多障碍,和行人信息集合的成分变得越来越复杂。网络模型的性能是通过使用只有以上两个指标综合评价。该方案可以同时估计网络模型的召回率和准确率,并反映各种预测结果的平均精度的网络,这是更适合当前复杂的数据集,并能全面地、客观地评估网络模型。根据行人样本图像和模型显示在行人,所得预测结果可以分为四种类型:切,假阳性、假阴性,和真正的负面的。 Where, the accuracy is the ratio of the real number (tp) in all the prediction accuracy results in the network model (tp + fp). The memory rate is the ratio of the actual score to all the correct scores. (2)和(3)介绍计算公式如下:
3所示。卷积神经网络在深度学习
3.1。卷积神经网络的结构
目前,卷积神经网络已被广泛用作深深度学习网络结构模型。这些特点更突出在计算机视觉领域通过当地观察,重量分布,分割采样和其他手段。输入的图像可以直接打开,这是很重要的对于许多计算机视觉领域的主题。CNN的基本结构包括输入层、卷积层,柱层,完成接口层和输出层。根据网络的配置,如图1,一般来说,卷积层和浆层美联储多次和卷积层和浆层交替排列,也就是说,卷积层和连着浆层,和浆层由卷积追踪层。
3.2。水平和深度学习的函数
3.2.1之上。卷积层、汇聚层、连接层
卷积层深度学习的深度学习结构,核心结构,卷积层主要是一个深入的分析的神经网络来获取更高层次特征分析对象。例如,使用脸部图像卷积神经网络训练,第一次卷积层学习整张脸的线段和曲线;第二个卷积层学习面部特征的轮廓;第三层卷积学习脸的轮廓;等等,随着层数的增加,你可以学习完整的整张脸的特征。当执行卷积的上层数据分析层,卷积计算公式
在公式(4):是二维输入数据点的像素值吗 , 的值是卷积和大小的内核P×问在 , 偏移值,通常代表了空间坐标之间的拦截和原点,,可以理解为补充输入的线性变换,和分别输入图像的尺寸大小,代表了激活功能,是输出卷积后操作。在输入图像卷积操作总结和偏移量,获得的地图是一个二维特性,也就是说,卷积层 。同时,因为动作区域原始图像的卷积核是本地,卷积神经网络大大减少了参数的数量的重量与传统的神经网络相比,使用完整的连接在每一层。
在(4):是卷积核的价值大小P Q,偏移值,通常代表了空间坐标之间的拦截和原点,可以被理解为一个输入的线性变换后补充。从原始图像分辨率的操作范围验证是本地的,参数的个数为解决神经网络的权重比传统大大减少完全相关的神经网络。例如,当输入数据的维数是1000,在隐藏层节点的数目是1000。如果完全连接,1010使用参数;如果卷积神经网络用于100个不同的卷积核,只有104参数是必需的,大大减少了参数的数量。字体卷积的活动层是一个静态的特征图像。图像特征提取部分也用于其余的形象。因此,该指数的统计操作是必要的,也就是说,术后是特征提取的主要目的。通过保留尽可能多的有用的特性,我们减少计算数据量,减少卷积图像分辨率,改善翻译敏感性,加速网络的学习速度。通常有两种方式来完成最大的字体和字体的平均。 The maximum pole configuration requires a cross section of different pixels, and the resulting maximum value is the pole configuration value; the font average is to find the average of each component, and then, use the average result after the font operation. In the neural network convolution structure, the entire connection is made after multiple convolution layers and one or more connection layers. The entire connection layer means that every cell in the layer is connected to all the properties of the preceding layer. The connection layer integration of the convolution layer and the well-class separation method is completed.
3.2.2。激活函数
数据输出的深度学习,相关分析是由激活函数,它直接影响卷积神经网络的性能。神经网络的激活函数是非常重要的。目前,选择激活函数主要是基于之前的调优经验或通过实验验证。然而,一般人往往没有足够的经验知识自主选择激活函数,在这种情况下,一个典型的通过实验验证激活函数被选中。乙状结肠函数等数学形式
激活函数的输入值是在0和1之间。乙状结肠函数是广泛使用的非常早,自乙状结肠函数值为0时输入无穷小大小和1输入无穷,乙状结肠函数很容易获得。如果该梯度为0时卷积神经网络模型中的参数不更新和模型性能差;(2乙状结肠函数的输出值不等于0。激活函数也是一个函数的非线性饱和数学模型,及其数学形式的公式如下:
单宁的区别功能和单宁的乙状结肠函数功能压缩输入值−1和1。谭函数结果的平均值为零。在这种情况下,收敛速度远快于乙状结肠函数。乙状结肠相比的性能改善,但双曲正切函数仍然没有解决梯度分散的问题。ReLU函数是一个不饱和非线性激活函数的数学形式:
当计算激活函数的输入值是负的,输出值为零。当输入值是正数,激活函数的输出值等于输入值。激活函数的线性研究不饱和,这避免了色散斜率向下后和收敛速度。激活函数的数学表示很容易计算,只需一个阈值,如图2。输出是0,当输入是负的,所以激活函数具有良好的特性。
3.3。卷积神经网络的训练
3.3.1。深度学习传播算法
深度学习的提出神经网络结构分为深度学习输入和输出深度学习。提出学习的进步是通过输入值通过神经网络的输出。深度学习后进步的过程解决相关系数利用神经网络结构。在正向传播阶段,输入通常是一个或多个图像,图像可以看作是一个矩阵。在正向传播过程中,每一层的权向量是第一次初始化,通常以谋取更多的深度特性,每一层的权向量是不同的。然后,输入值乘以重量,在接下来的相关步骤,输入值传播到输出层获得最终的相关参数,如可见:
利用bp算法神经网络的核心算法。这是一个反向传播算法和神经网络理论的支持。算法的基本思想是:输入数据输入由输入层、隐藏层在传播过程中(卷积神经网络的隐层多个卷积层和池层),输出层的输出数据,输出值是输出由目标层。在反向传播过程中,目标值之间的误差最小化。底层的基本数学思想传播算法是应用程序链接的规则在计算能力。导数公式
3.3.2。深度学习Back-Propagation-Related算法
深度学习的bp算法,提出了图像可以作为训练样本深度学习函数的输出值的解决方案,其中,重量是必需的。激活函数可以得到图像的训练参数,参数表达式,如公式如下:
深度学习的损失函数是选择样本的均值-方差和十字架功能训练,如方程如下:
在深度学习神经网络,损失函数的组合偏执的函数可以确定表达式如下:
深度学习的更新规则所示(15),学习速率是用来控制梯度下降的速度。以上是由梯度下降方法更新参数的过程。
3.4。卷积神经网络的优化
3.4.1。随机梯度下降法
迭代的输入随机梯度和梯度迭代方法相比,压缩到正确的随机梯度迭代法迭代样本。梯度组件从样本中提取迅速获得模型的最优解当样本容量足够大。周期的每个示例使用随机下降需要很长时间,显著提高计算的复杂性。因此,本节介绍几个方法来避免过载,包括随机梯度算法的方法和时间。
3.4.2。动量算法
动量算法(动量)的深度学习卷积神经网络通常与随机梯度下降法一起使用,可以加速随机梯度下降法的收敛性,特别是在高曲率、小而一致的渐变,更新规则如公式如下:
3.5。损失函数
有效地训练网络模型提出了在这一章,网络模型训练使用triple-loss函数和cross-loss函数的组合。使用交叉表函数的分类器。和分类器预测行人的身份在深度学习的损失函数。限制严重损失函数一式三份增加的容量3 d累积模块。本章随机选择不同的ID样本,每个ID都包含不同的视频序列,每个视频序列包含一个边界框。具体的损失函数公式如下所示:
叉损失函数通常用于深度学习的损失函数算法,包括相关推导函数熵的损失函数,如公式如下:
4所示。实验结果和分析
4.1。行人通过模型基于多尺度特征融合
在这里,我们提出一个研究功能融合在一个基础上的行人。首先,条纹模型模块介绍了残块,和剩余块卷积模块介绍后条纹模型来捕获内容语义在不同的方向。当提取内容数据,块没有有效的相关结果和块。然后,RESNET50层结合在不同尺度和内容数据编译促进网络结构的设计。最后,网络结构的多尺度特征进一步维护通过碎片生活池模块的连接,以减少环境对人的影响和提高行人的性能。
以下4.4.1。SPM模块
使用水平和垂直条图像操作在SPM模块获取上下文信息在不同的空间维度有助于网络改善现场分析。深度学习的多尺度方法是避免信息的复杂性,以提高多尺度研究行人的准确度和精密度。首先,深度学习函数引入了两个水平和垂直层。一维卷积处理收益率水平和垂直特征张量。然后,扩展函数是用来复制原始图像大小标签卡,和结果增加根据输入函数,连接输出张量与输入张量,帮助网络建立外部接触场景的性能。
4.1.2。MPM模块
不同特征的感官官场,语义信息不能完全保留,容易被行人。本章中提取特征信息在不同的尺度上改善解决行人特征的能力。基于所选择的模型,编写一个偏远的全局数据模型,关注网络短消息格式。桩体模型采用2×2,3×3,,4×4堆芯,这显示了前两桩的计算结果和前三个桩,分别结合叠加的结果。考虑到多功能的低增量信息在神经网络中,所有的语义信息在传输过程中可以提取改善网络的分析能力。因此,在剩下的RESNET50网络结构,介绍了MP3模块。最后,混合池模块是根据行人的特点调整身份认证。在输入函数,MP3模块编译不同的尺度函数。获取丰富、密集的特性信息,反馈MP3模块从MP3中提取模块获得新功能。每个周期的平均精度是通过比较模块的最初反应水平(RANK1)不同周期(目录)。 The practice shows that both the groups of mixed piles can improve the modulus of the mixed pile group and obtain better performance. Some of the experimental results are shown in Figure3。
4.1.3。剩余ASPP模块
维护网络的有效属性,创建RESNET50 ASPP网络结合空卷积,从而实现通过扩展多个属性的分离效率,进一步提高系统的独立。本文的结构改进。这个函数只使用一个有效的ASP模块。此外,对模块提取不同的空间有不同的影响。隧道速度引起大的变化在特征提取和规模不在中间信息网络的特点。此外,转换、实验验证和优化选择是根据任务执行的行人在这一章的特征。一些实验结果如图4。
4.2。网络消融分析
本章算法消除SPM, MPM,剩余ASPP模块。验证模块的有效性,我们使用这个方法来为每个模块提供一个抽象的数据集在标签- 1501。索引的研究最多quasi-network深度学习中使用多尺度行人,SPM板被添加到这个quasi-network,然后,这一章是综合的算法研究。烧蚀分析如表所示1。(1)采用索引基线作为基线网络。(2)添加SPM模块只在基线。(3)添加MPM模块基线。(4)添加只有住宅ASPP模块基线(5)添加MPM模块和残余ASPP模块(2)是这一章的最后算法。
4.3。对比实验分析
本章算法的例子相比,最近的功能一般的数据集。数据5和6显示方法和其他方法之间的比较在不同的媒体类型。结果了,这一步的方法可以实现更好的结果。算法主要是由于不同的水平和垂直井的结构和不同的多目标数据采集的内容,然后,结合空虚维护网络状态和有效地提取各种特性。如图5这里的多尺度融合方法是RANK1, 5%和17%,相比市场的融合方法- 1501数据集。基于图像的偏移方法相比,RANK1和目录增加了17%和32%,分别。分析数据集上的实验结果如图5:
如图6,相关的深度学习行人数据集上的实验方法,在本章实验方法大约5相比高出其他实验方法。数据集的实验方法是如图6:
本章提出了一种新的模型,行人检测。通过多层次多尺度函数,有效地结合行人的特征在不同尺度网络,添加ASP模块,进一步提高网络的整体表征能力上下文信息,帮助本章的研究方法,以更好地分析现场结构,并改善行人的研究精度。此外,该算法是通用的测试数据集的市场- 1501,CUHK03,所有指标都大大提高。本章实验表明,提出的模型是可行的和有效的。然而,本章中给出的方法不能有效地利用全球信息。下一步是改善行人识别模型的准确性从整体的角度特性的关系。如图7相比,本章的方法CUHK03工作在数据集不使用本章的结构。本文中使用的索引的基本模型,基于改进的挖掘方法。实验结果表明,本方法提高了各指标相比,新提出的工作。CUHK03数据集上的测试结果的比较如图7:
5。结论
随着时代的快速发展,研究行人》的特点是越来越深,现在深度学习的研究方法是引入特征的研究行人通过。随着行人的发展》的研究中,这项技术已经大大改善。然而,由于复杂多变的应用环境中,行人识别是容易受到各种各样的干扰。如何解决这些问题的关键是提高行人识别的准确性,也是许多学者关注的主要问题。基于深度学习的行人运动检测方法比传统方法具有更高的精度,因为其强大的自动提取能力和广阔的应用前景。该方法的主要步骤是提取和分析输入行人图像和分级评价行人图像。本文还利用人类视觉系统的处理机制深入研究学习方法的特征提取和传输机制,使行人识别任务的准确性。
数据可用性
使用的实验数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者声明,关于这项工作他们没有利益冲突。
确认
这项工作是得到了研究项目的资助Cross-Mirror跟踪基于卷积神经网络优化算法。项目数量:20 b520014。这项工作的部分赞助由2022年河南省科学技术研究项目的服装工业高精度三位重建及其应用在虚拟人体和服装配件项目。:222102210124(3)赞助的这项工作是在部分程度上是由于2021重点工程的河南省高等教育教学改革研究与实践是基于鲲鹏生态学的特点。项目数量:2021 sjglx167。