基于多分辨率密度人群计数地图和并行卷积扩张

文摘

当前的人群计数任务依赖于一个完全卷积网络生成密度地图可以实现良好的性能。然而,由于人群阻塞和视角图像失真,直接生成的密度通常忽略了地图信息和空间规模的联系信息。来解决这个问题,我们提出MDPDNet(多分辨率密度地图和并行网络)通过卷积扩张来降低阻塞和畸变的影响人群估计。这个网络由两个模块组成:(1)并行扩张卷积模块(PDM)相结合三个扩张并行运算来获得更大的接受域上的深层特征参数较少,同时减少损失的多尺度信息;(2)多分辨率密度地图模块包含三路(MDM)网络中提取空间的联系信息在三个不同的低分辨率密度地图作为特征输入最终人群密度的地图。实验表明,MDPDNet取得优秀的成果在三个主流数据集(ShanghaiTech, UCF_CC_50, UCF-QNRF)。

1。介绍

人群拥挤的现象越来越严重,安全,安全任务,如公共安全控制、交通安全监控,面临巨大的挑战。手动分析人群聚集的程度不仅不能达到精度高,还将执行效率低。相比之下,deep-learning-based方法更适用于目前因为他们的过程不仅消除了手动的努力也可以快捷、准确地分析人群聚集。其中,人群估计像素级别的穿过人群分布密度地图取得了巨大的进步。人群密度地图是一种形象的标签,可以反映人群的分布头通过高斯卷积处理负责人协调价值。如图1,人群在图像主要涉及不同的分布模式和聚合功能。人群分布密度图可以获得更准确的空间信息和更全面的图像特征在浓密的场景,这带来了密度估计方法也可以应用于车辆控制、生物生态学研究和其他跨域字段分享这项技术的进步。

(一)

(b)

早期的人群计数方法依赖于目标检测或回归计算。target-detection-based方法,例如Haar小波检测1)和方向梯度直方图检测(2],严重限制了人们的遮挡和背景杂波的形象,所以他们只适合低密度场景。计数等回归方法,通过特征提取,通过傅里叶分析融合头检测和筛选(3,4)打破了检测方法的限制,在某种程度上,但预期的结果往往不是由于实现困难的回归过程。

卷积层和汇聚层的卷积神经网络(CNN)加强之间的关系模式识别和图像中背景,CNN的密度估计方法,并有很强的学习能力。他们实现了高精度在浓密的场景5- - - - - -7]。人群计数的准确性主要取决于估计的质量密度地图图像比例尺是有限的。自CNN卷积内核拥有一个静态的大小,动态尺度首脑将网络的性能恶化,导致判断失误和失踪的判断。为了解决这个问题,常见的方法如下:(1)引入一个多列结构来估计不同尺度的人群8];(2)引入领域扩张卷积的概念从图像分割9]。这是一个特殊的卷积的不同尺度的提取特征信息,组成的33卷积内核和扩张参数。通过设置不同大小的扩张参数替换冗余分支的卷积核,计算多尺度检测可以减少成本;(3)区域用不同的检测方法,不同尺度的图像(10]。生成高质量密度图、空间连续性应确保在生成过程中,相邻像素的输出密度图可以顺利过渡。Viresh et al。11]提出两个分校CNN架构(ic-CNN)生成一个高分辨率密度从低分辨率的地图密度地图和地图中间特性。由于低分辨率密度地图包含人群的空间分布信息,它可以有效地提高预测结果的准确性。

在本文中,我们设计一个新颖的人群计数网络名为MDPDNet(多分辨率密度地图和并行扩张卷积网络)。如图2,引入并行卷积扩张PDM可以增加接受域,减少网络的计算负担的情况下恒定参数,加快网络训练。MDM逐渐生成三个密度的地图不同的决议和合并的空间分布信息的一个重要特征输入最终密度图。与此同时,以确保最终密度图的分辨率与原始图像是一致的,我们使用反褶积upsample功能丰富功能的细节。灵感来自ic-CNN,我们使用最小化损失函数训练网络参数,提高网络的健壮性和优化网络的迭代更新。

图2

人群密度计算网络模型图基于多尺度地图融合扩张卷积。(bx意味着多分辨率密度地图;高清意味着最终的高分辨率密度地图;MDM负责保留空间的联系信息;PDM旨在进一步扩大接受字段和提取功能;上升2位代表upsampling步长为2;conv7 - 256代表卷积核的7×7×256;Conv3 + Upsample意味着有一系列的卷积和upsampling流程)。

这个模型的主要贡献如下:(1)我们提出一个新的人群计数网络(MDPDNet)来生成高分辨率密度地图,计算人群,并显示准确的分布。(2)平行扩张介绍了卷积来提取特征在不同接受字段在高分辨率的损失降到最低多尺度信息和保险丝人群分布信息包含在多分辨率密度地图上,使产生的高分辨率密度地图与空间密切相关。(3)MDPDNet显示更好的性能与一些先进的方法在三个基准数据集。

本文的其余部分组织如下。在下一节中,我们回顾相关工作。节3,我们将描述该方法,其次是部分的实验评价4。结论提出了部分5。

人群计数方法的探索一直是一个热门研究课题。传统的人群计数方法包括目标检测(1,2,12,13和功能的回归4,14,15]。靶向性检测通常是一个人或负责人探测器适用于图像。例如,美元等。12)是第一个提出了滑动窗口检测器检测人群。灵感来源于筛选,中间人组织(2)设计了一个方向梯度直方图猪来计算和计算梯度方向局部区域的特征。Felzenszwalb et al。13),通过使用特性金字塔代表当地特性映射,克服缺点,全球功能不适应阻挡人们在某种程度上。目前,虽然没有理想的检测方法在面对人群浓度高,feature-regression-based方法解决阻塞问题通过学习当地特性之间的关系。例如,减少et al。14)提取特征点感兴趣的基础上,通过傅里叶分析和筛选。安东尼和塞·伐斯冈萨雷斯(他15]提取前景等特性和纹理梯度生成基本信息。然而,基于功能回归的方法需要建立人群特征之间的映射关系和人群数量第一,这是一个复杂的过程。同时,由于严重的背景干扰,很容易错估人群面对稀疏场景。

鉴于CNN的强大的学习能力,它不仅可以优化小型目标探测通过迭代学习也提高检测精度,同时减少检测计算。所以它通常被用来生成一个人群密度图(16,17]。因为张et al。8)提出了一个简单的多列卷积神经网络结构(MCNN),每一列对应的神经网络学习的特点规模适应不同尺度的图像。多列的回旋的结构是在人群中广泛应用领域的预测。提出的Switching-CNN山姆et al。18)设计了一个选择器输入图像块特征提取的具体分支机构,进一步降低计算复杂度的多列网络。

通过实验,李et al。19)发现MCNN不仅可以在内部分支机构之间共享功能还创建一个冗余的结构。减少培训的复杂性,他们提议CSRNet,单列网络扩张卷积层在后端。通过设置膨胀率的大小,CSRNet可能提供不同的接受域提取不同尺度的图像的特点,成功实现技术从图像分割领域转换到人群计数。在此基础上,马等。20.)提出了一个深黑色的旋转空间金字塔网络(ACSPNet)的卷积模块具有不同孔隙率多尺度信息集成和提高规模感知范围通过跳连接。虽然扩张卷积的应用程序极大地简化了网络,它不能反映他的优势当有物体图像分辨率较低。邹et al。21)设计了一个分层的规模调整网络(HSRNet)聚集的人群场景规模急剧变化。HSRNet可以连接多个尺度的信息建模上下文相关性。也非常友好,当有物体分辨率较低。

此外,估计人群的方法基于密度地图融合图像的空间信息。然而,图像的分辨率会减少当深化网络发生,导致大量的空间信息将丢失的细节,这限制了最后的密度图的预测精度。目前有许多upsampling方法用于解决上述问题。例如,ic-CNN [11]介绍了一种双线性插值层通过使用线性插值图像的像素填充空缺在两个方向上得到一定的插值效果和操作速度。Zeiler,费格斯(22]提出了将收集方法,只有激活位置坐标的值的最大激活值是在池的过程,将其他值设置为0,因此,重构图像是离散的。SANet [23)学习使用反褶积参数upsampling过程中提高分辨率的特性,使密度地图包含更精细的空间联系信息。

基于最新的研究方法,我们发现ic-CNN方法基于多分辨率密度图可以从人群中提取更丰富的空间信息图像时需要重点解决的问题群体目标和多尺度图像的空间相关性。至于upsampling操作,antipooling和双线性插值相比,反褶积过程可以反映CNN的优越性。因此,我们设计一个网络模型,生成多分辨率密度地图阶段加强支持的多尺度特性,引入空间卷积在高分辨率下适应规模变化,同时保留丰富的空间之间的连接信息特性通过反褶积。

3所示。建议的方法

人群的分布和规模不同的图像之间的差异很大,甚至同一幅图像的不同区域之间。为了解决这两个问题,我们设计了两个模块的相关优化。如图2,其中一个是一个平行的扩张卷积模块(PDM)为解决尺度问题;另一个是多分辨率密度地图模块(MDM)求解空间连接问题。为了清楚地描述了这个网络的结构,我们也用简单的符号来代表参数在预测过程中的每个阶段。首先,我们的训练图像集的集 ;然后, ,在哪里代表的第i个测试图像,是一组多分辨率密度对应地图吗 , 是高分辨率密度预测的地图吗 ,和n代表测试图像的数量。这个集合包含所有预测图像参与培训过程和相应的密度地图。

3.1。整体架构的MDPDNet

我们选择VGG-16作为该网络的基本框架。它的普通结构和较强的适应性可以灵活应用于各种各样的模型。删除最后完全连接层允许网络适应图像的规模和提供一个MDM和PDM的功能。

如图3VGG-16,第一个四层(conv3 conv3 conv3 - 64 - 64 - 128,和conv3 - 128)引入MDPDNet为基本特征提取的前端框架。每一层的卷积是紧随其后的是ReLU非线性激活函数,可有效减少参数之间的相互依赖,提高网络的非线性拟合能力。后每两层VGG-16卷积的一层max-pooling步长为2介绍了减少图片的大小,提高网络存储的利用率。经过进一步的特征的提取通过平行扩张卷积模块(PDM)和多分辨率密度地图模块(MDM)两个模块的输出是由连接融合操作,然后通过upsampling-2 Conv1-1,和输出高分辨率密度与原始图像地图。

最终密度图的映射函数在哪里是高分辨率的映射函数模块,代表了高分辨率密度预测地图对应图片 , 和MDM的加权参数和特性输出,然后呢和是PDM的参数和特性输出。

以同样的方式,一个高分辨率密度地图生成基于低分辨率密度地图,ic-CNN设计迭代多级扩展。在每个迭代中,网络需要融合所有先前的预测阶段,这将增加计算和整个网络的复杂性。然而,多个低分辨率密度地图从MDM这个网络已经包含上下文信息丰富的图像,这是足以提供一个紧密的空间相关性的预测高分辨率密度地图。

3.2。多分辨率密度地图模块(MDM)

卷积得到的特征向量在不同深度有不同的分辨率和不同空间关系信息,所以由此产生的多分辨率密度地图包含严格的空间相关性。我们推导出该模块的前端骨干网络。如图4,三组介绍了卷积VGG-16层一层一层地形成不同深度的分支网络,同时和特征向量输入到分支网络(L1, L2, L3),进一步提取图像的上下文信息,然后简单地输出相应的低分辨率密度地图 ,它提供了丰富的重要功能空间的联系信息吗的高分辨率密度地图预测任务。其中,低分辨率密度的地图吗深度对应测试图像。

低分辨率的映射函数密度图如下: 在哪里是低分辨率的预测参数密度地图分支;输入的功能分支网络为代表 ; 代表低分辨率密度映射的映射函数。

因为分支模块的输出将被用作输入的一个重要特性高分辨率密度地图,我们使用反褶积upsample密度地图在每个分支到高分辨率状态逐渐增加的敏感性特征图像中的信息。最后,重要的功能通过连接输出操作提高分层融合的多分辨率密度地图。

MDM的卷积过程如图4的分支网络,其中包含三列L1, L2, L3。详细的结构如表所示1:L1 5-7-layer卷积VGG-16 (conv3 conv3 - 256 - 256, conv3 - 256), Conv1-1, upsampling-2 conv3 - 64, upsampling-2,输出的功能 ;VGG-16 L2: 8-10-layer卷积(andconv3 conv3 conv3 - 512 - 512 - 512), Conv1-1, upsampling-2 conv3 - 64, upsampling-4,输出的功能 ;VGG-16 L3: 11-13-layer卷积(conv3 conv3 - 512 - 512,和conv3 - 512), Conv1-1, upsampling-4 conv3 - 64, upsampling-4,输出的功能。最后, , ,和通过连接操作和卷积conv3 - 128的MDM回骨干网络的输出。


层	骨干

输入	图像
1	VGG-16层1 - 4

模块	PDM	MDM

2	Conv7×7×256	VGG-16层5 - 7
3	Conv5×5×512	Conv1×1×1 (b1)	VGG-16层8 - 10
4	conv3 - 64 - 1 - 256 conv3 - 64 - 2 - 256 conv3 - 64 - 5 - 256	Upsampling-2	Conv1×1×1 (b2)	VGG-16层11 - 13
5		Conv3×3×64	Conv3×3×64	Conv1×1×1 (b3)
6			Upsampling-4	Upsampling-4
7				Conv3×3×64
8	Upsampling-2			Upsampling-4
9	Conv3×3×128	Conv3×3×128
10	Upsampling-2
11	Conv1×1×1
输出	高清

3.3。平行扩张卷积模块(PDM)

该模块位于后台的骨干网络。与多列网络的冗余的结构相比,并行卷积扩张由卷积这个模块只需要配置内核具有不同膨胀率,这将增加接受域进一步深入挖掘图像,从而解决问题,普通的卷积不能适应尺度,加强网络的鲁棒性。

图5显示了学习过程中PDM的功能模块。最重要的部分是三个平行扩张的隆起。功能将输入后的平行结构conv7 - 256和conv5 - 512先后来提取图像的多尺度信息。在这个模块中,我们并行卷积核的大小设置为3×3,膨胀率为1,2和5,分别和渠道的数量到64年(即conv3 - 64 - 1 - 256、conv3 - 64 - 2 - 256,和conv3 - 64 5 - 256)。接下来,PDM将连接提取多尺度信息通过连接操作和使用反褶积upsampling步长为2(2)增加其像素级和之后进一步卷积(conv3 - 128)改变通道的数量获得PDM的输出。

让输入图像的输出的特性在PDM,然后并行卷积扩张的映射过程在哪里代表了卷积的内核和膨胀率代表一个卷积的输出特性在不同膨胀率,及其二维表达式在哪里代表图像的特征输入扩张卷积和是一个扩张卷积核的。当 ,扩张卷积的一种特殊情况,即普通的卷积核。因此,不同大小的接受字段可以通过设置不同的膨胀率。

3.4。培训细节

我们实现了我们的设计模型使用PyTorch框架(24,在训练阶段,我们定义一个固定的学习速率 ,优化器SGD和训练迭代2 k数量。的参数和正在初始化和。尽管MDPDNet已经增加了尽可能多的接受域,错过的或错误的检测是不可避免的,由于各种图像尺度分布不均造成的人群和不一致的角度在拥挤的场面。因此,我们预测之间的结构相似度计算密度图和相应的实际密度地图通过最小化损失函数,从而调整参数来提高培训阶段对噪声的鲁棒性和优化迭代更新过程。我们的损失函数所示在哪里和是两个分校的映射参数模块,用于逐步优化和自适应调整两个分校模块之间的比例;代表人们的实际数量手动标记。

4所示。实验

我们进行了相关的培训和测试三个公共数据集(8,14,25),取得了预期的结果。在本节中,我们将介绍评估指标,分析我们的模型的分支机构通过烧蚀研究中,并显示我们提出的方法的比较与最近的一些先进的方法对这三个数据集。

4.1。评价指标

领域的人群计数,检测指标是由基准包括平均绝对误差(MAE)、均方误差(MSE)和均方根误差(RMSE)。在这个实验中,我们选择了美和MSE评估上的平均情况的性能测试数据集,因为他们可以更全面描述模型的稳定性。显示了评价方法在哪里代表测试图像的数量;代表测试图像的实际数量通过人工痕迹;代表的人数估计通过网络,通过整合相应的人群密度地图。

4.2。地面实况代

为密度地图能够适应各种条件的人群的形象,它可以表示为与正面。的计算方法δ函数进行卷积吗用高斯核标准化为1: 在哪里在像素级表示每个行人头部;是人群中的所有图像数据集的分布;是一个常数;和代表的平均距离k最近的邻居的目标。

在我们的实验中,我们紧跟CSRNet配置(19]。不同的数据集对应于不同高斯内核,设置如表所示2。某些参数设置为固定值( )。


数据集	参数设置

ShanghaiTech Part_A [19]	σ= 4
ShanghaiTech Part_B [19]	σ= 15
UCF-QNRF [25]	Geometry-adaptive内核
UCF_CC_50 [14]	Geometry-adaptive内核

4.3。ShanghaiTech数据集

ShanghaiTech数据集(19)是一种通用数据领域的人群密度统计数据。它包含两个部分,一部分是A和b部分,它涵盖了几个群聚会的场景不同尺度和大小。部分是非常拥挤的图片和注释的集合,它由300年的训练图和182个测试图。乙方收集稍微稀疏的人群,由316年的训练图和400个测试图及其注释。A和B部分形成一个cross-scenario对比。

实验结果见表3描述MDPDNet可以发挥其准确预测能力在高度拥挤的场面,这意味着我们设计的算法执行我们期望。从对比实验(PDM或只是MDM),这表明当MDPDNet预计仅使用PDM模块Part_A数据集(高人群集中),美减少了3.7%。同样的,当MDPDNet预计仅使用MDM模块Part_A数据集,美是增加了2.2%。


	部分		B部分
方法	美	均方误差	美	均方误差

MCNN [8]	110.2	173.2	26.4	41.3
CSRNet [19]	68.2	115.0	10.6	16.0
Ic-CNN [11]	68.5	116.2	70.7	16.0
MBTTBF-SCFB [25]	60.2	94.1	8.0	15.5
HSRNet [21]	62.3	100.3	7.2	11.8
MDPDNet(摘要)	59.8	99.7	9.3	15.2
PDM(摘要)	63.5	105.2	10.1	15.9
MDM(摘要)	62.0	101.4	9.6	15.4

相反的极其拥挤的场景是,当面对稍微稀疏的人群,因为我们的网络本质上是基于回归的想法,有一个差距像HSRNet的预测结果和最新方法。然而,由于HSRNet严重依赖于检测和回归,必须引入额外的判断步骤确保第一步图像预处理,从而增加复杂度开销。

4.4。UCF-QNRF数据集

UCF-QNRF数据集(25)含有丰富的人群聚合图片,1201年有1535高分辨率图像,图像334年培训和图像进行测试。无论图像捕捉稀疏或密集的人群集会现场,每一个与大量的注释信息。在这个数据集,总共有近125万的注释,确保可靠性强。根据比较结果见表4,可以看出人群估计精度由MDCNet与其他现有方法相比提高了5.9%,如MBTTBF-SCFB。此外,当MDPDNet只使用PDM模块或MDM模块来执行个人预测,美提高了约3.0%和9.8%,分别。


方法	美	均方误差

MCNN [8]	277.0	426.0
Switch-CNN [18]	228.0	445.0
MBTTBF-SCFB [25]	97.5	165.2
MDPDNet(摘要)	100.4	159.3
PDM(摘要)	113.4	182.7
MDM(摘要)	120.2	201.3

4.5。UCF_CC_50数据集

数据集(14)是由50个实例:图像和手动标记信息。其中,拥挤的图像与不同的观点的人,密度,和场景。因为实例在这个数据集的总数很小,这是一个巨大的挑战对培训网络。实验结果见表5,说明我们提出的MDPDNet大大提高美和MSE指标5.5%和3.2%,相比之下,ic-CNN等其他经典模型。


方法	美	均方误差

MCNN [8]	377.6	509.1
Cascaded-MTL [25]	322.8	397.9
Switch-CNN [18]	318.1	439.2
ACSCP [26]	291.0	404.6
SaCNN [27]	314.9	424.8
CSRNet [19]	266.1	397.5
Ic-CNN [11]	260.9	365.5
MDPDNet(摘要)	255.4	362.3

4.6。密度图

MDPDNet不仅记忆最后的高分辨率密度地图还记录密度的低分辨率的地图分支预测过程。如图6有四组人群图像输入与不同尺度和不同空间分布和相应的多分辨率密度地图输出。,我们可以看到,最后的输出MDPDNet模型(列(c))已达到一个非常高的准确率,这是非常接近手工标记(列(b))。特别是在密集人群场景(第三行),高分辨率密度地图的准确性和映射质量达到我们预期的预期水平。

(一)

(b)

(c)

(d)

(e)

(f)

5。结论

在本文中,我们提出一个网络结构命名MDPDNet基于多尺度的人群密度估计密度地图融合扩张卷积。这种结构可以提取不同功能的空间联系信息在一个迭代通过执行密度分析在不同尺度的特性。在此基础上,由并行处理的多尺度特性扩张卷积进一步融合生成最终的高质量的人群密度估计地图密切相关。比较几种经典的实验数据集(ShanghaiTech、UCF-QNRF UCF_CC_50)表明,MDPDNet我们提出的高精度和强鲁棒性。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突有关。

确认

这项工作是由浙江省技术计划项目(不支持。2020 c03105)。

引用

p .中提琴和m·j·琼斯,“健壮的实时人脸检测,”国际计算机视觉杂志》上卷,57号2、137 - 154年,2004页。视图:出版商的网站|谷歌学术搜索
n .中间人和b区格”的梯度直方图的人体检测,”2005年IEEE计算机学会学报计算机视觉与模式识别会议(CVPR ' 05),1卷,页886 - 893,圣地亚哥,美国,2005年7月。视图:谷歌学术搜索
d·g·劳”独特的形象特征尺度不变的要点,国际计算机视觉杂志》上,60卷,不。2、91 - 110年,2004页。视图:出版商的网站|谷歌学术搜索
d·g·劳”,从当地的扇区特征对象识别,”《学报》第七IEEE计算机视觉国际会议,卷2,页1150 - 1157,科孚岛,希腊,1999年9月。视图:谷歌学术搜索
a . Krizhevsky i Sutskever, g·e·辛顿“Imagenet分类与深卷积神经网络,”ACM的通信,60卷,不。6,84 - 90年,2017页。视图:出版商的网站|谷歌学术搜索
f . Chollet”与切除可分离旋转Xception:深入学习,”《IEEE计算机视觉与模式识别会议火奴鲁鲁,页1251 - 1258年,美国,2017年7月,你好。视图:谷歌学术搜索
k . Simonyan和a . Zisserman”很深的卷积网络大规模图像识别,”2014年,https://arxiv.org/abs/1409.1556。视图:谷歌学术搜索
y, d .周s . Chen等人“幅图片的人群通过多列卷积神经网络计算,”《IEEE计算机视觉与模式识别会议拉斯维加斯,页589 - 597年,NV,美国,2016年10月。视图:谷歌学术搜索
f . Yu和诉Koltun多尺度环境下扩张的聚合的隆起,”2015年,https://arxiv.org/abs/1511.07122。视图:谷歌学术搜索
王魏,y元,问:“MSPNET: multi-supervised并行网络人群计数”学报》2020 - 2020年ICASSP IEEE国际会议音响、演讲和信号处理(ICASSP)西班牙巴塞罗那,页2418 - 2422,,2020年5月。视图:谷歌学术搜索
诉野生动物、h·勒和m . Hoai“迭代人群计数,”计算机视觉的欧洲会议(大会),页270 - 285,德国慕尼黑,2018年9月。视图:谷歌学术搜索
p .美元,c . Wojek b Schiele et al .,“行人检测:一个评估状态的艺术”IEEE模式分析与机器智能,34卷,不。4、743 - 761年,2011页。视图:谷歌学术搜索
p . f . Felzenszwalb r . b . Girshick d McAllester et al .,“对象检测与区别式模型部分原因,”IEEE模式分析与机器智能,32卷,不。9日,第1645 - 1627页,2009年。视图:谷歌学术搜索
h . Idrees Saleemi, c . Seibert et al .,“多源多尺度计算在极其密集的人群图像”《IEEE计算机视觉与模式识别会议,页2547 - 2554,波特兰,俄勒冈州,2013年6月。视图:谷歌学术搜索
a . b . Chan和n .塞·伐斯冈萨雷斯,他的“贝叶斯泊松回归人群计数,”学报2009年IEEE 12计算机视觉国际会议《京都议定书》,页545 - 551年,日本,2009年9月。视图:谷歌学术搜索
诉Lempitsky和a . Zisserman”学习计算图像中的对象”,先进的神经信息处理系统,23卷,第1332 - 1324页,2010年。视图:谷歌学术搜索
诉Pham, t . Kozakaya o .山口et al .,“计算森林:Co-voting不确定数量的目标人群密度估计,使用随机森林”《IEEE计算机视觉国际会议Las conde,页3253 - 3261年,智利,2015年12月。视图:谷歌学术搜索
d·b·山姆,s .苏亚和r . v .先生,”人群计数开关卷积神经网络,”学报2017年IEEE计算机视觉与模式识别会议(CVPR)火奴鲁鲁,页4031 - 4039年,美国,2017年7月,你好。视图:谷歌学术搜索
张x, y . Li和d·陈,“CSRNet:扩张卷积神经网络对于理解高度拥挤的场面,”《IEEE计算机视觉与模式识别会议,页1091 - 1100,盐湖城犹他,美国,2018年6月。视图:谷歌学术搜索
戴j .妈,y, Y.-P。谭”,深黑色的旋转空间金字塔网络人群计数和密度估计,“Neurocomputing卷,350年,第101 - 91页,2019年。视图:出版商的网站|谷歌学术搜索
刘y, z邹s徐et al .,“人群计数通过层次规模调整网络,”2020年,https://arxiv.org/abs/2003.03545。视图:谷歌学术搜索
m . d . Zeiler和r·费格斯“可视化和理解卷积网络”欧洲计算机视觉的诉讼可汗,页818 - 833年,瑞士,2014年9月。视图:谷歌学术搜索
曹x, z . Wang y赵et al .,“规模聚合网络准确、高效的人群计数,”计算机视觉的欧洲会议(大会),页734 - 750,德国慕尼黑,2018年9月。视图:谷歌学术搜索
a . Paszke总值,s . Chintala et al .,《捏车间美国长滩,CA, 2017。
诉答:Sindagi诉m·帕特尔,“多层次的屁股上,自上而下地人群计数功能融合,”《IEEE计算机视觉国际会议,页1002 - 1012,首尔,韩国,2019年10月。视图:谷歌学术搜索
倪z沈,y, b . et al .,“人群计数上通过对抗性的跨一致性的追求,”《IEEE计算机视觉与模式识别会议,页5245 - 5254,盐湖城犹他,美国,2018年6月。视图:谷歌学术搜索
l, m .史,问:陈,“人群计数通过scale-adaptive卷积神经网络”学报2018年IEEE冬季会议上的应用计算机视觉(WACV)太浩湖,页1113 - 1121年,NV,美国,2018年2月。视图:谷歌学术搜索