轻量级自动识别和位置检测模型的农田害虫

文摘

自动识别和位置的农田害虫是一项重要的目标检测的研究方向。各种各样的害虫和害虫之间的相似类别的自动识别农田害虫有一些问题,如高错误率和困难的识别。为了达到一个更好的目标自动识别和位置的农田害虫,本文提出一种轻量级害虫检测模型,和网络提出的EfficientNet谷歌,而达到26害虫的检测,基于古典Yolo目标探测算法的意思。首先,通过轻量级特性提取主干,然后融合多尺度特性是由PANet;最后,三个特征矩阵输出预测了不同尺寸大小不同的害虫。使用意识作为损失函数的回归预测更好的反映了前框的相对位置和真正的盒子。实验结果与其他轻量级算法进行比较,结果表明,该算法的准确率为农业害虫的识别和定位在本文中是最高的,达到93.73%。此外,该模型是轻量级的,可以部署在低成本的设备,降低了设备的成本和准确地预测在农田害虫和疾病的状态。在实践中,结果表明,该算法可以有效地解决这个问题,大量的害虫,害虫积累,背景干扰,具有较强的鲁棒性。

1。介绍

小麦和玉米是主要的粮食作物在中国北部。农作物经常遭受害虫的生长,造成巨大的经济损失每年小麦和玉米产量。有很多种农作物害虫,袭击庄稼的生长和经常爆发的灾难;所以,需要实时、准确监测小麦和玉米害虫、制定合理的预防和控制措施,减少经济损失。传统的小麦和玉米害虫检测的主要方法仍然需要基础层的工作人员进入现场观察害虫类型特征,直观地观察,诊断害虫在该地区的地位。这种方法的特点是沉重的工作负载和低效率。它不能预测病虫害的发生,满足当前的需要害虫监测、减少农业病虫害监测的准确性,不利于害虫的规模和自动化检测(1- - - - - -3]。

增长的计算资源,深度学习发展迅速,特别是在图像领域,它提供了一个轻量级农田害虫检测技术基础(4]。害虫的早期识别、人工神经网络、支持向量机等方法被用来实现害虫识别,主要是基于颜色、纹理,害虫的形态等特征。它有高要求的体型特征数据集内的害虫,只能完成几个类别。识别结果很不稳定。这种方法本质上是一个分类问题。只有一个可以解决害虫在一张照片中,这是不符合实际的环境5]。与深度学习技术的日益成熟6,7),出现了大量优秀的检测模型在目标探测领域,如SSD, Fast-RCNN, Yolo[意思8- - - - - -10]。这些优秀的目标探测模型通过卷积神经网络提取特征。这些算法都是基于锚实现目标定位。最近,一些目标检测算法没有锚已经出现,如Centernet [11]。然而,对于小目标对象(如害虫,没有先天的帧算法的性能不是很理想。目标探测模型已广泛应用于行人检测、车辆检测、人脸检测、无人驾驶和其他领域。它也适用于目标探测的害虫。例如,杨魏和其他人意识到害虫的自动识别使用两级faster-RCNN检测模型(12]。元等人意识到自动识别和计数的8种昆虫利用yolov3模型,和识别率可以达到70.98%13),而害虫识别的准确性仍需要改进。

大多数现有的识别方法使用网络图片作为训练数据集。尽管他们有很好的识别率,在网络上收集的图片只能识别害虫的一边(14]。在实际应用中有很大的差距。模型的鲁棒性不高,和部署计算资源需要有高设备,不能满足当前的实际需求(15]。本文提出了一种轻量级检测模型来解决这个问题,现有的目标探测模型需要大量的计算资源。模型是部署在低成本的设备,主要监测害虫在农田,从而达到害虫的规模和自动化监测。检测模型在本文主要指Yolo算法。意思的想法因为每个害虫都有不同的大小,模型输出三种不同大小特征矩阵,并设置三个锚具有不同大小为每个特性矩阵,和回归预测害虫具有不同的大小。检测模型的部署在本地设备上实现,这减少了浪费计算资源,大大降低了成本。

2.1。图像处理

深度学习的本质是端到端;数据集的建设是深入学习的基础。因为稀缺的公共害虫数据集,从实际情况有很大的差异。害虫数据集用于本文获得了山东省利用遥测灯装置。设备主要使用光来吸引害虫,通过加热室杀死害虫,落在昆虫,并通过高清摄像头拍照的害虫。共有10000个害虫收集的照片。6144有用的害虫的照片被手动筛选出来。总共有26个害虫识别。一些样本,如图1。害虫的类别和数量分布见表1在下面。labelImg工具是用于手动标记生成VOC2007格式(16]。


不。	的名字	样本数量	不。	的名字	样本数量

0	玉米螟	545年	13	阿艾玛	492年
1	棉铃虫	1565年	14	Gryllotalpa许可证	167年
2	金龟子	1799年	15	Chiasmia cinerearia	221年
3	Macdunncughia crassisigna	159年	16	Eupolyph	256年
4	Athetis lepigone	928年	17	Callambulyx tatarinovi	340年
5	Mamestra brassicae林奈	727年	18	Scarites	229年
6		265年	19	板球	179年
7	条纹高粱钻	73年	20.	Diaphania quadrimaculalis	238年
8	Agrotis ypsilon	624年	21		200年
9	Mythimna Separata	189年	22	Agrius convolvuli	200年
10	Latoia中央研究院摩尔	366年	23	扁平Smeritus沃克	203年
11	甜菜夜蛾	183年	24	Parum colligata	190年
12	Agrotis segetum 瓢虫	374年	25	布雷默等灰色巴特勒	147年

摘要害虫检测模型的输入是一个尺寸图,数据集的大小是不一样的,需要调整的数据统一大小的输入网络,如果直接调整图片是扭曲的,现实的和可能会失去原来的特征;所以,添加填充图片采用的方法防止失真的数据集。对于一个好的目标探测模型,它需要巨大的数据集进行训练,以避免过度拟合的网络和提高模型的鲁棒性,同时该数据集的数量明显不足,总共七个方法被用来进一步增加的数据集,即旋转,翻译水平,垂直翻译、视角转换,和缩放水平反转以及亮度增强,从而提高模型的泛化能力,和数据扩展到超过20000张(17]。

为了进一步提高模型的鲁棒性,提高其泛化能力,马赛克数据加载时增强方法是使用数据集。马赛克数据增强指的是数据的增强方法Cutmix [18]。Cutmix数据拼接两个图像增强方法,但是马赛克使用四个图像丰富的背景对象和增加数据的多样性。BN(批正常化)层计算时,设置的批量大小越大,越接近整个数据集的均值和方差,和效果会越好。由于GPU内存的限制,是不可能培养多个图片。当我们把四个照片在一起,输入到网络,输入的批大小乔装的网络将会增加。如图2,增强了马赛克图像数据。

2.2。目标检测算法

深度学习的目标检测算法包括三个部分:骨干,颈部和头部。骨干主要用于特征提取地图生成特性,如VggNet ResNet, Densenet [19- - - - - -21]。脖子是保险丝的功能特性为进一步的特征提取不同尺度的地图,如红外系统,锅,BiFPN [22- - - - - -24]。最后,用于分类和回归预测完成目标识别和定位。头主要是分为两个部分。一个基于锚,如SSD, Yolo,意思和Retinanet。在特征点集锚箱功能提前地图和定位目标通过调整锚箱的大小和位置。有两个主要问题:预设锚箱的大小是固定的,另一种是基于锚免费,如Cornernet [25)和Centernet。在构建模型时,需要目标点;即目标的中心点BBox使用关键点找到中心点,并返回到其他目标属性;在实验研究中,锚的准确性高于锚免费;因此,本文提出了一个轻量级的目标检测算法基于Yolo的想法和意思提高两个锚基地的两个缺点。

2.3。模型结构

网络体系结构借鉴Yolo模型结构和意思使用一个阶段方法来建立模型。Yolo系列意思检测模型非常完美的经过三代的迭代。它有很高的计算速度和精度高的优点,被广泛应用。摘要网络体系结构由算法根据其构造如图3。骨干的darknet-53 yolov3被改进Efficientnet [26),潘被脖子上的红外系统改善功能融合。

该算法是基于Efficientnet-B2[的支柱26网络,谷歌在2019年提出的图像分类。Efficientnet-B2网络的输入。为了更好地提取图像的特征,输入大小改变 ,和小型网络结构添加在最后一块,以便进一步的样本特征映射。Efficientnet-B2网络主要由七个MBConv块。结构如图4。它使用普通尺寸提高卷积,然后BN,时髦的激活函数,然后使用深可分体积采样。一个SE模块之后,它使用一个降维卷积,通过十亿层和规范。最后,输入特征矩阵与主信道特性矩阵通过添加快捷方式完成特征矩阵的输出分支。只有当输入MBConv结构特征矩阵的维数是一样的,输出的特征矩阵,拼接操作执行。在第一个提升维度的卷积层,输入MBConv结构特征矩阵与输出特征矩阵,和卷积核的数量次输入的特征矩阵通道。

改变网络参数如表所示2添加SPP,再变更输入大小和结构,提高了算法的泛化能力和拥有更广泛的视觉特性。


阶段	操作类型/卷积核的大小	矩阵的大小	数量的渠道	数量的重复

1	Conv,		32	1
2	MBConv,		16	1
3	MBConv,		24	2
4	MBConv,		48	2
5	MBConv,		80年	3
6	MBConv,		120年	3
7	MBConv,		192年	4
8	MBConv,		350年	1
9	SPP,k5,k9日,k13		1408年	1

深分离卷积(27)是一种传统卷积的变形。不同与传统的卷积,卷积的核心渠道的数量等于输入的频道数量特征矩阵,输出渠道的数量特征矩阵,卷积核的数量,和卷积的核心是一个矩阵的大小。普通的卷积的结构示意图如图5,深分离卷积图所示6,假设代表输入特征矩阵的大小,是矩阵的数量特性,卷积核的大小,是输出的数量特征矩阵,计算比较深的分离卷积与普通卷积方程所示(1)。

假设卷积核的大小 ,公式= ;普通的卷积的计算是理论上的8 - 9倍深度,可见是远低于普通的卷积。

SE的结构模块如图7。特征映射执行全球平均池和转换的特征矩阵的大小 ,执行两个完整的连接层。第一个完整连接使用时髦的激活函数,和渠道的数量成为原数量的1/4。第二个完整的连接采用乙状结肠激活函数,节点的数目等于输出渠道的数量特征矩阵的深度分离卷积层,和最终的输出是相乘得到的输入特性图。SE模块类似于self-attention [28机制,增加了有趣的特性通过乙状结肠的输出函数。

在网络的主要特性,添加了SPP(空间金字塔池)结构;即三个最大池取样后进行最后MBConv块,因为都是一个,衬垫的大小,特征矩阵的特征矩阵添加不改变。获得的三个特征矩阵和输入特性矩阵的特征矩阵拼接获得深度的4倍。结构如图8。

阶段的特征融合,PANet的想法(路径聚合网络)结构用于融合的多尺度特性。支柱的功能网络,收集三个特征矩阵大小不同,如图3。这三个特征矩阵MBConv5、MBConv7 MBConv8。首先,卷积和SPP操作与卷积核的大小 MBConv8上执行,然后与执行MBConv7采样和叠加。功能层继续执行抽样和MBConv5融合叠加。通过两次的长度和宽度扩张,取样操作完成,高语义和功能层。卷积运算和卷积核的大小 ,进行抽样,分别以确保目标的特征信息,哪个更有利于检测不同大小的对象。

在脖子上,完成融合叠加之后,这三个特征矩阵与卷积执行卷积操作内核的大小 ,分别与不同大小和输出三个特征矩阵,即(13日13日93),(93年26日26日),(52岁,52岁,93)。前两个维度代表功能层的大小和用于检测不同大小的对象,而93代表每个功能点有三个先天的盒子。每个先验框包含五个参数,即长度、宽度、中心点和分类概率。26这一次检测到害虫;所以,这个维度。

时髦的激活函数是用于MBconv块。漂亮是一个改进版的乙状结肠和Relu,类似于Relu和乙状结肠,其中包含一个参数β,β可以设置为一个常数或可训练参数。它没有上限但下界的特点,平滑,和nonmonotonicity,见公式(2)和(3)。

时髦的激活函数的优点不仅Relu和乙状结肠功能也优于Relu深度模型。它可以被视为一个平滑函数线性函数和Relu函数。

2.4。损失函数

损失函数的目标探测大致可以分为三个部分:信心丧失,损失分类损失,和位置。信心损失函数,借据(十字路口在联盟)是用于判断预测帧之间的相对位置关系和真正的框架,但是借据不能判断重叠区域,预测帧之间的中心距,长宽比和真正的框架。因此,本文运用意识(完成,借据)[29日取代借据和添加一个惩罚项,以便回归损失函数收敛和减少损失函数的散度的培训过程。的损失函数模型公式所示(4)。

其中,λ₁,λ_2,和λ₃平衡系数。每个的重量损失函数调整通过设置每一个的大小。信心损失的具体公式、分类损失,损失和定位公式所示(5),(6)和(7)。

在公式(5), ,代表预测帧之间的意识和真正的框架,预测价值,预测获得的信心吗c通过功能,是积极和消极的数量样品。在公式(6), 指示是否有类目标预测框架 , 预测价值,是目标概率获得的通过功能,是积极的数量样品。在公式(7),是中心点坐标、长度和宽度预测帧,然后呢是真实的信息帧。意识的公式所示(8)。

在哪里代表之间的距离中心点的坐标的预测,代表之间的距离中心点的坐标的盒子,代表欧氏距离的计算,代表预测框之间的距离和最小边界框的对角线的盒子,和惩罚因素和被添加到它,所示(9)和(10)。

和代表真正的盒子的宽度和高度。和预测框的宽度和高度。这个处罚主要是预测框的宽度尽可能快接近真正的框的宽度和高度。最后,我们得到了回归损失函数如公式(所示11)。

目前的算法使用锚基础预测对象的目标位置。主要的思想是设置锚,大小不同的特征矩阵中的每一个特征点,虽然积极和消极的问题在训练样本不平衡,导致减少了模型的准确性。例如,一个图像可能会产生成千上万的候选框,但只有很少部分包含目标;目标框是正样本和负样本没有候选人盒子。局部损失(30.]函数解决问题的积极的和消极的样本不平衡和控制容易分类和困难分类样本的权重。焦损失函数的公式如下:(12),(13)和(14)。

其中,被称为调整系数。当趋向于0,调整系数1,贡献损失增加,和调整系数往往0,相当于一个小贡献全损。当系数 ,传统的crossentropy损失函数实现调整系数通过调整。

3所示。结果与讨论

3.1。实验环境

这个实验使用Pytorch作为深入学习框架加速训练模型。硬件配置是:r5 - 3600处理器,16 gb的内存,和英伟达RTX3070显卡;软件环境是Windows10系统、Python3.7 Pytorch1.9, CUDA 11.0版本,8.0.1 cuDNN版本。

3.2。评估标准

平均精度(美联社)是一个主流的目标探测模型。美联社计算通过计算每个目标类别的美联社。美联社计算通过使用面积precision-recall (P-R)曲线作为AP值,精度和召回公式(15)和(16)显示。

TP(真阳性)代表正确的目标类分类和是一个正样本,FN(假阴性)代表错误的模型分类的结果,和示例是负的,FP(假阳性)代表错误的模型分类,样本是负的,和地图已成为公认的目标探测和被广泛使用的方法。

3.3。结果和分析

回归预测的过程中,九个候选帧设置根据三个特征矩阵大小不同。因为不同的训练数据集,候选帧的大小也不同。在这篇文章中, - - - - - -意味着聚类算法用于查找适当的训练集之前帧的大小。 - - - - - -聚类算法不同于标准的一个手段。它通过意识计算候选帧之间的距离,最后九个候选帧(29岁,35),(70),(72、117),(87、83),(94、149),(115、110),(124、186),(145、146),(182、220),适合81%的数据集的框架。在培训期间,传输采用学习方法。VOC的加载模型是模型的数据集,和部分冷冻骨干方法用于迭代50次,解冻的训练,然后迭代50次。如图9后,损失函数的递减曲线显示模型训练的200倍。余弦退火方法用于减少学习速率。其中,学习速率采用余弦退火方法减少通过余弦函数的学习速率。余弦函数的增加 ,余弦值下降缓慢,然后再慢慢加速下降,减少。模型更容易找到最好的优势,和标签添加平滑方法,这主要是为了惩罚不能分类分类的模型太准确,防止过度拟合

我们将数据集分为训练集,验证集和测试集根据7:1:2的比例,然后计算美联社害虫物种通过测试集的价值。表3显示模型的映射值可以达到93.73%,这证明了检测模型具有良好的性能。我们可以看到,Scarite害虫的精度可以达到100%,而美联社Agrotis ipsilon害虫仅为62.86%。从表中,我们可以知道,这可能是由于害虫物种的分布不均,或者它可能使害虫的特点几乎没有区别,样本的数量小,提取特征模型是不够的。进一步证明模型的鲁棒性,我们测试了算法的检测在实际情况。如图10在不同的场景中,该算法检测结果。在图10中(a),背景干扰,害虫的数量总是不断,没有堆积。该算法准确地预测害虫的类型和位置。在图10 (b),尽管害虫的数量减少,背景被严重扰乱,害虫了。模型仍然发现害虫的位置和分类准确。在图10中(c),成堆的害虫出现,数量和种类增加。尽管害虫被确定为两个物种,这可能是由于借据阈值较低,但大多数害虫是准确地确定。在图10 (d),有大量的害虫,有些是堆叠,而实际的数量。尽管错过了害虫检测,模式仍然检测害虫的位置及其对应的物种。通过这些复杂的情况下,它可以表明,目标检测算法具有良好的鲁棒性,可以应对各种复杂的环境,有广泛的应用。


的名字	美联社(%)	的名字	美联社(%)

玉米螟	99.36	阿艾玛	99.13
棉铃虫	99.27	Gryllotalpa许可证	95.50
金龟子	99.59	Chiasmia cinerearia	96.56
Macdunncughia crassisigna	71.43	Eupolyph	96.67
Athetis lepigone Mamestra brassicae林奈	99.01 96.15	Callambulyx tatarinovi Scarites	99.58 94.85
条纹高粱钻	98.20	板球	100.00
Agrotis ypsilon	62.86	Diaphania quadrimaculalis	97.50
Mythimna Separata	98.32	Agrius convolvuli	99.58
Latoia中央研究院摩尔	99.94	扁平Smeritus沃克	86.96
甜菜夜蛾	92.75	Parum colligata	88.60
Agrotis segetum	81.90	布雷默等灰色	89.81
瓢虫	95.82	巴特勒	97.66
地图			93.73

(一)正常状态

(b)背景干扰

(c)目标堆栈

(d)目标密集

3.4。比较几种模型

评估算法的性能,本文与yolov3相比,yolov3算法采用Darknet-53为骨干的功能网络,它使用原始EfficientNet-B2,相比之下,最后,在该算法的基础上更换不同的轻量级的支柱,如谷歌MobileNet [31日,32ShuffleNet[]系列,更轻巧33,34)和华为GhostNet (35),这些都是轻量级的分类网络。相同的训练集用于实验,最后,使用相同的测试集测试评价。最后,模型是部署在工业平板电脑,其CPU采用J1900处理器、4 gb的内存,运行和测试模型的推理速度,和结果如表所示4。我们可以看到,yolov3模型具有较高的精度,但参与者的数量可以达到6000万,模型的推理是耗时最长,高性能的设备要求,不方便实用的部署,并使用一个轻量级的支柱,我们可以看到,ShuffleNet参数很小,这个模型只有36 MB,检测速度也是最快的,但是该模型精度最低。与MobileNet系列和GhostNet相比,显式GhostNet的综合性能是最好的,只有42 MB的体积大小,精度可达82%,和检测速度可以达到每秒两张照片,具有良好的及时性。虽然这些模型很小,精度不符合商业标准。对于这个算法与EfficientNet-B2相比,准确率可以达到93%,提高了几乎5百分点,和算法只有四分之一的体积超过GhostNet;这个算法具有轻质、高性特征。


模型	地图(%)	速度(年代)	参数(百万)	大小(MB)

Yolov3	89.71	1.90	61.66	235.21
ShuffleNet-yolo	75.71	0.42	9.60	36.60
MobileNetv1-yolo	84.66	0.60	12.40	47.31
MobileNetv2-yolo MobileNetv3-yolo	81.65 81.93	0.63 0.54	10.51 11.13	40.09 43.63
GhostNet-yolo	82.49	0.53	11.14	42.49
EfficientNet-yolo	88.16	0.69	15.12	59.23
我们的模型	93.73	0.72	15.66	59.78

4所示。结论

为了实现自动识别和分类的农田害虫,一个轻量级的目标探测模型提出了。基于yolov3的想法,EfficientNet-B2分类网络作为主要特征提取网络和改进。PANet添加到脖子,意识作为损失函数的目标探测突出预测框之间的相对位置,真正的盒子。信心不足的问题预测框过滤由于目标框的重叠,避免和预测盒。焦损失函数是用来解决不平衡正负样本在训练。为了提高数据集的多样性,马赛克数据增强方法是用来增加数据的多样性,提高模型的鲁棒性。实验表明,该算法的映射值可以达到93%的准确率,而且具有良好的识别能力。该算法在复杂环境中也有较强的识别能力。与其他算法相比,该算法不仅认识到各种各样的类也具有较高的精度和广泛的应用。

数据可用性

使用的实验数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称,关于这项工作他们没有利益冲突。

确认

这项工作是支持的主要农业应用山东省技术创新项目。项目号码是SD2019ZZ007。

引用

摄影h .刘”,推动农业现代化与农业加快现代农业的数字转换,“中国农业资源和区域规划,40卷,2019年。视图:谷歌学术搜索
彭y, y杨、w·杨和陈,“智能农业管理系统的设计基于物联网技术,”现代农业科技,4卷,不。19日,2020年。视图:谷歌学术搜索
j .聂r .太阳,邓x”的不确定的复杂事件处理基于数据沿袭精准农业管理”中国农业机械学会的事务卷,47号5,245 - 253年,2016页。视图:谷歌学术搜索
h·冯和问:姚明,“自动识别和监测技术的农业害虫,”植物保护,44卷,不。5,2018。视图:谷歌学术搜索
x Shi, m .赵、h·李和z,“玉米害虫识别系统研究基于图像处理,”农业和技术第41卷。。12日,28-31,2021页。视图:谷歌学术搜索
y沈,研究类似物害虫检测算法基于深度学习,硕士论文,北京邮电大学,2018年。
张y、m .江和p . Yu”农业害虫图像识别方法基于特征融合和稀疏表示,“中国农业科学,51卷,不。11日,第76 - 67页,2018年。视图:谷歌学术搜索
d . w . Liu Anguelov, d . Erhan“SSD:单身multibox探测器拍摄,”在Proc。欧洲计算机视觉页21-37 Springer,可汗,2016年。视图:谷歌学术搜索
任,k .他和r . Girshick“快R-CNN:对与地区建议网络实时目标检测,”IEEE模式分析与机器智能,39卷,不。6,1137 - 1149年,2017页。视图:出版商的网站|谷歌学术搜索
j . Redmon s Divvala r . Girshick,“你只看一次:统一、实时检测,”Proc。《IEEE计算机视觉与模式识别会议拉斯维加斯,页779 - 788年,美国,2016年。视图:谷歌学术搜索
x周,d . Wang和p . Krahenbuhl对象作为分,2019,https://arxiv.org/abs/1904.07850。
y, b . i Xiu-Li,肖,”农业害虫检测方法基于区域卷积神经网络”计算机科学,45卷,不。11,226 - 229年,2018页。视图:谷歌学术搜索
严y z元,h .元,刘,和美国田,“自动识别和分类算法基于轻量级深度学习模型领域的昆虫,”吉林大学学报(工程技术版),51卷,不。3、1131 - 1139年,2021页。视图:谷歌学术搜索
w·一个l .赵、张x和y汉,“物候预测和预测果园在保定地区的主要害虫,”现代农村的科学和技术,12卷,不。3,36 - 37,2020页。视图:谷歌学术搜索
x刘,研究基于深度学习的轻量级昆虫检测模型,论文的事宜,北京林业大学,2019。
m . Everingham l . v .干傻事,c·k·威廉姆斯,“帕斯卡的视觉对象类(voc)的挑战,”国际计算机视觉杂志》上,卷88,不。2、303 - 338年,2010页。视图:出版商的网站|谷歌学术搜索
高y, b .周,x,“卷积神经网络图像识别研究基于数据增强,”计算机技术与发展,28卷,不。8,62 - 65年,2021页。视图:谷歌学术搜索
j .兴m .贾、f .徐和j .胡锦涛,“小缺陷的识别方法在工件表面基于减少混合和YOLOv3(英语),“东南大学学报(英文版),37卷,不。2、128 - 136年,2021页。视图:谷歌学术搜索
k . Simonyan和a . Zisserman”很深的卷积网络大规模图像识别,”计算机科学,2014,https://arxiv.org/abs/1409.1556v6。视图:谷歌学术搜索
k .他x张任美国,“深残余学习图像识别,”Proc诉讼的IEEE计算机视觉与模式识别会议拉斯维加斯,页770 - 778年,美国,2016年。视图:谷歌学术搜索
g .黄、刘z和l . Van Der Maaten“人口卷积网络,连接,”Proc。《IEEE计算机视觉与模式识别会议美国夏威夷,页4700 - 4708,,2017。视图:谷歌学术搜索
t . y .林、p .美元和r . Girshick“特性为目标检测金字塔网络,”Proc。2017年IEEE计算机视觉与模式识别会议(CVPR), IEEE计算机协会,夏威夷,2017年SA。视图:谷歌学术搜索
l . s . Liu气,h .秦“路径聚合网络例如分割,”Proc。《IEEE计算机视觉与模式识别会议8768年,页8759 - 2018年美国盐湖城。视图:谷歌学术搜索
r . m . Tan彭日成,诉勒,“Efficientdet:可伸缩的和有效的目标检测,”Proc。《IEEE / CVF计算机视觉与模式识别会议美国西雅图,页10781 - 10790,2020。视图:谷歌学术搜索
h .法律和j .邓“CornerNet:检测对象作为搭配要点,”国际计算机视觉杂志》上,卷128,不。3、642 - 656年,2020页。视图:出版商的网站|谷歌学术搜索
m . Tan和问:“Efficientnet:反思为卷积神经网络模型扩展,”在Proc。机器学习国际会议PMLR, 6114,页6105 - 2019。视图:谷歌学术搜索
a·g·霍华德·m·朱、陈,“Mobilenets:高效移动视觉卷积神经网络应用程序,”2017年,ar十四预印本ar十四:1704.04861。视图:谷歌学术搜索
汗,m . Naseer和m .是“变形金刚在愿景:一项调查,”2021年,ar十四预印本ar十四:2101.01169。视图:谷歌学术搜索
z郑,p . Wang, d .任“提高几何因素模型的学习和推理对象分割检测和实例,”2020年,ar十四预印本ar十四:2005.03572。视图:谷歌学术搜索
t . y .林、p . Goyal和r . Girshick“焦损失密集的对象检测,”Proc。IEEE计算机视觉国际会议的程序美国夏威夷,页2980 - 2988,,2017。视图:谷歌学术搜索
答:霍华德,a Zhmoginov l·陈,“倒残差和线性瓶颈:移动网络分类,“检测和分割,2018,https://arxiv.org/abs/1801.04381v2。视图:谷歌学术搜索
a .霍华德·m·桑德勒,g .楚,“寻找mobilenetv 3”Proc。《IEEE / CVF计算机视觉国际会议长滩,页1314 - 1324年,美国,2019年。视图:谷歌学术搜索
张x, x周和m .林”Shufflenet:卷积神经网络在移动设备上非常有效,”Proc。《IEEE计算机视觉与模式识别会议6856年,页6848 - 2018年美国盐湖城。视图:谷歌学术搜索
n .马张x h .郑,洗净V2:实用高效的CNN建筑设计指南Proc。Springer,可汗。施普林格,可汗,2018。
k .汉y王,问:田,“Ghostnet:从廉价的操作,更多的功能”Proc。《IEEE / CVF计算机视觉与模式识别会议美国西雅图,页1580 - 1589,2020。视图:谷歌学术搜索

无线通信和移动计算

物联网在多媒体通信系统

文摘

1。介绍

2.1。图像处理

2.2。目标检测算法

2.3。模型结构

2.4。损失函数

3所示。结果与讨论

3.1。实验环境

3.2。评估标准

3.3。结果和分析

3.4。比较几种模型

4所示。结论

数据可用性

的利益冲突

确认

引用

版权

相关文章

无线通信和移动计算

物联网在多媒体通信系统

轻量级自动识别和位置检测模型的农田害虫

文摘

1。介绍

2。相关工作

2.1。图像处理

2.2。目标检测算法

2.3。模型结构

2.4。损失函数

3所示。结果与讨论

3.1。实验环境

3.2。评估标准

3.3。结果和分析

3.4。比较几种模型

4所示。结论

数据可用性

的利益冲突

确认

引用

版权

更多相关文章

相关文章