摘要小说花anchor-based检测应用程序的方法,提出了结合注意机制在智能检测花花园AIoT更准确和快速。虽然许多研究人员重视花分类在现有的研究中,花检测在很大程度上被忽视的问题。我们列出了主要处理的问题研究的一个新的设计和花检测中的应用。首先,一个新的端到端花检测anchor-based方法插入网络的体系结构使它更宝贵的和快速的和损失函数和注意力机制引入我们的模型抑制不重要的功能。其次,我们的花检测算法可以集成到移动设备。显示我们花检测方法是非常可观的通过一系列的调查。检测精度的方法是类似于最先进的,在同一时间和检测速度更快。它使花卉在计算机视觉检测的主要贡献。
近年来,花卉的分类和检测已经相当兴趣的计算机视觉社区可应用于AIoT聪明的花园。聪明的花园的花可以自动设计和建议使它更美丽。以前的工作主要集中在花分类(
我们都知道,花检测已成为一个热点话题在对象检测自卷积神经网络在2012年世界重生。和主流花检测分为两类,单程检测器方法和两阶段检测器方法,基于锚定方法。锚的本质是候选人盒,设计不同尺度和比例,款进行分类。积极的锚可以学习如何返回到正确的地方,它扮演了一个角色,类似于滑动窗口机制在传统检测算法。近年来,许多研究人员执行花朵和水果的分类和基于卷积神经网络(CNN)的检测方法(
已经取得了很大的进步在花检测基于两阶段方法精度高。然而,认为需要增加的速度。
克服上述局限,考虑运行时间的速度,另一个单程花检测方法是证明。Redmon等人在2015年展示了YOLO单程意思探测器,将图像划分为几个区域,每个区域的边界框和概率预测。它具有检测速度快,有助于处理实时流媒体视频。与其他算法相比,如两级检测方法,它有一半尽可能多的假背景的获取上下文信息有效和强大的多功能性和泛化能力。然后,Redmon等人进行了一系列改进基于YOLO[意思
虽然已经取得了很大的进步在单程花检测和近年来已成为一种趋势,然而,获得丰富的图像信息和增强精度仍然是一个挑战。大部分的研究都集中在精度和速度;然而,很少有研究考虑对象的准确性提出速度检测。因此强调精度应符合探测器的速度在我们的方法。总之,花检测是基于单程工作方法;精度仍然是增强一点。
尽管当前anchor-based深度学习花检测方法工作得很好,他们仍然受到以下六个问题:(1)由于花朵的形状不规则,边界框覆盖大量的nonflower地区,造成很大的干扰。(2)锚的设置需要手工设计,和不同的需要设计不同的花的数据集,这是很麻烦的,不符合款的设计理念。(3)锚的匹配机制使得extreme scale的频率(非常大和非常小的对象)来匹配低于中等大小的物体。是不容易学好这些极端花样品款当学习。(4)大量的锚造成严重失衡。花(5)的未标记的数据集,它只可以训练花分类模型,它不能执行花在移动设备和AIoT检测。(6)标签数据集花消耗大量的时间和力量,因此大部分的人员无法注意花检测可应用于移动设备和AIoT。
为了克服上述局限,一个新对象检测方法基于新的anchor-based方法和new-labelled花采用数据集。获得更多的有用的信息和宝贵的图像中对象的位置,萨姆是利用注意力机制,地图频道关注模块的输出特性是作为这个模块的输入特性图。在我们的论文,我们可以把山姆注意机制应用到渠道和空间维度,它可以嵌入在大多数当前的主流网络和可以提高网络模型的特征提取能力没有显著增加的计算量和参数。基线数据集的数据集是牛津大学102年花,我们有标记数据集所有类别和所有标签和几何位置执行花在智能检测和其他植物检测花园。骨干网是CSPDarnet53网络,它被设计用来解决的以前的工作在推理过程中需要大量的计算从网络结构的角度。同时,SSP块添加在CSPDarknet53显著增加验收,提取最重要的上下文特征,并没有减缓网络运营。我们的贡献总结如下:
我们现在花检测方法,一个端到端的深卷积神经网络在AIoT花检测应用于智能花园。我们应用是CSPDarnet53网络的骨干网络,可以减少计算时确保准确性的梯度变化集成到特征图。和花的运行时间检测在我们使用的架构是最快最先进的模型与其他模型相比,尤其是集成到移动设备。为了提取最重要的上下文特征,也增加了接受,SSP块添加在骨干网网络运营。此外,萨姆是用来选择注意机制更为重要的信息从许多当前任务目标信息
我们贴上牛津102花与注释数据集包含102类别的花朵一般在英国,与每个类别包含40到258图片,总共8189张图片执行花检测。我们都知道,以前的工作很重视这个花与未经分类数据集。在我们的工作,花检测重视与注释花数据集可以训练我们的架构。也,花检测我们提出可以集成到移动设备,使其方便操作在一个聪明的花园,可以应用于插花,花卉园艺。更重要的是,它不仅可以提高用户的人机交互体验的插花,但节省时间和成本的园艺家。它已经初步意识到AIoT漂亮的花园的概念
本文组织如下。部分
花检测系统的体系结构如图所示
我们的花检测系统的体系结构。
我们的网络的体系结构如表所示
CSPDarknet53骨干网络的体系结构。
| 类型 | 过滤器 | 输出 |
|---|---|---|
| DarknetConv2D |
32 |
|
| ResBlock | 64年 |
|
|
|
128年 |
|
|
|
256年 |
|
|
|
512年 |
|
|
|
1024年 |
|
是研究CSPDarkNet53在目标检测的优势,更好的为骨干的测试模型。在CSPDarknet53 CSPDarknet53的参数图像分类是27.6米,比其他的神经网络,并接受域的大小也比神经网络更大。所以这是一个非常合适的骨干花为我们提出了检测方法。
此外,SSP块连接到CSPDarknet53骨干网络,它可以生成一个输出固定大小不管输入大小和可以使用不同尺寸的相同的图像作为输入池长度相同的特性。SPP放在最后卷积层时,它没有对网络结构的影响,取代原池层。不仅可以用于检测图像分类也为对象。当SSP块CSPDarknet53利用,它显著增加验收,提取最重要的上下文特征,并没有减缓网络运营。
此外,PANET [
YOLOv3 [
如图
牛津102花的数据集,其中包含102个类别的鲜花,可以用于图像分类的研究。
牛津102花在我们的工作中,数据集的标签不仅包含花分类执行检测中利用智能AIoT花园。如图
牛津大学102年花与注释的数据集,其中包含102个类别的鲜花,花可用于检测研究。
更多的培训数据会导致一个更合理的模型。如果有数据量有限,它可以利用数据增加增加训练样本的多样性,以增强模型的鲁棒性,避免过度拟合,提高模型的泛化能力。常用的方法包括翻转、旋转,转变,调整大小,随机作物或垫,颜色抖动和噪音。在我们的数据集,数据增强也用来提高我们的模型。
在我们的工作中,损失函数DIoU损失是我们使用的损失函数,这是可行的直接减少锚之间的归一化距离坐标系和目标坐标系实现更快的收敛速度和更准确和更快的重叠,甚至包括与目标框时回归。
DIoU损失是借据(十字路口在联盟)的基础上,考虑到信息中心的边界框的距离。它可以定义如下的定义,公式(
因此,GIoU可以改善借据的损失的情况下,不改变梯度不重叠边界框,它添加了一个惩罚项的基础上借据的损失函数。它被定义为下面的公式(
解决的局限性,介绍了DIoU可定义为公式(
此外,意识也提出我们的损失函数。意识损失函数有几个优点:(1)它可以增加之间的重叠区域地面真理盒和预测盒。(2)它可以最小化中心点之间的距离。(3)它可以保持定量框架高度一致。
意识可以定义为公式(
意识的损失函数可以定义为公式(
在我们的工作中,DIoU损失函数可以应用在NMS (Nonmaximum抑制)删除冗余检测盒。不仅重叠区域被认为是检测框之间的距离,和目标的中心点盒是考虑,可有效避免上述两个功能损失的错误。
激活函数是一个函数运行在神经元的神经网络,负责神经元的输入到输出的映射。它的功能是提高神经网络模型的非线性变化。在图
表示米什激活函数和它的性能:(a)米什激活函数;(b)比较不同的常用的激活。
在我们的架构中,米什(
它比漂亮的(更精确的和珍贵的
我们都知道,注意力机制已成为神经网络结构的重要组成部分,有大量的应用在自然语言处理等领域,统计学习,和计算机视觉领域的人工智能。深度学习的注意机制是类似于人类本质上的选择性视觉注意机制。核心目标是选择更重要的信息当前任务目标从众多的信息。
SE (
修改后的山姆架构。
我们描述我们的花的结果检测图
花检测的结果。
总之,似乎花检测基于最先进的方法是非常可观的。虽然被广泛接受,但由于花中有一些限制检测算法并没有被完全集成到移动设备来执行我们花的最终应用程序的结果检测来提高用户的人机交互体验在一个聪明的花园结合虚拟现实。这是一个倾向于花检测提出了我们的论文与虚拟现实相结合。在一个聪明的花园,可以意识到花可以安排智能不仅仅取决于人们在智能手机或其他移动设备。此外,智能园艺可以成真,可以减少人力和财务成本,它只依赖于人机交互。在未来的工作中,我们将支付重视它在我们未来的工作来完成这个目标。
我们使用的数据是可用的,这是叫牛津102花的一部分,他们可以访问和下载执行花分类研究和其他的实验。在我们的工作,我们的数据集是用注释标记基于这个数据集。所以用注释的一部分是可用的通讯作者要求(
作者宣称没有利益冲突的有关这项工作的研究和出版。
我们的工作是由中国国家自然科学基金,项目没有。:61503082,项目名称:研究大规模本体匹配的基于进化算法。