文摘

领导/后缘的自适应加工制备刀片,一小部分的理论部分,叫做重建区域,保留通过手动工作来保护空气动力性能。接下来的工作是认识到重建区域的重建主要/后缘的形象。加速这个过程,一个anchor-free神经网络模型提出了基于变压器,名叫领先后缘/变压器(让)。让从一个方面提取图像特征的混合频率和信道域。我们还整合让最新meta-Acon激活函数。我们测试了我们的模型在白手起家的数据集LDEG2021地图上一个GPU和有一个91.9%,超过我们的基线模型,变形DETR, 1.1%。此外,我们修改后让卷积图层,命名为新模型鬼领先后缘/变压器(GLETR)作为一个轻量级模型实时检测。这是证明GLETR重量参数少,收敛速度比让地图一个可接受的减少(0.1%)的测试结果。该模型提供了后续参数提取的基础在重建工作区域。

1。介绍

将叶片制备应用于航空发动机的叶片,因为它符合现代航空发动机性能更好。制备的空白材料和典型结构叶片数据所示1(一)1 (b),分别。提出了一种叶片的节曲线在图2。制备叶片的几何参数的吸/压力表面满足设计要求后被伪造的,这意味着它不需要进一步的加工,而领先/后缘无法伪造正是由于大幅改变曲率。另一方面,尽管空白材料锻造设计公差内复杂变形仍然发生(1]。这意味着我们不能根据设计计划工具路径模型。因此,我们需要重建理论领先/后缘。在这种情况下,自适应加工(2是进口的加工过程制备叶片。自适应加工技术旨在修改生产数据的基础上变化的条件。在我们之前的手工工作,我们保留的一部分理论领先/后缘和弥合它空白的材料考虑的设计意图和气动性能。重建的叶片的节曲线如图3。然而,这个过程是费时的,取决于人类的经验。深度学习尖端优势提高效率,避免人为错误,在此基础上我们提出了一个模型重建框架(3]。

与传统的基于几何的重建方法预测,我们重建模型的基础上,完成了存储在图像重建。我们的方法可以在以下步骤中进行描述。在第一阶段,我们使用生成对抗网络(GAN) [4]分类最优重构领先/落后于边缘的图像基于我们之前的手工作品3]。然而,在图像重建曲线不能采用计算机辅助设计(CAD)软件直接模型重建。所以,我们需要检测的保留部分和桥接曲线重建曲线下一步。第三,我们将从他们中提取参数信息。只要获得这些参数,我们可以利用CAD软件调整理论领先/后缘和重建它自动实现自适应加工制备的叶片。本文的主要重点是检测保留理论领先/后缘的一部分,我们使用项目“重建区”来表示它。

一个小对象通常包含少量的语义信息由于其小尺寸。如图3相比,与普通对象检测任务,没有复杂的功能领先/后缘的形象。此外,领导/后缘的形象包含语义信息更少,,背景是相对简单的。出于这个原因,领导/后缘的重建区域检测的定义是一个小物体检测任务,和重建区域的面积来近似边界框。

目标检测的性能有显著提高的帮助下卷积神经网络(cnn) [5),检测对象从大量的数据中提取特征。一般来说,目标检测算法采用cnn分为两阶段方法和单程方法根据他们的处理阶段。两阶段的典型方法是CNN的区域特性(R-CNN)系列6- - - - - -8),进口选择性搜索算法来预测该地区的利益。与两阶段方法,单程方法预测边界框和类在一个单一的神经网络。有症状的单程方法包括你只看一次(YOLO)意思系列(9- - - - - -12),单发Multibox检测器(SSD) [13]。

上面提到的方法有三个点需要进一步改善。首先,锚箱大小需要手动设计为不同的检测任务,这需要花费大量的时间。此外,小物体的真实大小的边框是相对较小,这可能会导致类不平衡问题14]。此外,nonmaximum抑制(NMS)算法是不敏感的小物体含有更少的语义信息。网络的预测的数量远远大于实际的对象的数量,NMS是雇佣来去除多余的预测边界框。NMS算法设置一个阈值和删除所有边界框高于阈值并保持与得分最高的边界框。NMS的后处理的小目标检测背景往往是阻碍,和小目标很容易被大、中型大小的对象。

考虑到变量的形状主要/后缘,我们决定把一个anchor-free模型作为主要/后边缘检测器,它抛弃了锚和NMS的后处理算法。近年来,变压器在目标检测领域已经显示出它的优越性由于其空间关系建模能力的目标。变压器的模型效果最好现在是变形DETR(变形检测变压器)15]。然而,变形DETR有它的问题。首先,变形DETR从输入图像中提取特征基于空间注意机制。这意味着放弃了在这个过程中一些有价值的信息。它的准确性,因此,仍然是一个巨大的提升空间。然后,尽管变形DETR取得了突出成果,它仍然需要进一步压缩,以满足实时检测的要求。关注这两个上述问题,本研究的主要工作总结如下:(1)我们提出一个anchor-free模型名为领先/落后于边缘检测变压器(让)。让从频道混合域提取特征重建领域。此外,让激活动态非线性单元的单一数据集的背景(2)平衡模型重量和性能,我们介绍了一个轻量级模型通过修改让实时检测。从技术上讲,让取而代之的是轻量级的具体卷积层模块。模型被称为鬼领先/落后于边缘检测变压器(GLETR)。(3)我们测试了让和GLETR LDEG2021白手起家的数据集。这是证明,让先进的性能检测重建领域。此外,GELTR大大参数少,收敛速度比让培训过程中

本文的其余部分的结构如下。部分2说明了近期作品重建的边缘形状自适应加工对象检测。部分3综述了在计算机视觉注意机制。我们建议的模型提出了部分4。部分5白手起家的数据集上的实验结果报告。部分6给出了结论和未来的工作。将可用的代码https://github.com/andrewsilver1997/LETR

我们的研究是自适应加工和计算机视觉算法的结合。在本节中,我们将讨论有关工作方面的边缘形状重建、小目标检测,self-attention机制,激活功能,高效的网络。

2.1。重建的边缘形状

普遍的模型重建方法可以得出在三个方面:拟合曲线的测量数据,预测叶片表面的变形,预测设计意图。我们的重建工作主要是根据设计意图和空白材料的变形。类似原始构造对应的模型根据现有数据重建的边缘形状的过程。一些代表性的研究说明如下。Yun et al。16)进口参数化设计自由变形(FFD)和实现模型基于测量数据的重建。赵et al。17)重建的准确性提高了插入节。冯et al。2]预测所需的样条曲线考虑空白材料的变形和厚度,同时保留设计意图。Yu et al。18)建立之间的关系分和速度场测量叶片的部分。进一步,他们没有测量数据计算区域的曲线。Zhang et al。19认为弦长度的约束,在重建过程中攻角和半径。吴et al。20.)提出了一个新颖的重建算法通过删除坏点测量和优化迭代最近点(ICP)算法。然而,当前研究大型曲率的建模不精确的拟合形成区域主要集中在简单的几何元素,但不充分考虑叶片的设计意图之间的关系,实际的叶片表面之间的相似关系和理论表面,和空白的复杂变形材料。我们之前的手工作品在一定程度上解决上述问题[3]。对于本文,我们基于深度学习的进一步提出了一个算法来加速这个过程,减少错误造成的人类经验。

2.2。小目标检测

它通常是一个小的一部分理论模型,在图像语义信息较少。因此,重建区域的检测可以被视为一个小目标检测的任务。一些模型的基础上,提出了两阶段的方法来检测小对象。基于速度R-CNN [7),辛格和戴维斯21)提出了尺度归一化的图像金字塔(剪)小目标检测。进而,他们剪断并提出修改狙击手22)高效和快速检测。Zhang et al。23)利用多尺度特征融合层(漏),和一定程度上的改进。另一方面,一个典型的单程探测器RetinaNet [14),它使用焦损失和特征金字塔地图(24检测小物体。基于YOLO v2意思,刘等人的作品。25)可以检测arbitrary-oriented小尺寸的目标。

一些研究者提出anchor-free方法。代表作品包括CornerNet [26],ExtremeNet [27],CenterNets [28,29日]。通过实施关键点估计这些模型检测对象。一些小说作品旨在解决问题的传统的NMS算法出版。董et al。30.)集成传输更快学习RCNN注释和提高准确性。Cai和塞·伐斯冈萨雷斯(他31日提出了级联RCNN。级联RCNN连接序列NMS的探测器和适应阈值处理,以避免预测真实边界框和对象之间的不匹配。我们的模型丢弃锚箱和NMS后处理。实验验证了我们的模型控制中存在模型没有锚箱的帮助和NMS算法。

2.3。计算机视觉中的Self-Attention机制

近年来,自然语言处理的进展32](NLP)领导的研究人员在计算机视觉中的应用进行调查。Vaswani et al。33]介绍了变压器在NLP首次。变压器达到令人印象深刻的结果序列的预测。Carion et al。34)修改了变压器和命名他们的模型检测变压器(DETR)。DETR模型放弃锚箱和NMS的实现。然而,DETR收敛速度低和不执行在小目标检测的任务。太阳et al。35]认为DETR cross-attention模块是没有必要的,并提出了两个模型比起命名的基于变压器组预测与外交部(36比起](TSP-FCOS)的基于变压器设置预测R-CNN (TSP-RCNN),分别。朱et al。15)进口变形卷积(37DETR并提出变形DETR]。变形DETR从空间域处理输入特征图。在这项研究中,我们试图从另一个方面提取特征,即混合域频率和通道。

2.4。激活功能

一些研究人员试图修改中的激活函数网络和在一定程度上得到了改善。最常用的激活函数修正线性单元(ReLU) [38)激活神经元线性当输入大于0的。它的变体,漏水的ReLU [39),激活神经元非零输入时。ReLU-based激活功能太简单复杂的视觉任务实现一些功能可能会有遗漏。Sigmoid-weighted线性单元(思路)40]ReLU和乙状结肠功能结合在一起。与ReLU相比,它是光滑的和非单调。(41)应用自动搜索各种各样的激活函数,发现一个更好的函数命名的嗖嗖声。但它也带来了巨大的计算资源消耗。(42)进口空间上下文激活函数和密集的视觉任务获得先进的性能。最近的一份工作是称为动态修正线性单元(DY-ReLU) [43由一个机能亢进)动态地调整参数。当深神经元网络实现,然而,上述激活函数的影响变得较弱。与之前的激活函数,是否激活函数(Acon) [44)学习是否激活特定的神经元和模型转换成动态网络,将网络更深更好的性能。

2.5。高效的网络

在移动设备上部署目标检测模型,对轻量化是不可避免的一些操作节约计算成本和记忆。有两种类型的策略有效的网络。一个是压缩模型通过修剪冗余连接(45和渠道46),量化47蒸馏[],和知识48]。这种模型压缩方法通常需要设计良好的架构和pretrained模型。另一个策略是直接设计一个轻量级模型(49]。研究人员提出的一些典型的轻量级模型。Xception [50]介绍了切除分离卷积模块用更少的模型参数,实现更好的性能。MobileNet系列(51- - - - - -53),例如,基于深度方面和逐点可分离旋转以及自动化机器学习(AutoML)技术54]。其他著名的轻量级模型ShuffleNet [55,56系列,其内部通道信息交换,以减少计算成本。的冗余特征图还没有解决好。GhostNet [49),相反,利用这些冗余的特征图谱,并与先前的轻量级模型相比更优良的性能。我们集成让GhostNet和GLETR提出。的更多细节GLETR节4

3所示。回顾可变形的关注

3.1。Self-Attention机制

使用self-attention DETR是一个成功的目标检测模型机制,实现出色的性能在可可数据集(57]。在本部分中,我们简要地回顾了DETR的内在机制。

3.1.1。多线程的关注

在自然语言处理领域,self-attention机制采用的变压器模型。通过计算的值 , 的输入图像,每个像素的变压器调节的兼容性。在多线程机制,注意一些关注正面聚合线性的输出可学的重量参数。考虑到 的输入特性 的输入特性 ,在哪里 , , 高度,宽度,和通道的输入图像,多线程的配方注意显示为:

在方程(1), 的元素 集, 是关注的数量, 注意体重,在哪里 的变换矩阵吗 , ,分别为, 变换矩阵的 请注意, , , , 的参数都是可学的。

3.1.2。位置嵌入

DETR采用位置嵌入提取的特征。这是由于变压器要求信息的相对或绝对位置像素的特征图谱。在DETR,正弦和余弦函数是用来表示不同的像素的位置。嵌入的位置方程写为: 在哪里 表示位置和 维度指数; 代表输入的通道尺寸特性。

3.1.3。匹配损失

不同于以往的目标检测模型使用NMS, DETR输出固定 预测和 远远大于图像中对象的数量。DETR需要分配预测对象在图像,介绍了评估和匹配损失这一过程。假设 是真实的边界框, 是一组和指数预测边界框吗 ,最优排列 写为: 在哪里 代表预测对象的排列。最后,比赛的损失 被定义为:

尽管这一事实DETR取得了最先进的性能,成本巨大的计算资源,其收敛速度相对较低。此外,DETR在小目标数据集的性能是令人失望的。此外,DETR目前的测试结果没有杰出的表现我们的检测任务。因此,它是证明DETR不适合我们的检测任务。

3.2。可变形的关注

DETR没有执行好小目标探测任务,由于其内在机制。朱et al。15)结合DETR变形卷积和命名他们的模型变形DETR self-attention所生成图像在图像域可变形的关注。可变形的特性计算的注意:

表示采样键, 意味着采样键的数量。 表示参考点 是采样偏移量。

在小目标检测的任务,从小型到大型对象的大小尺寸。适应的多尺度大小输入功能,可变形的注意力产生多尺度变形的关注和可以计算: 在哪里 采样点的坐标是标准化的, 索引输入特征图的水平。 代表关注体重和抵消的抽样 分别输入特性图。 函数重新调节 根据 输入特征映射。

变形DETR加快其收敛性和使进展小目标数据集。对我们的领导/后缘重建区域检测任务,然而,变形DETR的性能可以进一步改进与以前相比使用锚箱和NMS探测器。

4所示。让和GLETR

4.1。让的概述

如图4,我们的模型采用了最先进的方法实现小目标检测。频道混合骨干(我们叫它FcaAconNet)提取特征使用金字塔的脖子。然后是金字塔形状的特征图谱被发送到可变形的变压器编码和解码。前馈网络配置为输出预测类和位置。我们适应变形编码器的配置,可变形的解码器,预测网络(15]。

4.2。特征提取

从技术上讲,骨干负责在输入图像中提取特征图。以前的神经网络模型输出single-scale特性图。然而,重建数据集不同地区在不同的大小。因此,我们采用了金字塔架构可变形多尺度对象DETR检测。此外,受FcaNet [58),我们进口FcaNet的多光谱通道注意模块模型的特征提取过程的脊背。图中演示了使用模块的细节5

假设输入的维数特征 ,多光谱通道注意模块的帮助下将输入特征转换成频域二维离散余弦变换(2 d DCT)。由方程(2 d DCT7): 在哪里 是输入图像, ,

在FcaAconNet,特征提取过程说明如下。首先,输入功能 被划分为 部分根据通道。这个过程可以表示为:

接下来, 一个给定的输入的频率特性 由以下公式计算。 表示2 d DCT操作。

因此,通过连接 ,我们有最终的频率特性 输入的特征:

最后,混合的注意频道域是由以下公式计算: 在哪里 是乙状结肠函数和 是一个完全连接层。通过重新调节 ,多光谱通道注意模块的输出,表示 ,计算为:

混合频率和信道权重应用于多光谱通道后的输入特征图注意模块。在这种方法中,足够的频率和信道信息是利用我们的骨干,和准确性在深层神经网络逐渐增强。

4.3。激活函数

在神经网络的体系结构中,在导入非线性激活函数起着关键作用,提高模型的分类能力。考虑到前景和背景之间的巨大差异我们的任务,我们使用Acon函数因其优异的控制非线性激活的程度的能力。换句话说,通过学习是否激活,输入在多大程度上被激活时,该模型过滤一些令人不安的信息。更具体地说,Acon功能分为三种类型:Acon-A Acon-B, Acon-C。Acon-A和Acon-B Acon-C的特殊情况。据马et al。44,meta-Acon Acon-C的变异,表现出最好的性能测试。因此,我们采用它作为我们的激活函数。在这里,我们给Acon-C和meta-Acon的定义。

首先,我们使用一个函数 近似的最大功能 : 在哪里 是转换的因素。接下来,我们考虑的情况 在神经网络。在这种情况下, degenerizes以下格式:

是乙状结肠函数, 代表的线性函数。考虑更一般的情况 ,Acon-C写成:

并进而,我们看到 作为一个可学的网络 可以生成 ,这是计算为:

我们取代了前两个ReLU函数与在每个meta-Acon瓶颈的原始FcaNet避免过度拟合,提出FcaAconNet。相对实验部分4

如图6(一)所示,卷积操作生成大量的输出特征图谱包含一定程度的冗余。汉等人证明了一些相似的特征图谱存在冗余和认为,这些多余的特征图谱的鬼魂内在特征图。因此,他们生成的内在特征图谱主要卷积和获得鬼功能通过一个线性操作,减少模型的复杂性。整个过程描述如下。

4.4。鬼模块

如果我们使用 代表输入特性图,输出 卷积后一般被定义为: 在哪里 分别表示卷积运算和偏见 是卷积算子。然而,在鬼模块的第一阶段, 取而代之的是一个新的操作符 和偏见是取消降低模型复杂度。因此,输出 鬼模块的第一阶段的表示为:

在第二阶段中,鬼魂模块实现一系列的线性运算输出 匹配的尺寸的原始输出通道 鬼的线性运算模块是写成: 在哪里 内在特性图, 代表了 线性操作, 是地图生成的鬼魂特性。

鬼模块的细节描绘在图6 (b)。地图输出的一些固有特性之前的卷积层在第一阶段。接下来,通过线性操作,我们上面提到的,大量的鬼特征图。最后,内在特征图和相应的“鬼”是连接根据频道维度。在实践中,鬼魂的内在连接模块如图6 (c)。线性卷积操作是由一个层。从技术上讲,我们更换了所有卷积与鬼模块层FcaAconNet的瓶颈,我们称为FcaAconNet骨干Ghost-FcaAconNet鬼模块。

5。实验

5.1。数据集

我们LDEG2021检测重建区域的主要和后缘。整个图像的LDEG2021节曲线的多个大小不同的前导和尾随的重建区域的边缘不同叶片的不同高度。这些图片是截图的国标库NX 7.5 (UG)软件。LDEG2021有397图片注释有两类:前缘和后缘。两个选定的样品和相应的字幕LDEG2021图所示7。我们用不同的颜色区分不同的曲线。红色曲线数据7(一)7 (b)曲线桥的重建主要/后缘。和深红色曲线表示重建领域的前缘。另一方面,梅曲线重建领域的后缘。凸,凹的部分行面临了紫色和黄色。

重建地区不同大小不同。因此,我们应用缩放和旋转的模型重建领域。这样,一些截图的重建地区不再在实际大小。我们需要注意,这个过程是培养检测shape-varied重建领域的能力。在图8,我们也给了其他LDEG2021数据集的例子。数据8(一个)- - - - - -8 (c)目前的图像重建的前缘。数据8 (d)- - - - - -8 (f)重建后的图像边缘。在本文中,我们的目标是培养一个高性能模型可以发现一定数量的同时重建领域。这就解释了为什么有超过一个领先/后缘在一个图像。同样值得注意的是,一些重叠的现象发生在数据8 (b)8 (e)。这是由于这样的事实:这些图像从不同的角度给出了在UG中。LDEG2021数据集将在开源https://github.com/andrewsilver1997/LDEG2021

5.2。数据增加

一般来说,神经网络模型得到更好的性能,当数据集的规模变大。图像的数量LDED2021,不过,是有限的。我们应用的数据扩增方法包括随机翻转,随机裁剪,调整。培训过程进行了Intel Xeon e5的CPU - 2678 V3和单一的Nvidia GPU RTX 2080 ti。我们使用MMDetection对象检测工具箱(59与Pytorch 1.5.1), cuDNN 7.6.1, CUDA 10.1实现。批处理大小和学习速率设置为2 首先,分别。学习速率的下降 在40培训时代。此外,我们选择adamW作为优化器。

5.3。结果和讨论
5.3.1。评价指标

真阳性(TP),假阳性(FP),假阴性(FN),和真正的负面的评价(TN)通常需要一个模型的性能。表1显示他们的定义混淆矩阵。

我们利用precision-recall曲线(中华人民共和国)和地图(平均平均精度)对该方法的性能进行评估。首先,我们给精度和召回的定义:

一般来说,一个好的目标检测模型应该提高其精度和召回保持在一个相对较高的水平。

美联社(平均精度)代表模型的性能检测到一个特定类的对象。美联社定义在 在哪里 很短的精度和召回。地图(平均平均精度)的定义是所有类的平均值的美联社。计算了 在哪里 美联社的价值吗 类和 表明所有类的总数。映射模型的整体性能的措施。换句话说,地图是越高,模型精度越高。我们实现的其他指标模型重量和培训小时,衡量重量的数量参数和收敛速度。

5.3.2。结果LDEG2021数据集

数据9(一个)9 (b)的中华人民共和国曲线变形DETRs ResNet50和ResNet101骨干,让,GLETR。变形的表演DETRs ResNet50和ResNet101时几乎相同的检测重建领域的前沿。保持相同的回忆,让的精度值和GLETR高于变形DETRs。检测时的性能增强的后缘的重建区域是不明显的,如图9 (b)。值得注意的是,后缘重建区域的形状没有前缘等巨大差异的重建领域。此外,保留后缘重建的理论部分地区相对比的前缘的重建领域。这就解释了为什么在图的改进9 (b)是不明显的。但即使在图的改进9 (b)不清楚,让GLETR仍然显示类似的性能。我们将给出一个更详细的说明在以下检测结果的讨论。这三个模型的收敛曲线呈现在图10。变形DETR ResNet50骨干50时代才收敛和地图是90.6%。的变形DETR ResNet101骨干没有显示显著差异与变形与ResNet50 DETR。另一方面,让,实现更高的地图,尽管其训练时间更长。GLETR有收敛速度最快(不到40时代)和地图是91.8%。

2说明了测试的结果。与变形DETR相比,让实现更好的性能提升了1.1%的地图。另一方面,GLETR模型重量降低了121.2 MB的轻微减少地图(0.1%)。值得注意的是,一个单一的GPU上的结果。我们相信我们的模型的性能的改善更明显在多个gpu具有更高的计算精度和速度。

数据(11日)11 (b)显示不同的组件对中国的影响曲线。符号“+”表示设计组件模型的数量。如图(11日)所示,模型的性能检测时,前缘重建地区被引入FcaNet和MetaAcon增强。进口零部件的影响检测的重建区域后边缘稀松平常的。图12是与不同的组件模型的收敛曲线。培训时期的变形DETR骨干是FcaNet所取代一样变形DETR ResNet增加地图。导入MetaAcon函数之后,92年培训时代去。鬼模块会大大降低训练时期不到40和地图的下降是可以忍受的。

3给三个设计组件的让消融。如果我们使用ResNet为骨干,让退化变形DETR,地图是90.6%。使用FcaNet代替ResNet能提高0.6%的地图。接下来,取代ReLU meta-Acon激活函数可以有效改善地图0.7%。通过导入鬼模块,让降至424.4 MB的重量,和GLETR地图是91.8%,低于让。这种减少是可以接受的。更重要的是,培训小时降低鬼模块从8.5小时到3.5小时。因此,证明GLETR LDEG2021数据集上执行不如让更少的参数和更快的收敛速度,即使有微小的减少地图。

我们需要指出,重建主要/后缘的边缘形状是不同的。此外,重建前缘的形状从底部到顶部的刀片。在本节的其余部分,我们将讨论的性能让GLETR当检测重建领域的领先/落后于边缘和重建领域从不同高度的叶片前缘。

检测结果在不同的重建后缘中演示了数据1314。在图13、基线模型变形DETR检测到所有的目标,而一些检测对象被误诊。相反,让检测后缘的重建方面没有任何错误分类如图13 (c)。然而,GLETR错过两个目标即使检测到目标是正确地识别。

我们还展示了一个示例图14变形DETR未能检测到所有重建后缘和承认错误的目标。通过比较数据(14日)14 (b),我们知道只有一个目标是成功地检测到。意想不到的,变形DETR分类中的一些干扰背景重建领域的后缘。数据14 (c)14 (d)给让的检测结果和GLETR重建后缘。

测试让和GLETR性能检测重建地区的制备叶片的前缘,我们选择从底部原始图像,中间,和顶部区域的叶片LDEG2021和测试三种模式。检测结果顶部叶片的区域的图像如图所示14。重建曲线叶片的面积通常包含有限的重建领域。目标是相对较小的。图(15日)是这个地区的原始图像重建曲线。作为数据15 (b)- - - - - -15 (d)显示,变形DETR表现不好而让和GLETR认出这些小重建区域有高概率。让和GLETR发现所有四个目标没有错误。

对于叶片的中间区域,这个区域的重建曲线保留更多重建区域,如图(16日)。叶片的中间区域的检测结果给出了数据16 (b)- - - - - -16 (d)。这三个模型表现良好,没有错过重建区域。

叶片的底部区域的检测结果如图17。图(17日)表明在这个领域进一步加工的横截面相当密集,这意味着重建地区可能被对方。数据的测试结果17 (b)17 (c)说明变形DETR错过两个目标同时让错过了只有一个目标。然而,GLETR没有表现好,无视这个地区五个小重建领域。

从数据13- - - - - -17,它还可以概括的分类概率让高于变形DETR在大多数情况下。花药,GLETR的分类概率低于让和变形DETR由于进口鬼模块。

实验结果重建领域的领先和后缘证明让和GLETR性能优越。尽管如此,GLETR在检测密度和小目标的表现仍然需要改进,这是我们未来工作的重点之一。

测试的性能让和GLETR一般小物体检测任务,我们还进行了两个实验遥感数据集:RSOD [60和VHR-10访问量61年]。然而,这两种遥感数据集的结果不理想。由于不平衡数字不同类别的图像,我们遇到的长尾效应。我们计划解决这个问题通过应用更多的数据扩增方法,不仅随机翻转,裁剪和调整。

我们还想说,这篇文章还有一些后续工作完成。在图像重建领域的大小有很大的不同从他们的实际大小。因此,实际的大小和尺寸之间的对应图像的本质。在本文中,我们没有提供这样的信件。所以,值得探索如何重建区域图像的检测位置转移到现实世界的模型。

6。结论

旨在检测制备叶片的重建区域,提出了两个端到端和基于变形DETR anchor-free模型。实验结果表明,该模型具有更高的精度和更少的重量,分别。他们还提供强有力的支持我们的工作。本文的主要贡献是得出的结论如下:(1)我们优化的架构方面的变形DETR特征提取和激活函数。新模式让命名。让从一个频道混合域提取特征并激活动态非线性单元。白手起家的数据集上的测试结果LDEG2021超过1.3%的基线模型映射在一个单一的GPU(2)另一方面,我们进口的鬼魂模块让和提供了一个轻量级的模型,GLETR。与让相比,GLETR实现更快的收敛速度和更少的小模型的重量LDEG2021精度下降。这是证明GLETR有可能适用于实时检测(3)我们有能力获得重建区域的位置和面积的效率高,没有错误引起的人类经验运用让GLETR我们的任务。的位置和面积,我们可以知道重构曲线的几何参数通过探索参数提取算法

让和GLETR是两个成功结合对象检测和自适应加工。然而,仍然有一些问题在这篇文章中,可以在未来调查:(1)GLETR缺点当检测叶片的底部区域的目标。这是由于物体相互覆盖,一些功能将被忽略的鬼魂模块。一个潜在的解决这个问题给网络更大尺寸的画面在培训过程中,位置和语义信息的增强(2)测试结果让和GLETR遥感数据集是不满意由于长尾效应。在这里,我们建议采用更多的数据增强算法来保持对象的类的数量平衡。一个有前途的方法是把图像,尤其是对减少图像的对象(3)我们需要提取图像的几何参数。在细节,下一步是找到之间的关系重建地区的每个像素的坐标及其相应的几何参数,如曲率和弦长

数据可用性

本文是在论文的数据。后的代码和数据集可以接受。

的利益冲突

作者宣称没有利益冲突,关于这篇文章的出版。

确认

这项工作是由中国国家科技重大项目(j2019 - 7 - 0001 - 0141),中国国家自然科学基金(51905441)和中国中央大学的基础研究基金(31020200506002)。作者真诚感谢所有匿名编辑和评论员的建设性的评论的手稿。这篇文章已经发表的预印本62年]。