JSgydF4y2B一个 杂志上的传感器gydF4y2B一个 1687 - 7268gydF4y2B一个 1687 - 725 xgydF4y2B一个 HindawigydF4y2B一个 10.1155 / 2020/6707328gydF4y2B一个 6707328gydF4y2B一个 研究文章gydF4y2B一个 水下图像处理和基于深度CNN的目标检测方法gydF4y2B一个 汉gydF4y2B一个 风雷gydF4y2B一个 https://orcid.org/0000 - 0002 - 9582 - 2028gydF4y2B一个 姚gydF4y2B一个 JingzhenggydF4y2B一个 朱gydF4y2B一个 海涛gydF4y2B一个 王gydF4y2B一个 春晖gydF4y2B一个 VilanovagydF4y2B一个 泽维尔gydF4y2B一个 船舶工程学院gydF4y2B一个 哈尔滨工程大学gydF4y2B一个 南通大街145号gydF4y2B一个 南岗区区gydF4y2B一个 哈尔滨gydF4y2B一个 黑龙江省150001年gydF4y2B一个 中国gydF4y2B一个 hrbeu.edu.cngydF4y2B一个 2020年gydF4y2B一个 22gydF4y2B一个 5gydF4y2B一个 2020年gydF4y2B一个 2020年gydF4y2B一个 18gydF4y2B一个 1gydF4y2B一个 2020年gydF4y2B一个 17gydF4y2B一个 2gydF4y2B一个 2020年gydF4y2B一个 6gydF4y2B一个 5gydF4y2B一个 2020年gydF4y2B一个 22gydF4y2B一个 5gydF4y2B一个 2020年gydF4y2B一个 2020年gydF4y2B一个 版权©2020风雷汉et al。gydF4y2B一个 这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。gydF4y2B一个

由于水下勘探的重要性在深海资源的开发和利用,水下自主操作越来越重要,以避免危险的高压深海环境。为水下自主操作,智能计算机视觉是最重要的技术。在水下环境中,弱照明和低质量的图像增强,作为一个预处理过程,对于水下视觉是必要的。本文结合max-RGB法和灰色阴影法应用于实现增强水下视觉,然后是CNN(卷积神经网络)方法求解水下图像的弱照明问题提出了培养获得照明映射的映射关系。图像处理之后,提出了深CNN方法执行水下检测和分类,根据水下视觉的特点,应用两个改进方案修改深CNN结构。在第一个方案中,agydF4y2B一个 1gydF4y2B一个 ∗gydF4y2B一个 1gydF4y2B一个 卷积核的使用gydF4y2B一个 26gydF4y2B一个 ∗gydF4y2B一个 26gydF4y2B一个 特性映射,然后将采样层添加到调整输出等于gydF4y2B一个 13gydF4y2B一个 ∗gydF4y2B一个 13gydF4y2B一个 。添加在第二个方案中,将采样层首先,然后是卷积网络中插入层,结果是结合最后输出来实现检测。RCNN RCNN通过比较快,快,和原始YOLO V3意思,方案2是验证更好探测水下物体。检测速度是大约50帧(帧每秒),和地图(平均平均精度约为90%。应用程序在一个水下机器人;实时检测结果表明,该检测和分类不够准确、快捷协助实现水下机器人操作工作。gydF4y2B一个

中央大学基础研究基金gydF4y2B一个 HEUCF180105gydF4y2B一个 中国国家重点研发项目gydF4y2B一个 2018年yfc0309402gydF4y2B一个
1。介绍gydF4y2B一个

随着计算机视觉和图像处理技术的发展,图像处理的应用方法提高水下图像质量满足人类视觉系统和机器识别的需求已逐渐成为一个热点问题。目前,水下图像增强和恢复的方法可分为物质图像增强和身体的基于模型的图像恢复模型。gydF4y2B一个

对于水下图像增强,传统的图像处理方法包括色彩校正算法和对比度增强算法,白平衡法(gydF4y2B一个 1gydF4y2B一个],灰色世界假设[gydF4y2B一个 2gydF4y2B一个),和灰色边缘假说(gydF4y2B一个 3gydF4y2B一个)是典型的色彩校正方法和对比度增强算法包括直方图均衡化(gydF4y2B一个 4gydF4y2B一个和限制对比直方图均衡化gydF4y2B一个 5gydF4y2B一个),通常用来加强水下图像。较好的结果通过常见的图像处理,通过这些方法获得的结果是水下视觉的不满意。主要原因是海洋环境是复杂的,和许多不利因素,如光的散射和吸收的水,和水下悬浮粒子图像质量产生严重的干扰。gydF4y2B一个

更复杂的和全面的水下图像增强方法都提出了解决褪色的降解,减少对比,细节模糊问题。例如,甘尼et al。gydF4y2B一个 6gydF4y2B一个)提出了一个方法来解决水下图像的低对比度的问题;瑞利拉伸有限对比度自适应直方图用于规范化全局对比度增强图像局部对比度增强图像,从而实现增强水下低质量的图像。李等人。gydF4y2B一个 7gydF4y2B一个]认为多个退化因素的水下图像,采用图像dehazing算法,补偿直方图,颜色均衡饱和,光照强度拉伸,和双边滤波算法来解决模糊问题,褪色、对比度低、噪声问题。Braik et al。gydF4y2B一个 8gydF4y2B一个)使用粒子群优化(PSO)来提高水下图像通过减少光吸收和散射的影响。此外,Retinex理论经常被应用于水下图像增强过程(gydF4y2B一个 9gydF4y2B一个];傅et al。gydF4y2B一个 10gydF4y2B一个)提出了一个基于Retinex模型水下图像增强方法。该方法应用不同的策略来提高反射和照明组件的水下图像色彩校正的基础上,最后合成增强的结果。佩雷斯et al。gydF4y2B一个 11gydF4y2B一个)提出了一个基于深度学习的水下图像增强方法,构造一个训练数据集组成的水下图像退化和恢复组水下图像。水下图像退化和恢复之间的模型水下图像获得了从大量的训练集的深度学习的方法,用于提高水下图像质量。gydF4y2B一个

水下检测主要依赖于数码相机,图像处理是常用的提高质量和降低噪音;轮廓分割方法常用来定位对象。很多这样的方法提出了实现目标的检测。例如,陈常et al。gydF4y2B一个 12gydF4y2B一个)提出了一种新的基于标准的中值滤波图像去噪滤波器,用于检测噪声和原像素值更改为一个新值。角色等。gydF4y2B一个 13gydF4y2B一个)提出了一种新的去噪方法去除添加剂噪声出现在水下图像、同态滤波校正非均匀照明使用,应用各向异性过滤平滑。一种新的去噪方法结合小波分解和高通滤波器应用于提高水下图像(太阳et al ., 2011);反向散射噪声的低频成分和高频噪声不相关的同时可以有效地沮丧。然而,严重的模糊处理的图像基于小波的方法。Kocak et al。gydF4y2B一个 14gydF4y2B一个用中值滤波去除噪声,图像由RGB颜色增强的质量水平伸展,大气光通过黑暗的通道前,这个方法是有用的图像噪音小。对噪声图像,利用双边滤波方法Zhang et al。gydF4y2B一个 15gydF4y2B一个),结果是很好的,但时间处理是非常高的。的精确无偏逆广义安斯科姆转换引入的马库- et al。gydF4y2B一个 16gydF4y2B一个];比较表明,该方法在保证准确的去噪结果中扮演不可或缺的一部分。gydF4y2B一个

激光水下照相机图像增强器系统设计和建造的Forand et al。gydF4y2B一个 17gydF4y2B一个]提高激光水下成像质量,这是证实3到5倍的系统有一个范围比传统相机泛光灯。杨et al。gydF4y2B一个 18gydF4y2B一个)提出了一个基于伽柏水下激光弱目标的检测方法变换,处理在激光水下复杂的非平稳信号,把它变成一个近似平稳信号,然后计算三重相关伽柏变换系数,它可以消除随机干扰和挤出目标信号的相关性。欧阳et al。gydF4y2B一个 19gydF4y2B一个]研究了光场渲染的应用(LFR)拍摄的图像从一个分布式收发分置的非同步的激光线扫描成像仪使用视线和视线外成像几何图形来创建一个multiperspective呈现一个未知的水下场景。gydF4y2B一个

Chang et al。gydF4y2B一个 20.gydF4y2B一个]介绍了大量的偏振的光散射角90度附近:这光可以区别在一个对象,仍然几乎完全未极化的。从蒙特卡洛模拟结果,从一个小规模的试验,在一个对象是沉浸在一个细胞填充聚苯乙烯乳胶球悬浮在水中。Gruev et al。gydF4y2B一个 21gydF4y2B一个]描述了两种方法来创建焦平面偏振成像传感器。第一种方法结合聚合物极化滤波器与CMOS有源像素传感器和计算在焦平面偏振信息。第二种方法概述了初始偏振过滤器使用铝纳米线。测量从第一个详细讨论了偏振图像传感器原型,使用偏振技术和申请材料检测。水下偏振成像技术详细介绍了李et al。gydF4y2B一个 22gydF4y2B一个]。gydF4y2B一个

上述基于小波分解的方法,统计方法或通过激光技术,或颜色极化理论,结果表明,该方法是合理的和有效的,但共同的缺点是,处理非常消耗时间,很难实现实时检测。gydF4y2B一个

卷积神经网络(CNN)被认为是最快的检测方法在许多方面不同的研究领域;Krizhevsky et al。gydF4y2B一个 23gydF4y2B一个]CNN方法适用于处理分类问题赢得冠军ILSVRC (ImageNet大规模视觉识别的挑战),前5名错误率降低到15.3%,从此深CNN已经广泛应用。Girshick [gydF4y2B一个 24gydF4y2B一个]提出地区卷积神经网络(RCNN)通过结合RPN(地区建议网络)和CNN方法,证实在2007年帕斯卡VOC,地图达到66%。基于RCNN SPP-Net(空间金字塔池深卷积网络视觉识别)是由他k . et al。gydF4y2B一个 25gydF4y2B一个)提高检测效率。RESNET是提出的gydF4y2B一个 26gydF4y2B一个];RESNET是成功的网络迁移的帮助下解决问题的引入剩余模块,以提高网络的深度,可以获得功能较强的表达能力和更高的精度。多层感知器(MLP)应用于取代SVM(支持向量机);显著的训练和分类进行了优化,这叫快RCNN [gydF4y2B一个 6gydF4y2B一个]。在快速RCNN,任年代,他K, Girshick [gydF4y2B一个 27gydF4y2B一个]项添加到该地区选择和修改建议,而不是选择性搜索,旨在解决端到端检测问题;这是RCNN越快的方法。刘伟提出了SSD ECCV2016(单枪MultiBox)方法(欧洲计算机视觉)。与快RCNN相比,它具有明显的速度优势,能够直接预测边界框的坐标和类别没有处理生成的建议。gydF4y2B一个

2016年cvpr (IEEE计算机视觉与模式识别会议),Redmon提出YOLO(你只看一次)[意思gydF4y2B一个 28gydF4y2B一个]回归目标检测算法;通过这种方法,检测速度显著提高,实时检测可以实现。YOLO算法提出了意思时,计算的精度和速度都不如的SSD算法。然后,提出Redmon YOLO V2(意思gydF4y2B一个 29日gydF4y2B一个]版本优化原YOLO多目标检测框架通过一系列方法,意思和准确性大大提高的优势下保持原来的速度。2018年早些时候,Redmon提出YOLO v3(意思gydF4y2B一个 30.gydF4y2B一个),这是一般公认最快的检测方法,精度和检测速度与其他方法相比,大大提高了。gydF4y2B一个

在本文中,我们应用的组合max-RGB法和灰色阴影法提高水下图像,和CNN方法用于弱照明形象。水下目标检测,提出了一种新的CNN方法解决水下目标检测问题;考虑水下视觉的特殊性,提出了两个改进方案,提高检测的准确性,结果与快速RCNN [gydF4y2B一个 6gydF4y2B一个),快RCNN [gydF4y2B一个 27gydF4y2B一个原始YOLO V3(意思),gydF4y2B一个 30.gydF4y2B一个]。通过比较证实,修改是有效的,程序是安装在一个水下机器人来测试的实时检测。gydF4y2B一个

2。图像预处理gydF4y2B一个

水下计算机视觉,图像预处理是目标检测最重要的过程。因为在水中光散射和吸收的影响,水下视觉系统获得的图像显示不均匀照明的特点,低对比度,严重的噪音。通过分析当前图像处理算法,提高算法提出了水下图像。gydF4y2B一个

2.1。水下视觉检测的体系结构gydF4y2B一个

典型的水下视觉系统由光照明、摄像机或传感器,图像采集卡,和应用软件。水下视觉识别系统的软件过程一般包括几个部分,如图像采集、图像预处理、卷积神经网络目标识别,如图gydF4y2B一个 1gydF4y2B一个。gydF4y2B一个

图像处理和目标检测结构。gydF4y2B一个

图像预处理是低水平,根本目的是提高图像对比度,削弱或抑制各种噪声的影响尽可能和重要的是保留有用的图像增强和图像过滤过程中的细节。卷积神经网络用于将图像分成多个不重叠的区域;目标检测和分类的基础是基于特征提取,旨在提取最有效的基本特征,反映了目标。各个方面密切相关,因此应尽一切努力,以达到令人满意的结果。本文的研究主要集中在图像预处理和识别水下典型目标的愿景。gydF4y2B一个

2.2。Max-RGB法和灰色阴影法的结合gydF4y2B一个

水对光线的吸收导致的减少水下图像的颜色。的红色和橙色光完全吸收10米深的水里,水下图像通常蓝绿色。为了消除水下图像的颜色偏差,水下图像的色彩校正必须执行。gydF4y2B一个

正常的图像的色彩校正已非常成熟。许多白平衡的方法,如灰色字方法,max-RGB方法,深浅的灰色方法,和灰色边缘的方法,用于正确的颜色偏差显示图像的色温。一般来说,这些方法的应用场景一般都偏色情况,和治疗严重的水下视觉并不满意。本文最初max-RGB方法和深浅的灰色方法相结合来确定光源的颜色。gydF4y2B一个 (1)gydF4y2B一个 我gydF4y2B一个 xgydF4y2B一个 =gydF4y2B一个 ∫gydF4y2B一个 wgydF4y2B一个 egydF4y2B一个 λgydF4y2B一个 年代gydF4y2B一个 λgydF4y2B一个 ,gydF4y2B一个 xgydF4y2B一个 cgydF4y2B一个 λgydF4y2B一个 dgydF4y2B一个 λgydF4y2B一个 ,gydF4y2B一个 在哪里gydF4y2B一个 我gydF4y2B一个 xgydF4y2B一个 是输入的水下图像,gydF4y2B一个 egydF4y2B一个 λgydF4y2B一个 的辐射光源,gydF4y2B一个 λgydF4y2B一个 是波长,gydF4y2B一个 年代gydF4y2B一个 λgydF4y2B一个 ,gydF4y2B一个 xgydF4y2B一个 代表了表面反射,gydF4y2B一个 cgydF4y2B一个 λgydF4y2B一个 表示传感器的敏感性,gydF4y2B一个 wgydF4y2B一个 可见光谱。gydF4y2B一个

的光源gydF4y2B一个 egydF4y2B一个 被定义为gydF4y2B一个 (2)gydF4y2B一个 egydF4y2B一个 =gydF4y2B一个 ∫gydF4y2B一个 wgydF4y2B一个 egydF4y2B一个 λgydF4y2B一个 cgydF4y2B一个 λgydF4y2B一个 dgydF4y2B一个 λgydF4y2B一个 。gydF4y2B一个

现场是灰色的平均反射率根据Grey-World假设[gydF4y2B一个 31日gydF4y2B一个]gydF4y2B一个 (3)gydF4y2B一个 kgydF4y2B一个 =gydF4y2B一个 ∫gydF4y2B一个 年代gydF4y2B一个 λgydF4y2B一个 ,gydF4y2B一个 xgydF4y2B一个 dgydF4y2B一个 xgydF4y2B一个 ∫gydF4y2B一个 dgydF4y2B一个 xgydF4y2B一个 。gydF4y2B一个

假设gydF4y2B一个 kgydF4y2B一个 是一个恒定值,方程的物理意义(gydF4y2B一个 1gydF4y2B一个)可以简单地描述为观察到的图像gydF4y2B一个 我gydF4y2B一个 xgydF4y2B一个 可以分解成反射图像的产品吗gydF4y2B一个 年代gydF4y2B一个 xgydF4y2B一个 地图和照明gydF4y2B一个 egydF4y2B一个 λgydF4y2B一个 。因此,弱光照图像增强方法去除弱照明从输入图像;方程(gydF4y2B一个 3gydF4y2B一个)被替换在方程(gydF4y2B一个 1gydF4y2B一个)gydF4y2B一个 (4)gydF4y2B一个 ∫gydF4y2B一个 年代gydF4y2B一个 λgydF4y2B一个 ,gydF4y2B一个 xgydF4y2B一个 dgydF4y2B一个 xgydF4y2B一个 ∫gydF4y2B一个 dgydF4y2B一个 xgydF4y2B一个 =gydF4y2B一个 1gydF4y2B一个 ∫gydF4y2B一个 dgydF4y2B一个 xgydF4y2B一个 ∬gydF4y2B一个 wgydF4y2B一个 egydF4y2B一个 λgydF4y2B一个 年代gydF4y2B一个 λgydF4y2B一个 ,gydF4y2B一个 xgydF4y2B一个 cgydF4y2B一个 λgydF4y2B一个 dgydF4y2B一个 λgydF4y2B一个 dgydF4y2B一个 xgydF4y2B一个 。gydF4y2B一个

照明的解释,整个图像的平均颜色提高能力gydF4y2B一个 ngydF4y2B一个 (5)gydF4y2B一个 kgydF4y2B一个 egydF4y2B一个 =gydF4y2B一个 ∫gydF4y2B一个 我gydF4y2B一个 ngydF4y2B一个 dgydF4y2B一个 xgydF4y2B一个 ∫gydF4y2B一个 dgydF4y2B一个 xgydF4y2B一个 1gydF4y2B一个 /gydF4y2B一个 ngydF4y2B一个

根据max-RGB方法,上述方程可以被修改gydF4y2B一个 (6)gydF4y2B一个 kgydF4y2B一个 egydF4y2B一个 =gydF4y2B一个 马克斯gydF4y2B一个 我gydF4y2B一个 xgydF4y2B一个 ∗gydF4y2B一个 ∫gydF4y2B一个 我gydF4y2B一个 ngydF4y2B一个 dgydF4y2B一个 xgydF4y2B一个 ∫gydF4y2B一个 dgydF4y2B一个 xgydF4y2B一个 1gydF4y2B一个 /gydF4y2B一个 ngydF4y2B一个 ,gydF4y2B一个 在哪里gydF4y2B一个 ngydF4y2B一个 1,之间可以任意数量gydF4y2B一个 ∞gydF4y2B一个 的默认值gydF4y2B一个 ngydF4y2B一个 =gydF4y2B一个 6gydF4y2B一个 ,这是定义在深浅的灰色Finlayson[提出的方法gydF4y2B一个 31日gydF4y2B一个]。gydF4y2B一个

2.3。CNN弱发光的图像增强方法gydF4y2B一个

Retinex模型可用于增强图像基于估计光照映射;水下视觉,图像总是弱照明,因此可训练的CNN方法应用于预测之间的映射关系弱照明图像和相应的照明地图。使用一个基础课卷积网络,第一和第三层集中在高亮度区域,和第二层集中在光线暗的区域,最后一层是重建照明地图。卷积神经网络直接从一个端到端的黑暗和明亮的图像之间的映射。低光照条件下的图像增强在本文中被认为是一个机器学习的问题。弱照明图像输入,gydF4y2B一个 32gydF4y2B一个 ∗gydF4y2B一个 6gydF4y2B一个 ∗gydF4y2B一个 6gydF4y2B一个 卷积层是用于改变图像分成32通道;三维视图图意味着多层特征映射,然后gydF4y2B一个 cgydF4y2B一个 18gydF4y2B一个 ∗gydF4y2B一个 6gydF4y2B一个 ∗gydF4y2B一个 6gydF4y2B一个 和gydF4y2B一个 8gydF4y2B一个 ∗gydF4y2B一个 1gydF4y2B一个 ∗gydF4y2B一个 1gydF4y2B一个 卷积层添加的网络;输出是一个频道功能映射。在这个模型中,大部分的参数优化反向传播,而传统模型的参数依赖于神经网络。但是卷积网络结构如图gydF4y2B一个 2gydF4y2B一个。gydF4y2B一个

输入图像之间的映射关系的预测和照明地图CNN结构。gydF4y2B一个

输入图像弱发光图像,并输出相应的照明地图。类似与李重et al。gydF4y2B一个 32gydF4y2B一个和盾等。gydF4y2B一个 33gydF4y2B一个),网络包含四个卷积层与特定的任务。观察图的特征图谱gydF4y2B一个 2gydF4y2B一个,不同的卷积层地图上最后的照明有不同的影响。例如,第一个两层关注高亮区域和第三层集中在光线暗的区域,而最后一层是重建照明地图。的具体操作形式描述如图4卷积层gydF4y2B一个 2gydF4y2B一个。gydF4y2B一个

增强效果如图gydF4y2B一个 3gydF4y2B一个明显改善,水下背景颜色,使用可训练的CNN的弱照明图像增强方法。gydF4y2B一个

由不同的方法:增强效应(a)原始图像;D.J. [(b)提出的方法gydF4y2B一个 34gydF4y2B一个];(c)提出的方法(gydF4y2B一个 35gydF4y2B一个];(d) max-RGB和形状的方法;(e)弱照明图像增强。gydF4y2B一个

3所示。对象检测理论gydF4y2B一个

图像的大小gydF4y2B一个 448年gydF4y2B一个 ∗gydF4y2B一个 448年gydF4y2B一个 ,输入图像缩放,图像拉伸,标签也将重新计算。在这种情况下,事实上,一个比例因子计算记录宽度和高度的规模,分别gydF4y2B一个 xgydF4y2B一个 最小值gydF4y2B一个 ,gydF4y2B一个 xgydF4y2B一个 马克斯gydF4y2B一个 ,gydF4y2B一个 ygydF4y2B一个 最小值gydF4y2B一个 ,gydF4y2B一个 ygydF4y2B一个 马克斯gydF4y2B一个 分别计算,但输出图像与原始图像大小一样。CNN的方法用于预测边界框和分类概率。水下探测的目标从背景中很难被识别。为了提高检测精度,整个图像信息是用来预测的边框目标和分类的对象在同一时间;通过这个提案,端到端实时目标检测可以实现。gydF4y2B一个

3.1。卷积神经网络gydF4y2B一个

图像分为gydF4y2B一个 4gydF4y2B一个 ∗gydF4y2B一个 4gydF4y2B一个 网状细胞,用于定位检测对象的中心。对于每个网格单元,边界框(bbox)预计,其中包括5参数,(gydF4y2B一个 xgydF4y2B一个 ,gydF4y2B一个 ygydF4y2B一个 边界框的中心位置,(gydF4y2B一个 wgydF4y2B一个 ,gydF4y2B一个 hgydF4y2B一个 )是盒子的宽度和高度,信心是联盟的交集(借据),等于十字路口除以bbox之间的联盟和地面真理,流程如图gydF4y2B一个 4gydF4y2B一个。gydF4y2B一个

检测过程。gydF4y2B一个

这个边界框是通过全层预测;如果宽度和高度只与输入图像的尺度和比例,不同的物体在不同形状的位置不能非常准确。因此,地区建议网络应用于预测边界框和信心gydF4y2B一个 27gydF4y2B一个),预测盒与不同尺度和比例,和盒子的补偿计算项,如图gydF4y2B一个 5gydF4y2B一个。完全连接层被删除,与锚箱和卷积层添加到预测边界框。为了保持原始图像的高质量,一池层是删除,输入图像gydF4y2B一个 448年gydF4y2B一个 ∗gydF4y2B一个 448年gydF4y2B一个 ,最终功能图的规模gydF4y2B一个 14gydF4y2B一个 ∗gydF4y2B一个 14gydF4y2B一个 只有一个中心。gydF4y2B一个

卷积特性映射。gydF4y2B一个

通过一系列的曲线玲珑,一个共同特征映射,然后,项。首先通过卷积,地图是一个新特性,这也可以被看作是高维特征向量,然后通过两个gydF4y2B一个 1gydF4y2B一个 ∗gydF4y2B一个 1gydF4y2B一个 曲线玲珑,gydF4y2B一个 18gydF4y2B一个 ∗gydF4y2B一个 16gydF4y2B一个 ∗gydF4y2B一个 16gydF4y2B一个 特征地图和gydF4y2B一个 36gydF4y2B一个 ∗gydF4y2B一个 16gydF4y2B一个 ∗gydF4y2B一个 16gydF4y2B一个 得到了特征映射。这是gydF4y2B一个 16gydF4y2B一个 ∗gydF4y2B一个 16gydF4y2B一个 ∗gydF4y2B一个 9gydF4y2B一个 结果,每个结果都包含2分数和4坐标,然后结合预定义的锚;预处理后,计算边界框。gydF4y2B一个

在深度学习过程中,网格单元数据输入在深度学习的结果,某些像素的中心是在特定范围内的一个特定的网格单元,然后,所有的像素满足对象的特性都聚集在一定的范围内。经过多次的试验训练点球,它可以通过滑动窗口找到确切的范围。然而,中心位置不能超过网格单元的范围。这大大限制了模型的计算滑动时在图片。这样,位置检测和分类识别是组合成一个CNN网络预测,你只需要扫描图片一次来推断所有对象的位置信息和类别。gydF4y2B一个

3.2。聚类分析gydF4y2B一个

的gydF4y2B一个 kgydF4y2B一个 ——集群方法用于训练边界框,目标是获得一个更好的借据bbox,接地之间的真理,所以距离bbox集群中心的中心作为参数计算:gydF4y2B一个 (7)gydF4y2B一个 dgydF4y2B一个 盒子gydF4y2B一个 ,gydF4y2B一个 重心gydF4y2B一个 =gydF4y2B一个 1gydF4y2B一个 −gydF4y2B一个 借据gydF4y2B一个 盒子gydF4y2B一个 ,gydF4y2B一个 重心gydF4y2B一个 。gydF4y2B一个

应用在传统的欧氏距离gydF4y2B一个 kgydF4y2B一个 ——集群方法,这意味着更大的盒子里有更多的错误与小盒相比,结果可能偏离真实价值。所以借据得分提出替代传统的方法。gydF4y2B一个

卷积核是gydF4y2B一个 3gydF4y2B一个 ∗gydF4y2B一个 3gydF4y2B一个 max-pooling大小gydF4y2B一个 2gydF4y2B一个 ∗gydF4y2B一个 2gydF4y2B一个 和地图的尺寸特性是减少2倍。全球平均池应用于完整的预测;的gydF4y2B一个 1gydF4y2B一个 ∗gydF4y2B一个 1gydF4y2B一个 卷积是用于压缩特征图的通道,以减少计算的参数和数量。一批标准化层添加到加快收敛速度和避免过度拟合。gydF4y2B一个

数据预处理(统一格式,均衡、降噪等)可以大大提高速度的训练,提高训练效果。批正常化(BN)提出的谷歌,这是常用的在CNN网络。卷积后或池和激活函数之前,所有的输入数据都是归一化如下:gydF4y2B一个 (8)gydF4y2B一个 xgydF4y2B一个 ^gydF4y2B一个 kgydF4y2B一个 =gydF4y2B一个 xgydF4y2B一个 kgydF4y2B一个 −gydF4y2B一个 EgydF4y2B一个 xgydF4y2B一个 kgydF4y2B一个 VargydF4y2B一个 xgydF4y2B一个 kgydF4y2B一个 ,gydF4y2B一个 ygydF4y2B一个 ^gydF4y2B一个 kgydF4y2B一个 =gydF4y2B一个 rgydF4y2B一个 kgydF4y2B一个 xgydF4y2B一个 ^gydF4y2B一个 kgydF4y2B一个 +gydF4y2B一个 βgydF4y2B一个 kgydF4y2B一个 在哪里gydF4y2B一个 EgydF4y2B一个 批量平均值和Var方差;gydF4y2B一个 γgydF4y2B一个 和gydF4y2B一个 βgydF4y2B一个 是规模和转移系数,从培训中获得。gydF4y2B一个

3.3。位置预测gydF4y2B一个

为了解决使用锚箱的不稳定问题,特别是在早期迭代的过程中,下列程序应用于预测框的位置:gydF4y2B一个 (9)gydF4y2B一个 xgydF4y2B一个 =gydF4y2B一个 tgydF4y2B一个 xgydF4y2B一个 ∗gydF4y2B一个 ωgydF4y2B一个 一个gydF4y2B一个 −gydF4y2B一个 xgydF4y2B一个 一个gydF4y2B一个 ,gydF4y2B一个 ygydF4y2B一个 =gydF4y2B一个 tgydF4y2B一个 ygydF4y2B一个 ∗gydF4y2B一个 hgydF4y2B一个 一个gydF4y2B一个 −gydF4y2B一个 ygydF4y2B一个 一个gydF4y2B一个 ,gydF4y2B一个 (在哪里gydF4y2B一个 xgydF4y2B一个 ,gydF4y2B一个 ygydF4y2B一个 )的预测价值,(gydF4y2B一个 xgydF4y2B一个 一个gydF4y2B一个 ,gydF4y2B一个 ygydF4y2B一个 一个gydF4y2B一个 )是锚的坐标(gydF4y2B一个 xgydF4y2B一个 ∗gydF4y2B一个 ,gydF4y2B一个 ygydF4y2B一个 ∗gydF4y2B一个 是真正的价值坐标,gydF4y2B一个 tgydF4y2B一个 xgydF4y2B一个 ,gydF4y2B一个 tgydF4y2B一个 ygydF4y2B一个 )是偏移值,(gydF4y2B一个 wgydF4y2B一个 一个gydF4y2B一个 ,gydF4y2B一个 hgydF4y2B一个 一个gydF4y2B一个 )是盒子的宽度和高度。gydF4y2B一个

当gydF4y2B一个 tgydF4y2B一个 xgydF4y2B一个 =gydF4y2B一个 1gydF4y2B一个 ,这个盒子是抵消距离等于右边的框的宽度;如果gydF4y2B一个 tgydF4y2B一个 xgydF4y2B一个 =gydF4y2B一个 −gydF4y2B一个 1gydF4y2B一个 向左偏移,因此每个预测盒可以位于任何位置图片,模型是不稳定的原因,和预测是非常消耗时间。预测盒有限网格单元,和乙状结肠函数是用来计算偏移值,0 - 1之间的定义;的gydF4y2B一个 tgydF4y2B一个 xgydF4y2B一个 ,gydF4y2B一个 tgydF4y2B一个 ygydF4y2B一个 ,gydF4y2B一个 tgydF4y2B一个 wgydF4y2B一个 ,gydF4y2B一个 tgydF4y2B一个 hgydF4y2B一个 可以从以下公式计算:gydF4y2B一个 (10)gydF4y2B一个 bgydF4y2B一个 xgydF4y2B一个 =gydF4y2B一个 σgydF4y2B一个 tgydF4y2B一个 xgydF4y2B一个 +gydF4y2B一个 cgydF4y2B一个 xgydF4y2B一个 ,gydF4y2B一个 bgydF4y2B一个 ygydF4y2B一个 =gydF4y2B一个 σgydF4y2B一个 tgydF4y2B一个 ygydF4y2B一个 +gydF4y2B一个 cgydF4y2B一个 ygydF4y2B一个 bgydF4y2B一个 wgydF4y2B一个 =gydF4y2B一个 pgydF4y2B一个 wgydF4y2B一个 egydF4y2B一个 tgydF4y2B一个 wgydF4y2B一个 bgydF4y2B一个 hgydF4y2B一个 =gydF4y2B一个 pgydF4y2B一个 hgydF4y2B一个 egydF4y2B一个 tgydF4y2B一个 hgydF4y2B一个

在上面的方程中,(gydF4y2B一个 cgydF4y2B一个 xgydF4y2B一个 ,gydF4y2B一个 cgydF4y2B一个 ygydF4y2B一个 )的左上角坐标网格单元,如图gydF4y2B一个 6gydF4y2B一个;当网格单元的规模是1,中心是有限的内部细胞的s形的函数。的gydF4y2B一个 pgydF4y2B一个 wgydF4y2B一个 和gydF4y2B一个 pgydF4y2B一个 hgydF4y2B一个 是先天的宽度和高度。gydF4y2B一个

边界框的预测。gydF4y2B一个

3.4。损失函数gydF4y2B一个

在培训的过程中,损失函数形式是一个关键技术;对本文提出的方法和平方误差损失是用来平衡错误。不同大小的盒子预测,边界框的宽度和高度取代的平方根值;因此,小盒子有一个相对较大的值抵消使预测更加有效。损失函数可分为2部分:gydF4y2B一个 (11)gydF4y2B一个 lgydF4y2B一个 1gydF4y2B一个 =gydF4y2B一个 ∑gydF4y2B一个 我gydF4y2B一个 =gydF4y2B一个 0gydF4y2B一个 年代gydF4y2B一个 2gydF4y2B一个 ∑gydF4y2B一个 jgydF4y2B一个 =gydF4y2B一个 0gydF4y2B一个 BgydF4y2B一个 lgydF4y2B一个 我gydF4y2B一个 jgydF4y2B一个 objgydF4y2B一个 xgydF4y2B一个 我gydF4y2B一个 −gydF4y2B一个 xgydF4y2B一个 ^gydF4y2B一个 我gydF4y2B一个 2gydF4y2B一个 +gydF4y2B一个 ygydF4y2B一个 我gydF4y2B一个 −gydF4y2B一个 ygydF4y2B一个 ^gydF4y2B一个 我gydF4y2B一个 2gydF4y2B一个 +gydF4y2B一个 wgydF4y2B一个 我gydF4y2B一个 −gydF4y2B一个 wgydF4y2B一个 ^gydF4y2B一个 我gydF4y2B一个 2gydF4y2B一个 +gydF4y2B一个 hgydF4y2B一个 我gydF4y2B一个 −gydF4y2B一个 hgydF4y2B一个 ^gydF4y2B一个 我gydF4y2B一个 2gydF4y2B一个 。gydF4y2B一个

lgydF4y2B一个 1gydF4y2B一个 旨在确定吗gydF4y2B一个 jgydF4y2B一个 th盒子里gydF4y2B一个 我gydF4y2B一个 th网格单元负责的对象,这是一个协调预测损失。gydF4y2B一个 (12)gydF4y2B一个 lgydF4y2B一个 2gydF4y2B一个 =gydF4y2B一个 ∑gydF4y2B一个 我gydF4y2B一个 =gydF4y2B一个 0gydF4y2B一个 年代gydF4y2B一个 2gydF4y2B一个 ∑gydF4y2B一个 jgydF4y2B一个 =gydF4y2B一个 0gydF4y2B一个 BgydF4y2B一个 lgydF4y2B一个 我gydF4y2B一个 jgydF4y2B一个 objgydF4y2B一个 cgydF4y2B一个 我gydF4y2B一个 −gydF4y2B一个 cgydF4y2B一个 ^gydF4y2B一个 我gydF4y2B一个 2gydF4y2B一个 +gydF4y2B一个 ∑gydF4y2B一个 我gydF4y2B一个 =gydF4y2B一个 0gydF4y2B一个 年代gydF4y2B一个 2gydF4y2B一个 lgydF4y2B一个 我gydF4y2B一个 objgydF4y2B一个 ∑gydF4y2B一个 类gydF4y2B一个 pgydF4y2B一个 我gydF4y2B一个 cgydF4y2B一个 −gydF4y2B一个 pgydF4y2B一个 ^gydF4y2B一个 我gydF4y2B一个 cgydF4y2B一个 2gydF4y2B一个 。gydF4y2B一个

lgydF4y2B一个 2gydF4y2B一个 盒子的信心预测损失与对象。总损失的总和gydF4y2B一个 lgydF4y2B一个 1gydF4y2B一个 和gydF4y2B一个 lgydF4y2B一个 2gydF4y2B一个 ,可以给一个更好的平衡之间的坐标,信心,和分类。gydF4y2B一个

4所示。水下探测CNN网络gydF4y2B一个

水下检测的常用方法不适用,因为低质量的视野和小物体的检测。我们最初的中性网络如图gydF4y2B一个 7gydF4y2B一个,输入图像的大小gydF4y2B一个 448年gydF4y2B一个 ∗gydF4y2B一个 448年gydF4y2B一个 ∗gydF4y2B一个 3gydF4y2B一个 缩放图像应该批规范化(BN)卷积核gydF4y2B一个 3gydF4y2B一个 ∗gydF4y2B一个 3gydF4y2B一个 和gydF4y2B一个 1gydF4y2B一个 ∗gydF4y2B一个 1gydF4y2B一个 、跨越1和地图的输出特性gydF4y2B一个 14gydF4y2B一个 ∗gydF4y2B一个 14gydF4y2B一个 ∗gydF4y2B一个 75年gydF4y2B一个 。为了解决网络的梯度扩散或爆炸现象,更好的建议是改变深层神经网络的分层技术训练循序渐进的训练。深层神经网络分为几个子分段,每个亚节包含浅网络层,然后,捷径是用来使每个亚节火车残余,并且每个亚节总学习错误。同时,该方法可以控制梯度的传播,避免消失的情况下梯度和梯度爆炸,这是不利于培训。gydF4y2B一个

原始物体检测网络结构。gydF4y2B一个

首先,gydF4y2B一个 3gydF4y2B一个 ∗gydF4y2B一个 3gydF4y2B一个 卷积是用来减少渠道的数量和训练参数;然后,大小不一的卷积核是用来执行卷积操作;最后,每个特性根据频道形象相结合。为了得到更多的高级功能,前面的方法是增加网络的深度,我们提出这个网络实现这一目标通过增加网络的宽度。概念模块综合考虑多重卷积核的结果,不同的信息输入的图像和更好的图像表示。为了防止中间梯度消失过程的一部分的网络结构,我们介绍两个辅助分类器。Softmax操作上使用的两个感知模块的输出,然后,辅助计算损失。辅助损失仅用于培训,而不是预测过程。gydF4y2Ba

4.1。网络结构的改进gydF4y2B一个

对于水下目标检测,视觉传感器安装在水下机器人。实际操作,小物体检测的常见方法执行不好,因为常规实验中使用的数据集是正常的图像,这是高质量的和明亮的图像。水下检测的对象总是重叠的其他东西,比如岩石和珊瑚,以及水下视觉总是含糊不清,透明度低。在这种情况下,网络结构应保留更多的原始功能。深陷CNN,总是越层提取特性更抽象,和深层语义信息提取更清楚。另一方面,越少层可以保留更多的表示信息。深层语义信息和表示信息可以给出一个更准确的检测。本文提出的结构是两个方案,第一个是一个gydF4y2Ba 1gydF4y2B一个 ∗gydF4y2B一个 1gydF4y2B一个 卷积核的使用gydF4y2B一个 28gydF4y2B一个 ∗gydF4y2B一个 28gydF4y2B一个 特征映射,然后将采样层添加到调整输出等于gydF4y2B一个 14gydF4y2B一个 ∗gydF4y2B一个 14gydF4y2B一个 结合,最后输出完整的检测;改善图所示gydF4y2B一个 8gydF4y2B一个。gydF4y2B一个

网络结构修改方案1。gydF4y2B一个

因为原始信息丢失的卷积操作,在第二个方案中,添加了将采样首先,然后是卷积网络中插入层,结果是结合最后输出实现检测;修改图所示gydF4y2B一个 9gydF4y2B一个。gydF4y2B一个

网络结构修改方案2。gydF4y2B一个

有三次卷积特性提取器,分别对应于卷积,即内部卷积器内核的结构特性,gydF4y2B一个 1gydF4y2B一个 ∗gydF4y2B一个 1gydF4y2B一个 卷积内核用于降维,gydF4y2B一个 3gydF4y2B一个 ∗gydF4y2B一个 3gydF4y2B一个 卷积内核用于特征提取和多个卷积核交叉来实现目的。每个完整的卷积特性层连接。当前功能的输入层有一个前一层的输出的一部分。每个功能层有一个输出预测结果。最后,结果退化根据置信度得到最终的预测结果。gydF4y2B一个

4.2。数据集扩充gydF4y2B一个

水下数据集是困难的准备,水下图像和视频在互联网上不容易获得,对水下图像,背景几乎是在同一地区相同,所以图像数据集是相似的,因为这些因素的训练输出模式总是不能有效的使用在其他海域。因此,数据集应该修改和扩充,使深层学习模式更普遍的使用。数据集增加主要是基于旋转,翻转,变焦,转移等。gydF4y2B一个

本文中使用的数据集得到的视频记录下一个水下机器人。图像的总数约为18000,和图片是相似的,所以旋转和颜色变换应用于变换原始模式。gydF4y2B一个

三个通道的图像维数减少;的gydF4y2B一个 RgydF4y2B一个 (红色),gydF4y2B一个 GgydF4y2B一个 (绿色)gydF4y2B一个 BgydF4y2B一个 (蓝色)方向向量分别获得。gydF4y2B一个 (13)gydF4y2B一个 我gydF4y2B一个 xgydF4y2B一个 ygydF4y2B一个 =gydF4y2B一个 RgydF4y2B一个 xgydF4y2B一个 ygydF4y2B一个 ,gydF4y2B一个 GgydF4y2B一个 xgydF4y2B一个 ygydF4y2B一个 ,gydF4y2B一个 BgydF4y2B一个 xgydF4y2B一个 ygydF4y2B一个

的特征值和特征向量gydF4y2B一个 RgydF4y2B一个 ,gydF4y2B一个 GgydF4y2B一个 ,gydF4y2B一个 BgydF4y2B一个 被定义为gydF4y2B一个 (14)gydF4y2B一个 RgydF4y2B一个 xgydF4y2B一个 ygydF4y2B一个 =gydF4y2B一个 pgydF4y2B一个 rgydF4y2B一个 λgydF4y2B一个 rgydF4y2B一个 ,gydF4y2B一个 GgydF4y2B一个 xgydF4y2B一个 ygydF4y2B一个 =gydF4y2B一个 pgydF4y2B一个 ggydF4y2B一个 λgydF4y2B一个 ggydF4y2B一个 BgydF4y2B一个 xgydF4y2B一个 ygydF4y2B一个 =gydF4y2B一个 pgydF4y2B一个 bgydF4y2B一个 λgydF4y2B一个 bgydF4y2B一个

αgydF4y2B一个 是一个随机变量的均值为0,方差为0.1,并添加到变换函数如下:gydF4y2B一个 (15)gydF4y2B一个 我gydF4y2B一个 xgydF4y2B一个 ygydF4y2B一个 =gydF4y2B一个 pgydF4y2B一个 rgydF4y2B一个 ,gydF4y2B一个 pgydF4y2B一个 ggydF4y2B一个 ,gydF4y2B一个 pgydF4y2B一个 bgydF4y2B一个 αgydF4y2B一个 rgydF4y2B一个 λgydF4y2B一个 rgydF4y2B一个 ,gydF4y2B一个 αgydF4y2B一个 ggydF4y2B一个 λgydF4y2B一个 ggydF4y2B一个 ,gydF4y2B一个 αgydF4y2B一个 bgydF4y2B一个 λgydF4y2B一个 bgydF4y2B一个 TgydF4y2B一个 。gydF4y2B一个

给出了旋转变换gydF4y2B一个 (16)gydF4y2B一个 xgydF4y2B一个 ′gydF4y2B一个 =gydF4y2B一个 xgydF4y2B一个 我gydF4y2B一个 因为gydF4y2B一个 θgydF4y2B一个 1gydF4y2B一个 −gydF4y2B一个 ygydF4y2B一个 我gydF4y2B一个 罪gydF4y2B一个 θgydF4y2B一个 1gydF4y2B一个 ,gydF4y2B一个 ygydF4y2B一个 ′gydF4y2B一个 =gydF4y2B一个 xgydF4y2B一个 我gydF4y2B一个 罪gydF4y2B一个 θgydF4y2B一个 1gydF4y2B一个 +gydF4y2B一个 ygydF4y2B一个 我gydF4y2B一个 因为gydF4y2B一个 θgydF4y2B一个 1gydF4y2B一个 。gydF4y2B一个 (在哪里gydF4y2B一个 xgydF4y2B一个 ”gydF4y2B一个 ,gydF4y2B一个 ygydF4y2B一个 ”gydF4y2B一个 )是转换后的坐标位置,gydF4y2B一个 θgydF4y2B一个 1gydF4y2B一个 旋转角度。gydF4y2B一个

这种转变转换给出gydF4y2B一个 (17)gydF4y2B一个 xgydF4y2B一个 ′gydF4y2B一个 =gydF4y2B一个 xgydF4y2B一个 我gydF4y2B一个 +gydF4y2B一个 ygydF4y2B一个 我gydF4y2B一个 棕褐色gydF4y2B一个 θgydF4y2B一个 2gydF4y2B一个 ,gydF4y2B一个 ygydF4y2B一个 ′gydF4y2B一个 =gydF4y2B一个 xgydF4y2B一个 我gydF4y2B一个 棕褐色gydF4y2B一个 θgydF4y2B一个 2gydF4y2B一个 +gydF4y2B一个 ygydF4y2B一个 我gydF4y2B一个 。gydF4y2B一个 在哪里gydF4y2B一个 θgydF4y2B一个 2gydF4y2B一个 是这种转变的角度。gydF4y2B一个

随机选择上述三种方法将原始图像,总数是扩充到30000人。gydF4y2B一个

5。实验结果gydF4y2B一个

本文提出的方法将被用于一个水下远程操作工具(ROV)渔业海洋产品。机器人长约1米,宽0.8米,重90公斤。方法收集海洋产品吸附类型;真正的设计和机器人如图gydF4y2B一个 10gydF4y2B一个。机器人远程操作;我们的团队将会重建ROV半自治,关键技术是如何检测和定位对象。gydF4y2B一个

水下ROV对海洋生物钓鱼。gydF4y2B一个

5.1。检测比较gydF4y2B一个

这些计算中使用的GPU NVIDIA GTX 1080 ti,和图像的总数是30000,这是一个接一个人为的标签。在深度学习,8520张图片用于培训,12950 8530验证和测试。在目标检测、精密、召回和平均值是通常用于评估的准确性;定义如图gydF4y2B一个 11gydF4y2B一个。gydF4y2B一个 (18)gydF4y2B一个 精度gydF4y2B一个 =gydF4y2B一个 TgydF4y2B一个 PgydF4y2B一个 TgydF4y2B一个 PgydF4y2B一个 +gydF4y2B一个 FgydF4y2B一个 PgydF4y2B一个 ,gydF4y2B一个 回忆gydF4y2B一个 =gydF4y2B一个 TgydF4y2B一个 PgydF4y2B一个 TgydF4y2B一个 PgydF4y2B一个 +gydF4y2B一个 FgydF4y2B一个 NgydF4y2B一个

参数定义。gydF4y2B一个

意味着平均精度的精度检测类的平均值,它被广泛用于评估检测系统。摘要数据集在帕斯卡VOC形式,从快速RCNN获得的结果gydF4y2B一个 6gydF4y2B一个]和更快的RCNN [gydF4y2B一个 27gydF4y2B一个)如图gydF4y2B一个 12gydF4y2B一个,具体数据(表所示gydF4y2B一个 1gydF4y2B一个和表gydF4y2B一个 2gydF4y2B一个)。gydF4y2B一个

地图不同方法获得的结果。gydF4y2B一个

地图和精度不同的迭代次快速RCNN RCNN更快,YOLO V3。意思(gydF4y2B一个 借据gydF4y2B一个 =gydF4y2B一个 0.7gydF4y2B一个 )。gydF4y2B一个

迭代gydF4y2B一个 快RCNNgydF4y2B一个 快RCNNgydF4y2B一个 YOLO V3意思gydF4y2B一个
地图(%)gydF4y2B一个 精度(%)gydF4y2B一个 地图gydF4y2B一个 精度(%)gydF4y2B一个 地图(%)gydF4y2B一个 精度(%)gydF4y2B一个
海参gydF4y2B一个 海胆gydF4y2B一个 扇贝gydF4y2B一个 海参gydF4y2B一个 海胆gydF4y2B一个 扇贝gydF4y2B一个 海参gydF4y2B一个 海胆gydF4y2B一个 扇贝gydF4y2B一个
2000年gydF4y2B一个 27.26gydF4y2B一个 30.13gydF4y2B一个 26.79gydF4y2B一个 24.87gydF4y2B一个 27.53gydF4y2B一个 30.18gydF4y2B一个 27.29gydF4y2B一个 25.13gydF4y2B一个 35.43gydF4y2B一个 37.14gydF4y2B一个 35.42gydF4y2B一个 33.74gydF4y2B一个
4000年gydF4y2B一个 37.56gydF4y2B一个 40.51gydF4y2B一个 38.23gydF4y2B一个 33.93gydF4y2B一个 38.74gydF4y2B一个 40.80gydF4y2B一个 39.35gydF4y2B一个 36.06gydF4y2B一个 45.90gydF4y2B一个 48.12gydF4y2B一个 45.50gydF4y2B一个 44.08gydF4y2B一个
6000年gydF4y2B一个 41.83gydF4y2B一个 44.45gydF4y2B一个 41.36gydF4y2B一个 39.67gydF4y2B一个 43.15gydF4y2B一个 45.30gydF4y2B一个 42.80gydF4y2B一个 41.35gydF4y2B一个 49.61gydF4y2B一个 51.81gydF4y2B一个 49.87gydF4y2B一个 47.16gydF4y2B一个
8000年gydF4y2B一个 45.37gydF4y2B一个 48.67gydF4y2B一个 45.85gydF4y2B一个 41.59gydF4y2B一个 46.59gydF4y2B一个 48.35gydF4y2B一个 47.35gydF4y2B一个 44.08gydF4y2B一个 52.40gydF4y2B一个 54.56gydF4y2B一个 53.14gydF4y2B一个 49.51gydF4y2B一个
10000年gydF4y2B一个 48.22gydF4y2B一个 51.33gydF4y2B一个 47.84gydF4y2B一个 45.50gydF4y2B一个 50.28gydF4y2B一个 52.09gydF4y2B一个 50.76gydF4y2B一个 48.00gydF4y2B一个 55.89gydF4y2B一个 58.17gydF4y2B一个 56.99gydF4y2B一个 52.50gydF4y2B一个
12000年gydF4y2B一个 50.90gydF4y2B一个 53.75gydF4y2B一个 51.31gydF4y2B一个 47.65gydF4y2B一个 52.53gydF4y2B一个 53.96gydF4y2B一个 53.44gydF4y2B一个 50.20gydF4y2B一个 58.34gydF4y2B一个 59.77gydF4y2B一个 59.48gydF4y2B一个 55.77gydF4y2B一个
14000年gydF4y2B一个 53.09gydF4y2B一个 55.69gydF4y2B一个 54.20gydF4y2B一个 49.38gydF4y2B一个 54.43gydF4y2B一个 56.18gydF4y2B一个 54.78gydF4y2B一个 52.31gydF4y2B一个 60.58gydF4y2B一个 63.39gydF4y2B一个 60.91gydF4y2B一个 57.44gydF4y2B一个
16000年gydF4y2B一个 55.04gydF4y2B一个 58.85gydF4y2B一个 54.92gydF4y2B一个 51.35gydF4y2B一个 57.32gydF4y2B一个 59.66gydF4y2B一个 56.98gydF4y2B一个 55.34gydF4y2B一个 62.02gydF4y2B一个 64.09gydF4y2B一个 62.50gydF4y2B一个 59.47gydF4y2B一个
18000年gydF4y2B一个 56.66gydF4y2B一个 60.49gydF4y2B一个 56.81gydF4y2B一个 52.67gydF4y2B一个 58.62gydF4y2B一个 60.35gydF4y2B一个 59.55gydF4y2B一个 55.95gydF4y2B一个 64.18gydF4y2B一个 66.79gydF4y2B一个 65.15gydF4y2B一个 60.58gydF4y2B一个
20000年gydF4y2B一个 58.63gydF4y2B一个 62.12gydF4y2B一个 58.49gydF4y2B一个 55.27gydF4y2B一个 60.93gydF4y2B一个 62.30gydF4y2B一个 61.86gydF4y2B一个 58.63gydF4y2B一个 66.00gydF4y2B一个 68.87gydF4y2B一个 66.20gydF4y2B一个 62.93gydF4y2B一个
22000年gydF4y2B一个 60.42gydF4y2B一个 63.95gydF4y2B一个 60.63gydF4y2B一个 56.67gydF4y2B一个 63.07gydF4y2B一个 64.33gydF4y2B一个 63.93gydF4y2B一个 60.95gydF4y2B一个 67.22gydF4y2B一个 70.37gydF4y2B一个 68.02gydF4y2B一个 63.26gydF4y2B一个
24000年gydF4y2B一个 61.35gydF4y2B一个 64.57gydF4y2B一个 62.19gydF4y2B一个 57.29gydF4y2B一个 64.37gydF4y2B一个 65.94gydF4y2B一个 64.67gydF4y2B一个 62.51gydF4y2B一个 68.88gydF4y2B一个 71.50gydF4y2B一个 70.54gydF4y2B一个 64.60gydF4y2B一个
26000年gydF4y2B一个 63.40gydF4y2B一个 66.60gydF4y2B一个 63.94gydF4y2B一个 59.65gydF4y2B一个 66.38gydF4y2B一个 68.07gydF4y2B一个 67.17gydF4y2B一个 63.90gydF4y2B一个 70.44gydF4y2B一个 72.85gydF4y2B一个 71.83gydF4y2B一个 66.64gydF4y2B一个
28000年gydF4y2B一个 65.03gydF4y2B一个 68.81gydF4y2B一个 65.36gydF4y2B一个 60.92gydF4y2B一个 68.15gydF4y2B一个 69.98gydF4y2B一个 68.67gydF4y2B一个 65.82gydF4y2B一个 72.00gydF4y2B一个 74.79gydF4y2B一个 73.17gydF4y2B一个 68.03gydF4y2B一个
30000年gydF4y2B一个 66.84gydF4y2B一个 70.09gydF4y2B一个 68.19gydF4y2B一个 62.24gydF4y2B一个 69.42gydF4y2B一个 70.49gydF4y2B一个 70.53gydF4y2B一个 67.24gydF4y2B一个 71.99gydF4y2B一个 74.84gydF4y2B一个 73.44gydF4y2B一个 67.70gydF4y2B一个
32000年gydF4y2B一个 67.68gydF4y2B一个 70.73gydF4y2B一个 68.53gydF4y2B一个 63.78gydF4y2B一个 70.68gydF4y2B一个 72.78gydF4y2B一个 71.47gydF4y2B一个 67.79gydF4y2B一个 72.24gydF4y2B一个 74.47gydF4y2B一个 73.78gydF4y2B一个 68.47gydF4y2B一个
34000年gydF4y2B一个 69.26gydF4y2B一个 72.65gydF4y2B一个 71.03gydF4y2B一个 64.11gydF4y2B一个 71.72gydF4y2B一个 73.96gydF4y2B一个 72.17gydF4y2B一个 69.01gydF4y2B一个 72.15gydF4y2B一个 74.62gydF4y2B一个 74.01gydF4y2B一个 67.81gydF4y2B一个
36000年gydF4y2B一个 70.96gydF4y2B一个 74.75gydF4y2B一个 72.23gydF4y2B一个 65.90gydF4y2B一个 73.75gydF4y2B一个 74.44gydF4y2B一个 75.02gydF4y2B一个 71.79gydF4y2B一个 71.88gydF4y2B一个 74.87gydF4y2B一个 72.82gydF4y2B一个 67.95gydF4y2B一个
38000年gydF4y2B一个 71.25gydF4y2B一个 74.83gydF4y2B一个 71.98gydF4y2B一个 66.95gydF4y2B一个 74.80gydF4y2B一个 76.83gydF4y2B一个 75.53gydF4y2B一个 72.03gydF4y2B一个 71.69gydF4y2B一个 74.05gydF4y2B一个 72.37gydF4y2B一个 68.63gydF4y2B一个
40000年gydF4y2B一个 72.88gydF4y2B一个 76.46gydF4y2B一个 74.09gydF4y2B一个 68.08gydF4y2B一个 75.75gydF4y2B一个 77.53gydF4y2B一个 76.13gydF4y2B一个 73.58gydF4y2B一个 72.70gydF4y2B一个 75.55gydF4y2B一个 73.70gydF4y2B一个 68.83gydF4y2B一个
42000年gydF4y2B一个 73.23gydF4y2B一个 76.30gydF4y2B一个 74.68gydF4y2B一个 68.71gydF4y2B一个 75.99gydF4y2B一个 77.41gydF4y2B一个 76.96gydF4y2B一个 73.59gydF4y2B一个 71.96gydF4y2B一个 75.34gydF4y2B一个 73.21gydF4y2B一个 67.33gydF4y2B一个
44000年gydF4y2B一个 73.13gydF4y2B一个 76.19gydF4y2B一个 74.49gydF4y2B一个 68.70gydF4y2B一个 74.86gydF4y2B一个 77.65gydF4y2B一个 73.26gydF4y2B一个 73.67gydF4y2B一个 71.57gydF4y2B一个 74.83gydF4y2B一个 72.59gydF4y2B一个 67.28gydF4y2B一个
46000年gydF4y2B一个 72.82gydF4y2B一个 76.00gydF4y2B一个 74.93gydF4y2B一个 67.53gydF4y2B一个 74.46gydF4y2B一个 76.19gydF4y2B一个 74.33gydF4y2B一个 72.85gydF4y2B一个 71.87gydF4y2B一个 74.58gydF4y2B一个 73.41gydF4y2B一个 67.61gydF4y2B一个
48000年gydF4y2B一个 73.01gydF4y2B一个 76.46gydF4y2B一个 74.07gydF4y2B一个 68.49gydF4y2B一个 74.62gydF4y2B一个 76.16gydF4y2B一个 74.41gydF4y2B一个 73.30gydF4y2B一个 71.59gydF4y2B一个 74.19gydF4y2B一个 73.39gydF4y2B一个 67.20gydF4y2B一个
50000年gydF4y2B一个 72.84gydF4y2B一个 76.35gydF4y2B一个 74.69gydF4y2B一个 67.48gydF4y2B一个 74.64gydF4y2B一个 76.40gydF4y2B一个 73.26gydF4y2B一个 74.25gydF4y2B一个 71.44gydF4y2B一个 74.32gydF4y2B一个 72.32gydF4y2B一个 67.69gydF4y2B一个

检测结果通过本文提出的方法如表所示gydF4y2B一个 1gydF4y2B一个。gydF4y2B一个

地图和精度不同的迭代次YOLO v3意思和修改方法。(gydF4y2B一个 借据gydF4y2B一个 =gydF4y2B一个 0.7gydF4y2B一个 )。gydF4y2B一个

迭代gydF4y2B一个 原始网络gydF4y2B一个 方案1gydF4y2B一个 方案2gydF4y2B一个
地图(%)gydF4y2B一个 精度(%)gydF4y2B一个 地图gydF4y2B一个 精度(%)gydF4y2B一个 地图gydF4y2B一个 精度(%)gydF4y2B一个
海参gydF4y2B一个 海胆gydF4y2B一个 扇贝gydF4y2B一个 海参gydF4y2B一个 海胆gydF4y2B一个 扇贝gydF4y2B一个 海参gydF4y2B一个 海胆gydF4y2B一个 扇贝gydF4y2B一个
2000年gydF4y2B一个 24.90gydF4y2B一个 28.88gydF4y2B一个 26.48gydF4y2B一个 19.35gydF4y2B一个 40.29gydF4y2B一个 42.25gydF4y2B一个 40.25gydF4y2B一个 38.37gydF4y2B一个 40.72gydF4y2B一个 42.25gydF4y2B一个 41.25gydF4y2B一个 38.65gydF4y2B一个
4000年gydF4y2B一个 33.95gydF4y2B一个 38.90gydF4y2B一个 36.90gydF4y2B一个 26.07gydF4y2B一个 52.47gydF4y2B一个 54.10gydF4y2B一个 53.55gydF4y2B一个 49.76gydF4y2B一个 52.71gydF4y2B一个 54.28gydF4y2B一个 52.54gydF4y2B一个 51.31gydF4y2B一个
6000年gydF4y2B一个 40.85gydF4y2B一个 40.57gydF4y2B一个 37.45gydF4y2B一个 44.54gydF4y2B一个 57.94gydF4y2B一个 60.76gydF4y2B一个 58.25gydF4y2B一个 54.81gydF4y2B一个 57.73gydF4y2B一个 59.24gydF4y2B一个 58.51gydF4y2B一个 55.43gydF4y2B一个
8000年gydF4y2B一个 42.51gydF4y2B一个 45.51gydF4y2B一个 42.34gydF4y2B一个 39.67gydF4y2B一个 61.63gydF4y2B一个 63.49gydF4y2B一个 61.93gydF4y2B一个 59.46gydF4y2B一个 62.22gydF4y2B一个 64.60gydF4y2B一个 62.26gydF4y2B一个 59.79gydF4y2B一个
10000年gydF4y2B一个 44.72gydF4y2B一个 50.58gydF4y2B一个 44.29gydF4y2B一个 39.29gydF4y2B一个 65.27gydF4y2B一个 68.39gydF4y2B一个 66.11gydF4y2B一个 61.31gydF4y2B一个 64.91gydF4y2B一个 67.60gydF4y2B一个 65.33gydF4y2B一个 61.79gydF4y2B一个
12000年gydF4y2B一个 49.53gydF4y2B一个 48.75gydF4y2B一个 48.11gydF4y2B一个 51.74gydF4y2B一个 68.04gydF4y2B一个 71.64gydF4y2B一个 67.95gydF4y2B一个 64.53gydF4y2B一个 67.49gydF4y2B一个 69.04gydF4y2B一个 68.98gydF4y2B一个 64.45gydF4y2B一个
14000年gydF4y2B一个 48.37gydF4y2B一个 50.35gydF4y2B一个 50.59gydF4y2B一个 44.16gydF4y2B一个 70.50gydF4y2B一个 72.86gydF4y2B一个 70.74gydF4y2B一个 67.89gydF4y2B一个 70.47gydF4y2B一个 72.64gydF4y2B一个 70.35gydF4y2B一个 68.41gydF4y2B一个
16000年gydF4y2B一个 54.12gydF4y2B一个 53.40gydF4y2B一个 50.48gydF4y2B一个 58.49gydF4y2B一个 73.61gydF4y2B一个 76.17gydF4y2B一个 74.23gydF4y2B一个 70.44gydF4y2B一个 72.72gydF4y2B一个 75.16gydF4y2B一个 73.45gydF4y2B一个 69.54gydF4y2B一个
18000年gydF4y2B一个 52.95gydF4y2B一个 59.29gydF4y2B一个 55.08gydF4y2B一个 44.48gydF4y2B一个 75.38gydF4y2B一个 78.84gydF4y2B一个 74.99gydF4y2B一个 72.31gydF4y2B一个 74.32gydF4y2B一个 76.51gydF4y2B一个 75.40gydF4y2B一个 71.07gydF4y2B一个
20000年gydF4y2B一个 57.33gydF4y2B一个 58.04gydF4y2B一个 54.54gydF4y2B一个 59.42gydF4y2B一个 77.20gydF4y2B一个 80.87gydF4y2B一个 77.05gydF4y2B一个 73.69gydF4y2B一个 76.82gydF4y2B一个 78.91gydF4y2B一个 78.04gydF4y2B一个 73.51gydF4y2B一个
22000年gydF4y2B一个 58.04gydF4y2B一个 57.21gydF4y2B一个 59.24gydF4y2B一个 57.67gydF4y2B一个 79.54gydF4y2B一个 82.80gydF4y2B一个 79.70gydF4y2B一个 76.13gydF4y2B一个 78.48gydF4y2B一个 80.72gydF4y2B一个 79.70gydF4y2B一个 75.02gydF4y2B一个
24000年gydF4y2B一个 55.44gydF4y2B一个 62.44gydF4y2B一个 59.14gydF4y2B一个 44.75gydF4y2B一个 81.18gydF4y2B一个 85.61gydF4y2B一个 80.80gydF4y2B一个 77.14gydF4y2B一个 80.37gydF4y2B一个 82.28gydF4y2B一个 82.03gydF4y2B一个 76.80gydF4y2B一个
26000年gydF4y2B一个 57.85gydF4y2B一个 61.98gydF4y2B一个 62.52gydF4y2B一个 49.05gydF4y2B一个 83.02gydF4y2B一个 86.31gydF4y2B一个 82.70gydF4y2B一个 80.06gydF4y2B一个 83.34gydF4y2B一个 85.46gydF4y2B一个 84.48gydF4y2B一个 80.07gydF4y2B一个
28000年gydF4y2B一个 60.42gydF4y2B一个 62.81gydF4y2B一个 62.56gydF4y2B一个 55.89gydF4y2B一个 85.01gydF4y2B一个 88.52gydF4y2B一个 85.25gydF4y2B一个 81.25gydF4y2B一个 84.69gydF4y2B一个 87.32gydF4y2B一个 86.04gydF4y2B一个 80.70gydF4y2B一个
30000年gydF4y2B一个 59.74gydF4y2B一个 67.91gydF4y2B一个 61.47gydF4y2B一个 49.85gydF4y2B一个 85.60gydF4y2B一个 89.44gydF4y2B一个 85.78gydF4y2B一个 81.58gydF4y2B一个 86.54gydF4y2B一个 89.33gydF4y2B一个 87.92gydF4y2B一个 82.39gydF4y2B一个
32000年gydF4y2B一个 62.32gydF4y2B一个 65.73gydF4y2B一个 63.52gydF4y2B一个 57.72gydF4y2B一个 84.90gydF4y2B一个 88.06gydF4y2B一个 85.56gydF4y2B一个 81.06gydF4y2B一个 87.65gydF4y2B一个 90.15gydF4y2B一个 88.55gydF4y2B一个 84.25gydF4y2B一个
34000年gydF4y2B一个 63.60gydF4y2B一个 68.72gydF4y2B一个 65.44gydF4y2B一个 56.64gydF4y2B一个 84.96gydF4y2B一个 88.28gydF4y2B一个 85.79gydF4y2B一个 80.82gydF4y2B一个 87.92gydF4y2B一个 90.96gydF4y2B一个 89.55gydF4y2B一个 83.26gydF4y2B一个
36000年gydF4y2B一个 64.70gydF4y2B一个 72.76gydF4y2B一个 65.55gydF4y2B一个 55.80gydF4y2B一个 85.13gydF4y2B一个 88.11gydF4y2B一个 85.42gydF4y2B一个 81.87gydF4y2B一个 87.34gydF4y2B一个 89.36gydF4y2B一个 88.08gydF4y2B一个 84.57gydF4y2B一个
38000年gydF4y2B一个 63.73gydF4y2B一个 69.71gydF4y2B一个 65.50gydF4y2B一个 55.98gydF4y2B一个 85.65gydF4y2B一个 89.40gydF4y2B一个 85.33gydF4y2B一个 82.21gydF4y2B一个 87.90gydF4y2B一个 89.62gydF4y2B一个 89.28gydF4y2B一个 84.79gydF4y2B一个
40000年gydF4y2B一个 71.77gydF4y2B一个 70.26gydF4y2B一个 67.52gydF4y2B一个 77.54gydF4y2B一个 85.02gydF4y2B一个 88.46gydF4y2B一个 85.83gydF4y2B一个 80.76gydF4y2B一个 87.69gydF4y2B一个 89.88gydF4y2B一个 88.17gydF4y2B一个 85.04gydF4y2B一个
42000年gydF4y2B一个 67.62gydF4y2B一个 71.46gydF4y2B一个 69.78gydF4y2B一个 61.63gydF4y2B一个 85.12gydF4y2B一个 89.47gydF4y2B一个 84.89gydF4y2B一个 80.99gydF4y2B一个 87.58gydF4y2B一个 90.27gydF4y2B一个 87.99gydF4y2B一个 84.48gydF4y2B一个
44000年gydF4y2B一个 69.25gydF4y2B一个 71.82gydF4y2B一个 66.45gydF4y2B一个 69.47gydF4y2B一个 84.79gydF4y2B一个 87.91gydF4y2B一个 84.47gydF4y2B一个 81.99gydF4y2B一个 87.57gydF4y2B一个 90.56gydF4y2B一个 88.08gydF4y2B一个 84.08gydF4y2B一个
46000年gydF4y2B一个 66.42gydF4y2B一个 71.26gydF4y2B一个 71.02gydF4y2B一个 56.99gydF4y2B一个 85.04gydF4y2B一个 89.01gydF4y2B一个 84.45gydF4y2B一个 81.66gydF4y2B一个 87.15gydF4y2B一个 89.48gydF4y2B一个 88.64gydF4y2B一个 83.33gydF4y2B一个
48000年gydF4y2B一个 66.19gydF4y2B一个 70.46gydF4y2B一个 66.96gydF4y2B一个 61.15gydF4y2B一个 85.05gydF4y2B一个 88.37gydF4y2B一个 85.10gydF4y2B一个 81.66gydF4y2B一个 87.21gydF4y2B一个 89.27gydF4y2B一个 88.42gydF4y2B一个 83.95gydF4y2B一个
50000年gydF4y2B一个 70.33gydF4y2B一个 68.86gydF4y2B一个 70.35gydF4y2B一个 71.78gydF4y2B一个 84.59gydF4y2B一个 88.73gydF4y2B一个 84.78gydF4y2B一个 80.27gydF4y2B一个 87.42gydF4y2B一个 90.69gydF4y2B一个 87.68gydF4y2B一个 83.91gydF4y2B一个

为了清楚不同的融合方法,映射值与迭代次如图gydF4y2B一个 13gydF4y2B一个。gydF4y2B一个

映射结果并与其他方法进行比较(%)。gydF4y2B一个

从上面的结果和比较,可以看出RCNN更快的检测精度优于其他方法,但差别不是很大。有人知道由罗V3与原方法相比(gydF4y2B一个 30.gydF4y2B一个),该方法可以更精确的检测,方案2更有效。收敛的方法是不同的;YOLO V3意思方法收敛迭代28000次之后,这是早于快速RCNN和RCNN更快。40000次迭代后,所有方法不能提高检测精度,原因是缺乏水下样本数据集,数据集的图像相似,尤其是图像的背景都是相同的。这是水下目标检测的主要原因,在深海水下数据难以获得。gydF4y2B一个

最初的网络提出了不稳定;结果波动随着迭代次数增加。修改后的方案提出了改进稳定性和准确性,如图gydF4y2B一个 13gydF4y2B一个。与其他典型方法相比,我们提出的方法可以给一个更准确的结果。gydF4y2B一个

损失函数曲线如图所示gydF4y2B一个 14gydF4y2B一个,损失值的方法是收敛,和损失值的振幅YOLO V3方法更小而快RCNN[意思gydF4y2B一个 6gydF4y2B一个]和更快的RCNN [gydF4y2B一个 27gydF4y2B一个];该方法的收敛速度比原来的更慢YOLO V3方法[意思gydF4y2B一个 30.gydF4y2B一个]。gydF4y2B一个

损失曲线的不同的方法。(一)快速RCNN。(b) RCNN更快。(c) YOLO v3。意思(d)方案1。(e)方案2。gydF4y2B一个

对象检测,上述方法的精度是足够的应用,实时检测是更重要的是,和检测速度表所示gydF4y2B一个 3gydF4y2B一个。gydF4y2B一个

检测速度不同的方法(gydF4y2B一个 借据gydF4y2B一个 =gydF4y2B一个 0.7gydF4y2B一个 ,gydF4y2B一个 学习gydF4y2B一个 率gydF4y2B一个 =gydF4y2B一个 0.001gydF4y2B一个 )。gydF4y2B一个

方法gydF4y2B一个 快RCNNgydF4y2B一个 快RCNNgydF4y2B一个 YOLO V3意思gydF4y2B一个 方案1gydF4y2B一个 方案2gydF4y2B一个
时间成本(女士)gydF4y2B一个 96年gydF4y2B一个 85年gydF4y2B一个 20.gydF4y2B一个 22gydF4y2B一个 19gydF4y2B一个

很明显,YOLO V3(意思gydF4y2B一个 30.gydF4y2B一个)方法检测速度快,几乎快四倍RCNN [gydF4y2B一个 27gydF4y2B一个]。基于检测速度和精度分析,方案2是优于其他方法,与RCNN越快,具有相同的精度,该方法的检测速度大约是50帧/秒,即使在NVIDIA TX2卡,检测速度可以达到17 fps,它是足够真实的应用程序中。gydF4y2B一个

5.2。检测结果gydF4y2B一个

以下典型图像是用来证明本文提出的方法(方案2),提供的图像“水下机器人大赛”,和一些图像拍摄的水下ROV。gydF4y2B一个

在水下探测方法方案2是更好因为保留更多的表示信息,比较图所示gydF4y2B一个 15gydF4y2B一个,(a)和(b)是相同的图片,方案2的方法可以检测海参和海胆在左下角,但原来错过了对象。在(c)和(d),左边的海参是错过了由原YOLO V3(意思gydF4y2B一个 30.gydF4y2B一个)方法,这显然是更有效的方法。从图像(a)检测,我们可以看到,海参覆盖的金沙左下角也可以被检测到,这是由人类的视觉很难发现。gydF4y2B一个

检测对比YOLO V3意思方案2的方法。(一)方案2。(b) YOLO V3。意思(c)方案2。(d) YOLO V3。意思gydF4y2B一个

为了验证该方法,选择8图像实验;检测结果如图gydF4y2B一个 16gydF4y2B一个。gydF4y2B一个

方案2的检测结果的方法。gydF4y2B一个

训练模型应用于ROV测试检测效果,天气是多云的,海水是很浑浊的;实时检测结果呈现在图gydF4y2B一个 17gydF4y2B一个。gydF4y2B一个

检测应用于ROV。gydF4y2B一个

见图gydF4y2B一个 15gydF4y2B一个,一些对象是错过了发现,原因是数据集不是足够大,尤其是数据集的图像非常相似;光和背景很简单,所以当训练模型用于检测其他海域或在不同的环境条件下,检测精度会降低或多或少,所以我们的团队正计划拍摄更多的水下图像在不同海域和在不同条件下使数据更丰富,从而达到完美的水下检测。gydF4y2B一个

6。结论gydF4y2B一个

考虑到水下视觉特征,提出了一些新的图像处理程序来处理低对比度和弱照明问题。深提出了CNN方法实现海洋生物的检测和分类,这是普遍公认最快的目标检测方法。水下视觉在低质量,对象总是重叠和阴影,所以原YOLO V3意思gydF4y2B一个 30.gydF4y2B一个水下检测)方法不是很有效;提出了两种方法来处理这些问题。通过检测结果与其他方法比较,方案2可以给一个更好的检测。训练有素的模型是用来帮助ROV水下检测对象;虽然一些对象是错过,但该方法的有效性和能力显然是由定性和定量评价结果验证。该方法适用于我们的水下机器人检测对象,这不是比其他数据集的典型方法。和辍学层和其他技术不重要在这个模型;网络的重建通过使用一个更复杂的算法更有效。gydF4y2Ba

数据可用性gydF4y2B一个

使用的数据来支持本研究的发现可以从相应的作者。gydF4y2B一个

的利益冲突gydF4y2B一个

没有报告的作者潜在的利益冲突。gydF4y2B一个

确认gydF4y2B一个

我们想表达我们的感谢支持中国的国家重点研发项目(批准号2018 yfc0309402)和中央大学的基础研究基金(批准号HEUCF180105)。gydF4y2B一个

林gydF4y2B一个 e . Y。gydF4y2B一个 结合灰色世界,retinex理论在数码摄影自动白平衡gydF4y2B一个 学报第九消费类电子产品国际研讨会,2005。(ISCE 2005)gydF4y2B一个 2005年6月gydF4y2B一个 澳门,澳门gydF4y2B一个 134年gydF4y2B一个 139年gydF4y2B一个 10.1109 / ISCE.2005.1502356gydF4y2B一个 BuchsbaumgydF4y2B一个 G。gydF4y2B一个 颜色知觉空间处理器模型对象gydF4y2B一个 富兰克林研究所杂志》上gydF4y2B一个 1980年gydF4y2B一个 310年gydF4y2B一个 1gydF4y2B一个 1gydF4y2B一个 26gydF4y2B一个 10.1016 / 0016 - 0032 (80)90058 - 7gydF4y2B一个 2 - s2.0 - 0019035311gydF4y2B一个 Van De WeijergydF4y2B一个 J。gydF4y2B一个 GeversgydF4y2B一个 T。gydF4y2B一个 GijsenijgydF4y2B一个 一个。gydF4y2B一个 Edge-based色彩恒常性gydF4y2B一个 IEEE图像处理gydF4y2B一个 2010年gydF4y2B一个 16gydF4y2B一个 9gydF4y2B一个 2207年gydF4y2B一个 2214年gydF4y2B一个 无角的gydF4y2B一个 R。gydF4y2B一个 图像增强的直方图变换gydF4y2B一个 计算机图形学和图像处理gydF4y2B一个 1977年gydF4y2B一个 6gydF4y2B一个 2gydF4y2B一个 184年gydF4y2B一个 195年gydF4y2B一个 10.1016 / s0146 - 664 x (77) 80011 - 7gydF4y2B一个 ZuiderveldgydF4y2B一个 K。gydF4y2B一个 相对有限的自适应直方图均衡化[M] / /图形宝石四世gydF4y2B一个 1994年gydF4y2B一个 学术新闻专业公司。gydF4y2B一个 甘尼gydF4y2B一个 答:美国。gydF4y2B一个 IsagydF4y2B一个 n . a . M。gydF4y2B一个 增强低质量的水下图像通过一体化的全球和地方对比校正gydF4y2B一个 应用软计算gydF4y2B一个 2015年gydF4y2B一个 37gydF4y2B一个 CgydF4y2B一个 332年gydF4y2B一个 344年gydF4y2B一个 10.1016 / j.asoc.2015.08.033gydF4y2B一个 2 - s2.0 - 84941127726gydF4y2B一个 李gydF4y2B一个 C。gydF4y2B一个 郭gydF4y2B一个 J。gydF4y2B一个 水下图像增强dehazing和色彩校正gydF4y2B一个 电子杂志的成像gydF4y2B一个 2015年gydF4y2B一个 24gydF4y2B一个 3,第033023条gydF4y2B一个 10.1117/1. jei.24.3.033023gydF4y2B一个 2 - s2.0 - 84989223346gydF4y2B一个 BraikgydF4y2B一个 M。gydF4y2B一个 ShetagydF4y2B一个 一个。gydF4y2B一个 AyeshgydF4y2B一个 一个。gydF4y2B一个 使用粒子群优化图像增强gydF4y2B一个 《智能系统gydF4y2B一个 2007年gydF4y2B一个 2165年gydF4y2B一个 1gydF4y2B一个 99年gydF4y2B一个 115年gydF4y2B一个 土地gydF4y2B一个 e . H。gydF4y2B一个 颜色视觉的Retinex理论gydF4y2B一个 科学美国人gydF4y2B一个 1977年gydF4y2B一个 237年gydF4y2B一个 6gydF4y2B一个 108年gydF4y2B一个 128年gydF4y2B一个 10.1038 / scientificamerican1277 - 108gydF4y2B一个 2 - s2.0 - 0017640363gydF4y2B一个 929159年gydF4y2B一个 傅gydF4y2B一个 X。gydF4y2B一个 壮族gydF4y2B一个 P。gydF4y2B一个 黄gydF4y2B一个 Y。gydF4y2B一个 廖gydF4y2B一个 Y。gydF4y2B一个 张gydF4y2B一个 X.-P。gydF4y2B一个 丁gydF4y2B一个 X。gydF4y2B一个 一个retinex-based为单身水下图像增强方法gydF4y2B一个 2014年IEEE国际会议上图像处理(ICIP)gydF4y2B一个 2014年10月gydF4y2B一个 法国巴黎gydF4y2B一个 4572年gydF4y2B一个 4576年gydF4y2B一个 10.1109 / icip.2014.7025927gydF4y2B一个 2 - s2.0 - 84948185075gydF4y2B一个 佩雷斯gydF4y2B一个 J。gydF4y2B一个 AttanasiogydF4y2B一个 a . C。gydF4y2B一个 NechyporenkogydF4y2B一个 N。gydF4y2B一个 SanzgydF4y2B一个 p . J。gydF4y2B一个 水下图像增强的深度学习的方法gydF4y2B一个 国际工作会议在自然和人工计算之间的相互作用gydF4y2B一个 2017年gydF4y2B一个 施普林格,可汗gydF4y2B一个 183年gydF4y2B一个 192年gydF4y2B一个 常gydF4y2B一个 C . C。gydF4y2B一个 萧gydF4y2B一个 j . Y。gydF4y2B一个 谢长廷gydF4y2B一个 c·P。gydF4y2B一个 一种自适应中值滤波的图像去噪gydF4y2B一个 2008第二智能信息技术应用国际研讨会gydF4y2B一个 2008年12月gydF4y2B一个 中国上海gydF4y2B一个 346年gydF4y2B一个 350年gydF4y2B一个 10.1109 / IITA.2008.259gydF4y2B一个 2 - s2.0 - 62949085999gydF4y2B一个 角色gydF4y2B一个 c·J。gydF4y2B一个 库马尔gydF4y2B一个 P, P。gydF4y2B一个 水下使用自适应小波子带阈值图像去噪gydF4y2B一个 2010年国际会议在信号和图像处理gydF4y2B一个 2010年12月gydF4y2B一个 金奈,印度gydF4y2B一个 322年gydF4y2B一个 327年gydF4y2B一个 10.1109 / icsip.2010.5697491gydF4y2B一个 2 - s2.0 - 79951588938gydF4y2B一个 KocakgydF4y2B一个 d . M。gydF4y2B一个 CaimigydF4y2B一个 f·M。gydF4y2B一个 当前水下成像的艺术——的过去和未来的憧憬gydF4y2B一个 海洋技术协会杂志gydF4y2B一个 2005年gydF4y2B一个 39gydF4y2B一个 3gydF4y2B一个 5gydF4y2B一个 26gydF4y2B一个 10.4031 / 002533205787442576gydF4y2B一个 2 - s2.0 - 70349409328gydF4y2B一个 张gydF4y2B一个 M。gydF4y2B一个 GunturkgydF4y2B一个 b K。gydF4y2B一个 多分辨率双边滤波的图像去噪gydF4y2B一个 IEEE图像处理的IEEE出版社会信号处理gydF4y2B一个 2008年gydF4y2B一个 17gydF4y2B一个 12gydF4y2B一个 2324年gydF4y2B一个 2333年gydF4y2B一个 10.1109 / TIP.2008.2006658gydF4y2B一个 2 - s2.0 - 57049096977gydF4y2B一个 19004705gydF4y2B一个 MakitalogydF4y2B一个 M。gydF4y2B一个 信息自由gydF4y2B一个 一个。gydF4y2B一个 广义优化反演安斯科姆转换Poisson-Gaussian噪音gydF4y2B一个 IEEE图像处理gydF4y2B一个 2013年gydF4y2B一个 22gydF4y2B一个 1gydF4y2B一个 91年gydF4y2B一个 103年gydF4y2B一个 10.1109 / TIP.2012.2202675gydF4y2B一个 2 - s2.0 - 84871651948gydF4y2B一个 22692910gydF4y2B一个 ForandgydF4y2B一个 j·L。gydF4y2B一个 弗尔涅gydF4y2B一个 g·R。gydF4y2B一个 邦尼gydF4y2B一个 D。gydF4y2B一个 速度gydF4y2B一个 P。gydF4y2B一个 露西:激光水下照相机图像增强器gydF4y2B一个 海洋学报》93年gydF4y2B一个 1993年10月gydF4y2B一个 维多利亚,公元前,加拿大,加拿大gydF4y2B一个 10.1109 / OCEANS.1993.326183gydF4y2B一个 杨gydF4y2B一个 年代。gydF4y2B一个 彭gydF4y2B一个 F。gydF4y2B一个 激光水下目标探测基于伽柏变换gydF4y2B一个 2009年第四届国际会议上计算机科学与教育gydF4y2B一个 2009年7月gydF4y2B一个 中国南宁gydF4y2B一个 95年gydF4y2B一个 97年gydF4y2B一个 10.1109 / iccse.2009.5228518gydF4y2B一个 2 - s2.0 - 70449127812gydF4y2B一个 欧阳gydF4y2B一个 B。gydF4y2B一个 DalgleishgydF4y2B一个 F。gydF4y2B一个 VuorenkoskigydF4y2B一个 一个。gydF4y2B一个 布里顿gydF4y2B一个 W。gydF4y2B一个 拉莫斯gydF4y2B一个 B。gydF4y2B一个 MetzgergydF4y2B一个 B。gydF4y2B一个 可视化和图像增强对多水下激光线扫描系统使用基于图像的渲染gydF4y2B一个 IEEE海洋工程》杂志上gydF4y2B一个 2013年gydF4y2B一个 38gydF4y2B一个 3gydF4y2B一个 566年gydF4y2B一个 580年gydF4y2B一个 10.1109 / JOE.2012.2229066gydF4y2B一个 2 - s2.0 - 84880569807gydF4y2B一个 常gydF4y2B一个 p c . Y。gydF4y2B一个 FlittongydF4y2B一个 j . C。gydF4y2B一个 HopcraftgydF4y2B一个 k . I。gydF4y2B一个 JakemangydF4y2B一个 E。gydF4y2B一个 约旦gydF4y2B一个 d . L。gydF4y2B一个 沃克gydF4y2B一个 j·G。gydF4y2B一个 提高能见度在被动的水下成像深度利用极化gydF4y2B一个 应用光学gydF4y2B一个 2003年gydF4y2B一个 42gydF4y2B一个 15gydF4y2B一个 2794年gydF4y2B一个 2803年gydF4y2B一个 10.1364 / AO.42.002794gydF4y2B一个 2 - s2.0 - 0041882170gydF4y2B一个 12777017gydF4y2B一个 GruevgydF4y2B一个 V。gydF4y2B一个 明镜gydF4y2B一个 j . v . D。gydF4y2B一个 EnghetagydF4y2B一个 N。gydF4y2B一个 先进的集成偏振图像传感器gydF4y2B一个 2009年IEEE车间/国家卫生研究院生命科学系统和应用程序gydF4y2B一个 2009年4月gydF4y2B一个 美国马里兰州贝塞斯达gydF4y2B一个 62年gydF4y2B一个 65年gydF4y2B一个 10.1109 / lissa.2009.4906710gydF4y2B一个 2 - s2.0 - 67650676010gydF4y2B一个 李gydF4y2B一个 Y。gydF4y2B一个 王gydF4y2B一个 年代。gydF4y2B一个 水下偏振成像技术gydF4y2B一个 2009年会议上激光和电子光学和激光和光电学会议上环太平洋地区gydF4y2B一个 2009年8月gydF4y2B一个 中国上海gydF4y2B一个 1gydF4y2B一个 2gydF4y2B一个 10.1109 / CLEOPR.2009.5292718gydF4y2B一个 2 - s2.0 - 71249092087gydF4y2B一个 KrizhevskygydF4y2B一个 一个。gydF4y2B一个 SutskevergydF4y2B一个 我。gydF4y2B一个 辛顿gydF4y2B一个 g . E。gydF4y2B一个 ImageNet与深卷积神经网络分类gydF4y2B一个 ACM的通信gydF4y2B一个 2017年gydF4y2B一个 60gydF4y2B一个 6gydF4y2B一个 84年gydF4y2B一个 90年gydF4y2B一个 10.1145 / 3065386gydF4y2B一个 2 - s2.0 - 85020126914gydF4y2B一个 GirshickgydF4y2B一个 R。gydF4y2B一个 快R-CNNgydF4y2B一个 2015年IEEE计算机视觉国际会议(ICCV)gydF4y2B一个 2015年12月gydF4y2B一个 圣地亚哥,智利gydF4y2B一个 1440年gydF4y2B一个 1448年gydF4y2B一个 10.1109 / iccv.2015.169gydF4y2B一个 2 - s2.0 - 84964588182gydF4y2B一个 他gydF4y2B一个 K。gydF4y2B一个 张gydF4y2B一个 X。gydF4y2B一个 任gydF4y2B一个 年代。gydF4y2B一个 太阳gydF4y2B一个 J。gydF4y2B一个 空间金字塔池深卷积网络视觉识别gydF4y2B一个 EEE交易模式分析与机器智能gydF4y2B一个 2015年gydF4y2B一个 37gydF4y2B一个 9gydF4y2B一个 1904年gydF4y2B一个 1916年gydF4y2B一个 10.1109 / TPAMI.2015.2389824gydF4y2B一个 2 - s2.0 - 84939247735gydF4y2B一个 26353135gydF4y2B一个 他gydF4y2B一个 K。gydF4y2B一个 张gydF4y2B一个 X。gydF4y2B一个 任gydF4y2B一个 年代。gydF4y2B一个 太阳gydF4y2B一个 J。gydF4y2B一个 深层残留图像识别的学习gydF4y2B一个 2016年IEEE计算机视觉与模式识别会议(CVPR)gydF4y2B一个 2016年6月gydF4y2B一个 美国内华达州拉斯维加斯gydF4y2B一个 10.1109 / CVPR.2016.90gydF4y2B一个 2 - s2.0 - 84986274465gydF4y2B一个 GirshickgydF4y2B一个 R。gydF4y2B一个 多纳休gydF4y2B一个 J。gydF4y2B一个 达雷尔gydF4y2B一个 T。gydF4y2B一个 马利克gydF4y2B一个 J。gydF4y2B一个 丰富的特性准确的对象层次结构和语义分割检测gydF4y2B一个 2014年IEEE计算机视觉与模式识别会议gydF4y2B一个 2014年6月gydF4y2B一个 美国哥伦布,哦gydF4y2B一个 580年gydF4y2B一个 587年gydF4y2B一个 10.1109 / cvpr.2014.81gydF4y2B一个 2 - s2.0 - 84911400494gydF4y2B一个 任gydF4y2B一个 年代。gydF4y2B一个 他gydF4y2B一个 K。gydF4y2B一个 GirshickgydF4y2B一个 R。gydF4y2B一个 太阳gydF4y2B一个 J。gydF4y2B一个 更快的R-CNN:对实时检测与地区建议网络gydF4y2B一个 IEEE模式分析与机器智能gydF4y2B一个 2017年gydF4y2B一个 39gydF4y2B一个 6gydF4y2B一个 1137年gydF4y2B一个 1149年gydF4y2B一个 10.1109 / tpami.2016.2577031gydF4y2B一个 2 - s2.0 - 85019258369gydF4y2B一个 27295650gydF4y2B一个 RedmongydF4y2B一个 J。gydF4y2B一个 DivvalagydF4y2B一个 年代。gydF4y2B一个 GirshickgydF4y2B一个 R。gydF4y2B一个 哈蒂gydF4y2B一个 一个。gydF4y2B一个 你只看一次:统一、实时检测gydF4y2B一个 2016年IEEE计算机视觉与模式识别会议(CVPR)gydF4y2B一个 2016年6月gydF4y2B一个 美国内华达州拉斯维加斯gydF4y2B一个 779年gydF4y2B一个 788年gydF4y2B一个 10.1109 / cvpr.2016.91gydF4y2B一个 2 - s2.0 - 84986308404gydF4y2B一个 RedmongydF4y2B一个 J。gydF4y2B一个 哈蒂gydF4y2B一个 一个。gydF4y2B一个 YOLOv3:增量改进gydF4y2B一个 2018年gydF4y2B一个 FinlaysongydF4y2B一个 g D。gydF4y2B一个 TrezzigydF4y2B一个 E。gydF4y2B一个 灰色的阴影和颜色恒常性gydF4y2B一个 十二色成像会议,Is&t-The成像科学技术学会gydF4y2B一个 2004年gydF4y2B一个 美国亚利桑那州斯科茨代尔gydF4y2B一个 37gydF4y2B一个 41gydF4y2B一个 李gydF4y2B一个 C。gydF4y2B一个 郭gydF4y2B一个 J。gydF4y2B一个 PorikligydF4y2B一个 F。gydF4y2B一个 庞gydF4y2B一个 Y。gydF4y2B一个 LightenNet:弱照明图像增强的卷积神经网络gydF4y2B一个 模式识别的字母gydF4y2B一个 2018年gydF4y2B一个 104年gydF4y2B一个 15gydF4y2B一个 22gydF4y2B一个 10.1016 / j.patrec.2018.01.010gydF4y2B一个 2 - s2.0 - 85041445432gydF4y2B一个 越南盾gydF4y2B一个 C。gydF4y2B一个 邓gydF4y2B一个 Y。gydF4y2B一个 阿来gydF4y2B一个 C . C。gydF4y2B一个 唐gydF4y2B一个 X。gydF4y2B一个 压缩减少工件的深卷积网络gydF4y2B一个 2015年IEEE计算机视觉国际会议(ICCV)gydF4y2B一个 2015年12月gydF4y2B一个 圣地亚哥,智利gydF4y2B一个 10.1109 / ICCV.2015.73gydF4y2B一个 2 - s2.0 - 84973866806gydF4y2B一个 上gydF4y2B一个 d . J。gydF4y2B一个 拉赫曼gydF4y2B一个 Z。gydF4y2B一个 WoodellgydF4y2B一个 g。gydF4y2B一个 桥接的多尺度Retinex彩色图像之间的差距和人类观察的场景gydF4y2B一个 IEEE图像处理gydF4y2B一个 1997年gydF4y2B一个 6gydF4y2B一个 7gydF4y2B一个 965年gydF4y2B一个 976年gydF4y2B一个 10.1109/83.597272gydF4y2B一个 2 - s2.0 - 0031188657gydF4y2B一个 18282987gydF4y2B一个 冈萨雷斯gydF4y2B一个 r . C。gydF4y2B一个 森林gydF4y2B一个 r·E。gydF4y2B一个 数字图像处理,新世纪gydF4y2B一个 2017年gydF4y2B一个 美国新泽西gydF4y2B一个 恩格尔伍德悬崖gydF4y2B一个