文摘

在冶金工业领域,确定原料的粒度在运输过程中,是一个必不可少的过程。我们提出一种图像分割方法的政府通讯(全球卷积网络)-Unet提取原料颗粒的轮廓边缘。原材料获取清晰的图像,使用固定工业高速摄影机拍摄操作从上面带式输送机。这时,一个训练有素的GCN-Unet模型用于计算图像和输出结果与颗粒和小零件的轮廓边缘分割的材料。我们结合U-Net与几个全球卷积网络模型和边界优化块和比较的预测结果GCN-Unet U-Net,表明GCN-Unet有更好的预测能力用更少的参数(7876675,而U-Net 31101448参数)和较高的计算速度(大约两倍的速度比U-Net)。根据CNN(卷积神经网络),我们的电脑版本方法几乎可以取代传统手工抽样检验方法相应的总体分析和自动识别的过程。

1。介绍

原材料运输是一个重要的冶金工业领域的联系。一般来说,管状带式输送机或皮带走廊是用于运输原材料。关闭转换的材料运输、材料的晶粒尺寸封闭走廊很难被探测到。由于长途的走廊,传统的手工检测方法效率低下,人员安全问题,这对实际生产有很大的影响。传统手工检查通过手工收集的模式,主要经营手工分析,和手动写信息的传播。操作员需要几公斤的原材料从几吨为例,由筛提取物颗粒材料,手工记录粒度。这种方法最显著的缺点是样本,小于5%的整个材料的数量,也不足以代表。一个原因来解释的难度由自动化设备代替人力是现有的各种传感器不能直接识别的粒度。另一个是输送机的高速,大约是2米/秒,为测量方法造成一些困难。

材料配置文件可以被识别的图像分割算法,以获得粒度。为了获得清晰的样本图像的所有原材料、设置高清摄像机辅以高亮度灯光重新点火,湍急的材料的拍照,实时检测物质粒子对当前皮带运输,并使用深度学习技术来分离材料粒子的照片。粒度可以通过提取好了材料颗粒和它的轮廓边缘。

利用计算机视觉技术,智能工业系统基于卷积神经网络算法可以解决粒度识别的问题。在成熟的现代应用程序,实现自动化工业的人工智能的研究目标是开发人工智能算法和人工智能系统,以获得更好的识别和预测结果(1]。

总的来说,本文的贡献如下:(1)提出了一种新的分割方法有效区分粒度。采用GCN-Unet结构极大地提高了推理效率,提高分类的准确性和本地化的语义分割的基础上政府通讯方法。(2)U-Net的组合结构和政府通讯是伟大的创新和实用的重要性和成功应用于工业现场,大大增加了实时推理效率。

近年来,视觉感知技术已成功应用于工业生产。的作者(2)提出了offline-online NARX神经网络预测烧结的含水量和控制烧结过程中的含水量。一个使用一个自动识别方法视觉头盔分析(3基于人工神经网络(ANN) []3]。行业AI使生产能够适应复杂和变化的工业环境和执行不同的工业任务,从而提高生产力、产品质量和设备性能(4]。

U-Net是一位杰出的图像分割方法从FCN(完全卷积网络)。U-Net构造具有对称结构,其左部作为一个编码器和译码器的一部分。每个维度的它可以包含更多的功能修补渠道,也会保留定位目标对象的更多信息。在[5),H-DenseUNet建议,仿照auto-context算法分割肝脏和肿瘤的有效提取intra-slice为等级聚合体积上下文特征。证明以上所有应用程序的效率和准确性U-Net精细图像分割。

数据集注释方法和网络设计的灵感来自于医学领域。网络如CNL-UNet [6]和MC-Net [7)建立基于U-Net (8)被广泛使用并执行在语义分割为不同的对象。考虑到医学细胞图像的相似性DIC-HeLa数据集(8)和原材料颗粒图像,我们的数据集的方法注释也指医学图像,如图1所示。(b)主要由认识到部分细胞整体区域,而我们的方法(d)关注每个粒度的边缘。通过这种方法,模型学会忽略不规则粒度不执着于彼此之间的差距,只有空白描绘成线,因此,分割速度可能更高,更适用于工业现场。

有三个基本的部分我们的方法:首先,我们标记颗粒边缘的原材料和用白色的微小部分。我们注释90原始图像和多样化的增加操作后,我们得到1710张图片和他们相同的标签。2%的人是在验证集和一些用于培训网络。其次,我们提出的建设GCN-Unet代替卷积层与几个全球卷积网络模块和添加一个边界优化模块。此外,我们设计一个合适的损失函数的情况,前景和背景像素的数量是不平衡的,可以避免网络预测严重偏向于背景,产生GCN-Unet训练成功。

3所示。方法

3.1。网络体系结构

网络体系结构和组件图中所示的细节2(一个)。在输入层,单通道图像大小为288×288进来了。经过几个步骤,包括政府通讯模型、边界优化块,犹如使用2×2和1×1内核,max-pooling层,图像分割结果的输出。在输出层,乙状结肠是用来做激活并产生分割结果。

类似于U-Net [8),整个网络pooling-down路径和一个up-sampling路径在左右,分别。前路径进行收缩而后者一个扩展。后,收缩的每一步路,通道的数量特性是翻了一倍,扩展路径的每一步后,通道的数量特性是减半。GCN模型其次是BR块和一个2×2 max-pooling采样下来操作2步形成一个收缩的一步。政府通讯模块提出了改善在语义分割分类和定位的准确性,同时介绍了BR改善对象边界的定位。扩张的步骤包括激活函数的基础上修正线性单元(up-sampling特征映射,然后2×2卷积),级联映射相应的功能,政府通讯模型,BR块。在最后一层,1×1卷积反映了特征向量类在16个组件的数量。

分类任务需要保持的模型转换的输入(如ResNet [9]和VGGNet [10])不变,所以矛盾来验证GCN模型分类和本地化的优秀性能。分类任务使用密集的连接层(如全连接层(11),和定位任务需要变换敏感模型(如FCN [12])。与此同时,反褶积(12)和depooling介绍了获得高分辨率特征图。为了实现分类和位置同时,GCN模型采用完全卷积模型结构,保留原始输入图像的空间信息,并允许每个像素的预测。最后,每个像素分类的特征映射(13up-sampling]。为了抛弃位置信息,全球池层是一个不完整的连接或使用。此外,为了使功能映射与每个像素分类器有密集的联系,网络结构使用大型卷积核的大小。这种方法也增强了处理不同的转换的能力13]。

政府通讯模型结合1×k+k×1卷积和k××1 + 1k卷积,这地区的密集的连接特性映射是接近13]。每个预期类获得相应的多尺度语义映射了这个方法。类似于(12),反褶积层用于样本低分辨率分地图,然后结合更高。合并后的地图是up-sampled最后一次和最后的语义生成映射到输出最终的预测结果。

BR块可以实现进一步提高定位能力的建模边界对齐,改进预测对象边界附近的残余结构(13]。如图所示的细节2(c)。

3.2。加权损失函数

的加权损失函数由骰子损失函数(14)和一个二进制叉(公元前)损失函数。进行几个实验后,两个组件的系数是决定1和0.2。加权损失函数编写如下:

公元前损失函数是广泛应用于二进制分类任务(15]。这些任务回答问题只有两个选择。几个独立的可以同时回答这样的问题,如二进制图像分割。这里的公元前损失是基于二进制分类乙状结肠,(14)显示,N是样品的数量,因为这等于平均损失的分类熵损失两分的任务。

骰子的损失函数系数经常与杰出的表现出现在粒度分割网络,如完全卷积网络(16]。骰子损失是本文首次提出VNet [14]。骰子损失有利于图像分割涉及一种极端不平衡的积极的和消极的样品17]。细粒度的原材料数据,颗粒的轮廓边缘的利益以及微小材料只占一个小面积的扫描。这常常会导致损失或部分检测的前景和网络预测严重偏向于背景。为了解决这个问题,基于骰子的损失函数系数是用来给样本,提高前台区域的重要性,使其高于背景区域。骰子系数D写如下: 在哪里N是像素的总数,π是一个组件的预测二元分割区P, 地面实况二进制区域的吗G。这种配方的骰子可以分化,产生梯度计算的jth像素的预测14]。

4所示。实验

在实验部分,几个原始场景的工业原材料运输带式输送机。许多图片被选中和注解为原始图像的数据集。在数据准备阶段,原标签注释是规范化和调整后生成标准标签。后数据扩大和细分标准的标签和原始大图,训练集生成。使用相同的数据集,U-Net和GCN-Unet训练部分颗粒原料,和他们的准确性和速度进行了比较。

4.1。数据集

在这个项目中使用的数据集是单通道图像的矿石,焦炭、球团和烧结的场景。这些图像的大小是2048×2448。除了带传达为背景,只包含一种粒子。其他包含粒子和非常小的材料。该算法的目的是认识到粒子的轮廓。粒子轮廓和微小材料用白色标记(像素值255)。背景和粒子区域的颜色用黑色标记(像素值0),如图3。这些单通道标签的大小是2048×2448。

4.2。图像增强

图像增强增加场景的多样性。至于形象,最常用的方法来增加训练样本包括仿射变换,如旋转、扭曲,和镜像变换。几种类型的数据扩充应用:三个翻转操作向不同的方向,两个直方图均衡化操作,对比度增强,意味着模糊,光强度的变化,弹性变形如图4所示。

图像增强的目的是为了避免过度拟合,提高模型的泛化能力。这里,使用图像增强的另一个重要原因是平衡轮廓形状的独特性,增加训练数据集。基于这样的目的,我们有测试最好的训练集数量在1500 - 2000年U-Net学习粒度的轮廓模式,所以我们增加训练数据集89年至1691年的体积。不同的角度,亮度,对比度,颗粒变形,数据集比原来更广泛和普遍。

4.3。数据切割

一个原始图像约有500万像素,这使得它不友好的计算速度。原始图像不应该因为细节会丢失。因此,把原始图像切成小的一个好方法,计算速度不失细节。如数据所示56、图片和标签大小为2048×2448切成72 288×288部分图像。完全6480年部分照片获得了90年原始图像。

4.4。培训细节

如图7显示,GCN-Unet的准确性验证组从86.43%,达到92.77% 20世而U-Net训练后从78.21%开始,终止于87.45%。两个训练精度行显示了一个上升趋势,而GCN-Unet达到更高。图8显示了预测的结果相比,地面真理。

5。讨论:与U-Net相比

如表1所示,传统U-Net 31101448参数,而GCN-Unet得到7876675的,前者的25%左右。参数的大幅缩减率大大提高了网络操作。如表2所示,计算速度GCN-Unet 2048×2448像素的图像是U-Net两倍。此外,引入适当的损失函数和适当的培训后,分割结果远比原来的网络。的预测时间GCN-Unet或多或少U-Net的一半。结果是通过作用于NVIDIA Tesla V100-PCIE-16 GB。

与U-Net相比,GCN-Unet可以识别微小的部分材料。因此,粒子可以更清楚地看到。对于每个小图像之间的拼接,GCN-Unet可以使粒子的轮廓连接更顺利。舱如图8。作为数据8(b)和8(c)所示,由灰度表示程度的信心。纯白色表示100%的信心。原大型图像捕捉到相机,GCN-Unet预测的结果显示在图9。列图9(一个)显示原始图像,图9(b)显示预测图像和数字9(c)显示了地面实况。

6。结论

人工智能技术是迅速而深刻地影响了各个行业,通过视觉感知技术封闭走廊的实时监控是发展的必然趋势,智能原材料领域的绿色制造。目前,视觉智能感知技术在智能原材料领域仍在开发的早期阶段,不能满足生产的需要自动识别异常原料的运输、和不能用作商业技术大规模推广。

确定原料的粒度在交通、计算机视觉方法基于GCN-Unet算法代替传统的手工抽样检验方法相应的总体分析和自动识别过程。GCN-Unet,基于传统U-Net [88),结合几位全球卷积网络模型13)和边界优化块(13用更少的参数),有更好的预测能力(7876675,而U-Net 31101448参数)和较高的计算速度(大约两倍的速度比U-Net)。

因为数据的增加,我们的数据集是良好的普遍性。训练数据集后,我们的模型可以执行良好的识别在不同亮度下的场景。

相比传统的U-Net模型精确88.45%和1 /形象,GCN-Unet精度高5.32%,使用原始计算时间的一半。一定改善U-Net架构可以成功地应用于许多工业任务。

视觉智能感知技术开发这个项目可以有效地促进绿色制造过程的钢铁原材料和原材料工业解决方案智能的发展,促进人工智能技术和产业的深度集成,然后驱动钢铁行业的创新和变革。

正如上面提到的,我们建议GCN-Unet非常实用和创新的重要性,原因如下:与传统UNet相比,我们的方法不仅增加推理速度参数较少,也有更好的分割性能,使该结构应用在通用工业场景。

数据可用性

没有数据被用来支持本研究。

的利益冲突

没有潜在的利益冲突。

确认

这个工作是为国家重点资助RD项目(2020 yfb12800)和重庆市技术创新和应用程序开发项目(sctc2020jscx-msxmX0158)。