改进的裂纹检测与识别基于卷积神经网络

抽象

混凝土裂缝是非常严重和潜在的危险。有三个明显的局限性存在在本机器学习方法：识别率低，精度低，而且很长一段时间。基于卷积神经网络改进的裂纹检测可以自动检测图像中是否包含裂纹和标记破解，可大大提高监控效率的位置。实验结果表明，亚当优化算法和批标准化（BN）算法可以使模型收敛速度更快，达到99.71％的最高准确度。

1.简介

传统混凝土用于各种建筑用途，如建筑物、桥梁和大坝，由于使用多年，往往会老化，影响建设设施的问题。为了避免设施老化带来的问题，有必要对设施进行持续的监控和维护。传统的人工检测方法显然不能满足巨大的路面检测需求。目前，许多计算机视觉技术都实现了裂缝的检测。益阳提出了一种基于数字图像处理技术的裂纹检测算法[1]。通过预处理，图像分割和特征提取，益阳获得关于裂纹的图像信息。阈值分割方法平滑接受的输入图像后使用。以确定它们的图像，益阳计算出的圆的面积和周长。然后，通过比较，评价益阳图像中的裂缝的存在。奥利维拉和科雷亚设计的自动裂缝检测系统[2]。探伤这里是基于一个样本。在示例的范例中，可用的图像数据库的子集被自动地选择，并用于系统的图像的无监督训练。他们有基于互不重叠的图像块的分类特征操作。裂缝的宽度。然后基于该检测裂纹块的估计。一种改进的动态编程基础算法来检测裂缝[3]。该算法执行速度快，但精度低。Gabor滤波器来检测裂缝[4]，其具有在检测的简单路面裂纹的良好效果，并严重破用于检测的复杂裂缝。Zhang等[五[]采用四层卷积神经网络(CNN)实现裂纹检测，准确率为87%，有待提高。Zhang等[6提出了一种新的区域生长算法来检测道路的裂纹，这是不适合于检测在道路小而分散的裂纹。同遗传算法（GA）的组合扩展有限元公式（XFEM）已被证明是有效的检测的结构缺陷[7-9]，但这种方法也有很大的局限性。在本文中，一种新颖的方法[10]用于改进卷积神经网络[11，12]，从而使卷积神经网络可以自动检测图像中的裂纹和标记相应的位置上。本文的贡献是双重的。基于卷积神经网络上的第一系统是用于检测在混凝土结构裂缝，具有99.71％的平均精确度良好的技术。其次，对于历史建筑的自动检测系统介绍。为了保证历史建筑结构的完整性，特别是引起衰老和人类活动的砖混结构的退化，它具有定期检查和文物维护一定的参考价值。在实际的技术，无人驾驶技术可以很容易地发现古建筑，桥梁，水坝，和寺庙是不容易被人监视。卷积神经网络用于收集图像，检测裂缝的存在，并标记对应的裂纹。

2.改进基于卷积神经网络

2.1。经典的卷积神经网络

相对于传统的神经网络的反向传播（BP神经网络）12，13]，使用在卷积神经网络重量共享可以大大降低网络参数和加速网络的训练速度。性能比BP神经网络更强。卷积神经网络具有强大的特征提取能力。使用卷积神经网络的优点，卷积神经网络被广泛地应用于各个领域，包括图像分类，对象检测，自动驾驶仪，以及图像样式迁移。

一个典型的卷积神经网络通常包括输入层，卷积层，合并的层（该层之下），完全连接层和输出层，如图1。

2.1.1。卷积层

哪里表示在网络中的层的数量，表示上层，表示层的输出值，和指示网络的重量在水平。重量由随机初始化来进行。该“”符号表示卷积运算，其中ƒ表明卷积的结果被输入到激活函数是非线性化。

2.1.2。汇聚层

汇集层包括最大池，平均池，和随机池。这里，本文中使用的最大池主要讨论。最大池，选择某个区域内的区域中的最大值。

2.2。基于卷积神经的改进

因为要识别的裂纹是从画面的背景色完全不同，识别的任务相对简单。因此，卷积核和网络中使用的集中大小一般都很大，并且网络结构是简单的。该网络批量标准化（BN）[14]后池的每一层。批标准化的数学表达式被归一化，（如图式中2） - （五)。输入被规范化为平均值为0、方差为1的数据分布。然后通过归一化操作破坏数据本身可能的数据分布，并对归一化结果进行矩阵收缩和平移，恢复数据本身可能具有的数据分布特征。批量归一化可以在一定程度上避免模型过拟合。同时，可以加快模型的收敛速度，提高训练的稳定性。

2.2.1。亚当算法

在优化的模型训练的选择方面，而不是传统的SGD [15]优化使用更快的收敛亚当[16]算法，亚当被提交OpenAI的Diederik金玛和多伦多的麦霸的大学2015年ICLR纸（亚当），“一种用于随机优化。”亚当可以设置每一个权重参数的学习率，从而为更频繁地更新，给那些有较少的更新更大的学习率的权重较小的学习速率，而更新的参数。动量技术被引入到考虑的参数更新过去的梯度，使当前时间更新值组成的梯度和最近更新的梯度，可有效减少损失函数的振荡，稳定的培训过程，并加快培养。更新的公式如下：哪里代表网络中的参数，的迭代次数，代表网络学习率，是一个小的浮点数，它是用来避免无意义操作时的分母也为0，代表增加动量因子之后的梯度，以及功能是设置为每个参数单独学习速率。

2.3。网络结构

在本文中所使用的网络结构显示在图2。输入为227像素×227像素的RGB 3通道图像。经过24个20×20的卷积核，步长为2，得到114×114。张量输出为×24，经过7×7，步长为2的池化层输出57×57×24张量，然后通过批处理归一化(BN)和relu激活函数处理进行非线性化。然后，在2的15×15步卷积48次后，得到一个22×22×48张量，在2的4×4步后，得到一个10×10×48张量，在这个张量之后。同样，得到张量后，对其进行批量归一化处理(BN)和relu激活函数进行非线性处理，得到激活的10×10×48张量，再得到10×10步96个卷积，得到1×1×96张量。然后通过大小为2的全连通层，再通过softmax将输出值转换为概率输出，得到结果。注意，在完全连接层中有许多参数。为了避免过拟合，请使用dropout [17]用于随机和成比例地忽略一些节点，使得节点不在此计算工作，并避免过度拟合到某种程度。特定的网络参数配置示于表1。


层	尺寸	操作符	过滤器	Kernel_size	跨越式发展	填充

输入	227 × 227 × 3	C1	24	20×20	2	相同

L1	114 × 114 × 24	P2	-	7 × 7	2	相同

L2	五7 × 57 × 24	BN	-	-	-	-
		线性整流函数（Rectified Linear Unit）	-	-	-	-
		C3	48	15 × 15	2	有效

L3	22 × 22 × 48	P4	-	4×4	2	有效

L4	10×10×48	BN	-	-	-	-
		线性整流函数（Rectified Linear Unit）	-	-	-	-
		C4	96	10 × 10	2	有效

L5	1×1×96	线性整流函数（Rectified Linear Unit）	-	-	-	-
L5	1×1×96	下降	-	-	-	-

L6	1 × 1 × 2	C5	2	1 × 1	1	有效

学习率被设定为0.0001，和学习速率下降到0.99的100每次迭代;漏失被设定为0.5。

3.实证研究

3.1。实验室环境

译者：Python3.6操作环境:世爵Processor: Intel(R) Core(TM) i5-6200U CPU @ 2.60 GHz 2.59 GHz运行内存：4G操作系统:Windows 10企业版机器学习框架：TensorFlow 1.8

3.2。数据集

Mendeley提供的具体间隙图像训练数据集[18]，包括与特定裂纹的图像。测试数据来自中东技术大学校园建设。该数据集被分成两大类，裂化和无裂纹的图像。Each type of image has 20,000 images, and each image has RGB pixels of 227-pixels × 227-pixels, for a total of 40,000 images. The crack data set image is shown in Figure3下面。These 40,000 images are cut from 458 high-resolution (4032 × 3024) images, which are mentioned in Figure3。高分辨率图像的照明等方面有所不同。

3.3。实验结果

在实验开始之前，将数据划分为验证数据集的一部分，模型输出数据批处理的大小为32。在图像输入之前，对图像进行样本归一化，对标签数据进行单热编码。使用图形的网络结构2为了训练。的损耗值被印刷在一次每100次迭代，并且该模型是一次使用验证数据集合中每1000次迭代评估，如图4。如果本次评估的正确率比上一次更大，该模型被保留，如果连续100次少于先前评估的正确率，然后训练停止，其实验证明，使用亚当优化算法和批标准化（BN）可以使模型收敛更快。

After 110 k iteration, the program automatically stops training, and the correct rate of the model is about 99.71%. As can be seen from Figure五，after 11 k iterations, the maximum correct rate is achieved. It takes about 50 minutes. As can be seen from the figure, due to the continuous reduction of the learning rate, the correct rate is gradually stabilized in the later stages of training.

表2显示张的ConvNet通过来自Caffe框架构建，并通过使用训练的5倍交叉验证[五]。从不同的方法，即所获得的结果，支持向量机和升压进行比较。使用ConvNes和Adam，可以看出，每个方法的精确度结果是0.8112，0.736，0.8696和0.9971，分别。最准确的结果是，亚当的方法。


方法	SVM	提高	ConvNets	亚当

精确	0.8112	0.736	0.8696	0.9971

3.4。识别效果显示和分析

用于验证的大尺寸图像来自谷歌图片，所有含裂缝。Since the image resolution is much larger than the 227 × 227 input size of the model, the image is first cut into small images of 227 × 227 and placed into the model. After detection, the results are returned and the crack location is marked in the figure according to the returned results. The specific effect diagram is shown in Figure6。

（一个）

（b）中

（C）

（d）

（e）中

(f)

(g)

通过比较图像的结果，可以看出，该模型能更好地区别与所述裂缝和画面的背景色的对比度图像，如图图6（a），图6（c）和图6（d）。然而,在数据图6（b），6 (e)和6 (f)中，识别效果不是有裂纹其是不明显正确可见。后面这个问题的原因是，裂纹很窄，裂缝的颜色类似于墙的背景色。其结果是很差图6 (g)因为它不识别的裂纹，这可能是由于模型本身是基于图像的黑色解释，以确定是否有裂纹。这个问题的解决方案是黑色添加到训练数据集的背景或包括图片裂缝比较暗线，而使用神经网络做分析。

4。结论

在本文中，使用相对简单的和改进的卷积神经网络的已成功地实现裂纹的识别，并且具有非常高的准确率。对于相对简单的裂纹识别的分析，建议使用大回旋和更少的网络层汇集方法论可以帮助取得更好的成绩。

数据可用性

作者证实，支持这一研究结果的数据的文章中都可用。

利益冲突

作者宣称，有兴趣就本文发表任何冲突。

参考

朱益阳，“基于图像预处理技术的玻璃裂纹检测系统的设计”2014年IEEE第七届联合国际信息技术和人工智能会议论文集（ITAIC），第39-42，IEEE，重庆，中国，2014年12月。查看在：谷歌学术
H.奥利维拉和P. L.科雷亚，“道路自动裂纹检测和表征，”IEEE智能交通系统卷。14，没有。1，第155-168，2013。查看在：出版商网站|谷歌学术
黄玉英，蔡玉英，“一种改进的路面破损分割算法的动态规划与连接部件分析”，运输研究记录：杂志交通运输研究委员会的卷。2225，没有。1期，第89-98，2011。查看在：出版商网站|谷歌学术
M. Salman, S. Mathavan, K. Kamal，和M. Rahman，“使用Gabor过滤器的路面裂缝检测”，载于智能交通系统的第16届国际IEEE会议论文集（ITSC 2013），第二○三九年至2044年，IEEE，海牙，荷兰，2013年10月。查看在：谷歌学术
L.张，杨楼，Y. D.张某和Y朱军，在“使用深卷积神经网络，路面破损检测”图像处理的2016年IEEE国际会议（ICIP）论文集，第3708-3712，IEEE，亚利桑那州凤凰城，2016年9月。查看在：谷歌学术
D.张，李问，Y.陈，曹M.，L.他和B.张某，“一个高效，可靠的粗到精的方法对沥青路面裂缝检测，”图像与视觉计算卷。57，第130-146，2017年。查看在：出版商网站|谷歌学术
S. Teidj，A. Khamlichi，和A. Driouach，“通过逆问题解束裂纹的鉴定，”Procedia技术卷。22，第86-93，2016。查看在：出版商网站|谷歌学术
E. N. Chatzi，B.希里尤尔，H.魏斯曼和A. W.史密斯“的XFEM-GA算法用于检测结构缺陷中的试验应用和增强，”计算机与结构卷。89，没有。7-8，第556-570，2011。查看在：出版商网站|谷歌学术
D. Rabinovich, D. Givoli，和S. Vigdergauz，“使用遗传算法的基于xfemi的裂纹检测方案，”国际期刊工程数值方法卷。71，没有。9，第1051至80年，2007年。查看在：出版商网站|谷歌学术
Y.-J.查，W.彩，和O.Büyüköztürk，“使用卷积神经网络深基于学习的裂缝损伤检测，”计算机辅助土木和基础设施工程,32卷,不。5, 361-378页，2017。查看在：出版商网站|谷歌学术
Y. LeCun，“LeNet-5，卷积神经网络（2015），” 2016。查看在：谷歌学术
D. E.鲁梅哈特，G. E.欣顿，和R·J·威廉斯“由向后传播学习误差陈述，”性质第323卷，no。1986年，第533-536页，6088。查看在：出版商网站|谷歌学术
Y. LeCun，B.宝狮，J.S。骏佳等人，“反向传播应用到手写邮政编码识别，”神经计算卷。1，没有。4，第541-551，1989。查看在：出版商网站|谷歌学术
S.约费和C. Szegedy，“批正常化：通过减少内部协变量移加速深网络训练，” 2015年，http://arxiv.org/abs/1502.03167。查看在：谷歌学术
M. A.沃龙佐夫和V. P. Sivokon，“用于高分辨率的波前相位畸变校正随机平行梯度下降法，”美国光学学会杂志第15卷第2期1998年，第2745-2758页。查看在：出版商网站|谷歌学术
D. P. Kingma和J. Ba，“Adam:一种随机优化方法”，2014，http://arxiv.org/abs/1412.6980。查看在：谷歌学术
N. Srivastava, G. Hinton, a . Krizhevsky, I. Sutskever, R. Salakhutdinov，“辍学:防止神经网络过拟合的一种简单方法”，该杂志的机器学习研究的第15卷第2期1，第1929至1958年，2014。查看在：谷歌学术
数据集，http://dx.doi.org/10.17632/5y9wdsg2zt.1#file-c0d86f9f-852e-4d00-bf45-9a0e24e3b932。

建模与仿真工程

抽象