计算智能和神经科学

在这一页上

文摘介绍数据讨论结论数据可用性的利益冲突确认引用版权相关文章

特殊的问题

计算在Neurorobotics智力和神经科学

把这个特殊的问题

研究文章|开放获取

体积2018年| 文章的ID5060857| https://doi.org/10.1155/2018/5060857

多层混合深度学习垃圾分类和回收的方法

英豪楚 ,¹ 陈黄,¹ Xiaodan谢,² 渤海谭,³ Shyam Kamal ,⁴ 和于宁波熊 ⁵

客座编辑: 乌玛Seeboonruang

收到了 2018年8月12日

接受 2018年9月24日

发表 2018年11月01

文摘

本研究提出了一种多层混合深度学习系统(肉类)自动排序废物处置由个人在城市公共区域。该系统部署一个高分辨率摄像头捕捉图像和传感器来检测浪费其他有用的特征信息。肉类使用CNN-based算法提取图像特征和多层感知器(MLP)方法,巩固形象特征和其他特征信息对废物进行分类可回收或其他人。肉类是人工标注项目训练和验证,实现总体分类精度高于90%在两个不同的测试场景,大大优于参考CNN-based依靠意象的输入方法。

1。介绍

在全球范围内,每年的固体废物预计到2025年将达到22亿吨,这将花费3755亿美元在废物管理1]。废物管理不当会对经济有巨大的不利影响,公共卫生和环境(1]。城市固体垃圾(垃圾)回收被认为是第二个“最环保”的策略来处理城市垃圾的环境保护署(EPA) (2]。有效的废物回收既经济又环保。它可以帮助恢复原始资源,保护能源,减少温室气体排放,水污染,减少新垃圾填埋场等1,3- - - - - -5]。

在发展中国家,垃圾回收通过拾荒者和收藏者贸易依赖家庭分离回收的利润(6- - - - - -8]。在发达国家,社区更多地参与回收计划(9]。一些技术,如机械和化学分类排序,可在发达国家自动垃圾分类(10]。然而,有巨大的潜力提高废物回收甚至在发达国家。美国和欧盟的市政回收率约34%和50%,分别,这是远远低于目标回收率为75% (5,11]。

废物回收的关键障碍包括以下几点:(1)政府计划和预算:政府监管不足和预算对垃圾管理;(2)家庭教育:家庭不知道self-waste回收的重要性;(3)技术:缺乏有效的回收技术;和(4)管理费用:高成本的人工浪费分类(1,8,9]。

深度学习的进展已经导致了前所未有的计算机视觉的改善。卷积神经网络(CNN)是一种最公认的深度学习算法广泛应用于图像分类、分割和检测12- - - - - -15]。因此在这种文学,CNN提出执行垃圾分类。

敬畏et al。16)提出了一个实验性项目使用更快的R-CNN模型分类垃圾分为三类:纸张,回收和垃圾填埋场。这种方法达到平均平均精度为68%。Thung和杨17]部署的支持向量机(SVM)和卷积神经网络(CNN)分类垃圾分为六类。它实现了一个支持向量机的准确率为63%和23%。Rad et al。18)开发了一种GoogLeNet-based视觉应用程序本地化和城市废物进行分类。该研究声称的准确率从63%到77%不同的废弃物类型。多诺万(19]提出使用谷歌TensorFlow和相机捕捉自动排序垃圾堆肥和可回收的对象。然而,作为一个概念项目,到目前为止没有实验结果。米塔尔et al。20.)设计了一个项目来检测图像是否包含垃圾。这个项目使用pretrain AlexNet模型和达到平均87.69%的准确性。然而,这个项目的目标是在图像分割垃圾没有提供垃圾分类的功能。

综述,文献中出现的自动分类方法只部署映像的CNN和导致有限的精度。在这项工作中,我们提出一个多层混合法(肉类)来执行垃圾分类在公共场所。垃圾图片与其他数字信息来衡量传感器被送入系统。系统可以自动排序浪费项目为可回收或其他人。拟议的肉类达到平均精度高于90%,大大优于参考映像的方法。

论文的具体贡献有:(我)首先,本研究达到一个很好的准确性,攷虑应用程序很有用:实验结果表明,肉类达到整体精度高于90%,优于所有废物分类方法在文献中引用。(2)其次,本研究提出一个创新的体系结构来模拟人类的感官和知识过程检查。虽然大多数当前的垃圾分类方法把图像当作唯一的输入,该方法利用一个AlexNet CNN作为“人眼”形象化和提取关键的图像特性从去年致密层。这一系统也可以利用传感器作为“耳朵”和“鼻子”检测其他数值特征信息,仅仅讨论的文献。最终,多层感知器(MLP)作为响应中心(“人脑”)分类垃圾对象通过合并来自不同渠道的信息收集。

本文的组织结构如下:部分2介绍了检查浪费物品、硬件和数据;部分3介绍了提出方法,包括CNN,延时,多层混合系统,和评价指标;部分4提出了相对应的结果和讨论;并给出结论5。

2。硬件和数据

本研究着重于废物中发现城市公共区域,包括公园、街道清洁,绿化和其他休闲区。这些废物大多是处理由个人游客,行人、乘客,偶尔从商业事件。与工业和生活垃圾,大部分的城市固体废物分离奇异物品例如,一瓶奇异或单一的午餐盒1]。

本研究分析共有50个不同的浪费项目中常见的调查区域(1]。其中,40是可回收的,10是其他人。可回收的废物是分为4大类:纸、塑料、金属、玻璃;“他人”类由水果/蔬菜/工厂、厨房垃圾等(表1)。每组由代表项目:纸集团,例如,包括书籍、杂志、杯、盒等。表2礼物浪费物品的详细信息的数量、对应集团和阶级。

2.1。硬件

拟议的系统包括一个高分辨率的相机(模型0 v9712),一座桥传感器(模型HX711AD),和一个电感器(模型TL-W3MB1 PNP型)(表3)。系统硬件选择基于可用性、低成本、效果、安装方便。

研究对象的相机捕捉影像,图像将被转移到个人电脑通过USB 2.0结束。桥的重量传感器是用来测量研究对象,和电感器可以检测是否浪费是由金属。据我们所知,一些研究采用传感系统文献的分类垃圾,比如医疗废物和废水的应用分类使用重量、密度、和纹理检测(3]。因此,我们建议部署桥传感器,电感器,促进固体废物的分类,特别是对于垃圾废物。数字信息的传感器接收和处理通过Arduino电路板。Arduino董事会作为微控制器,它可以读取传感器的输出,将其转换为适当的数值形式,然后传输信息到电脑端。

实验,调查浪费物品放置在一个封闭的盒子有深灰色背景。相机放置在实验箱上有时右前方最大化边际视角。垃圾对象旋转的摄像机来获取观点从不同的角度,所以模拟三维的效果。桥传感器,电感器是直接放置在研究对象测量相应的特征信息。

2.2。数据

共有100个RGB图像捕获每个调查项目,和5000年( )JPG格式的图片总共收集。每个垃圾图像分组的对应数值特征信息作为数据实例,然后手动贴上可回收利用或不培训/测试的目的。

删除不必要的噪声,增强图像的特性和图像捕捉到镜头下预处理Keras框架:http://keras.io/。原始图像(例如,图1)像素分辨率,图像处理。在培训期间,(表9增强图像4),包括图像旋转,高度/宽度改变,重新调节大小,缩放等,是为每个数据实例生成增强培训模式的普遍性21]。

培训模式已经两次测试来验证系统的性能。首先,每个浪费项目放置到系统使用预定义的位置和每一项测试3次。150 ( )测试集生成的第一个测试。其次,每一项随机系统的3倍,另一组150个数据生成。总之,300年创建测试数据,系统将每个人都可回收利用或其他人。

3所示。方法

一个多层混合法(肉类),它由几个子系统,提出了进行垃圾分类。这个系统的核心包括卷积神经网络(CNN)和多层感知器(MLP)。访问系统性能评价指标也在这一节中讨论。

3.1。美国有线电视新闻网

卷积神经网络(CNN)是广泛应用于分析视觉形象(12- - - - - -15]。一般来说,CNN需要包含调查项目作为输入的图像和图像划分为不同的类别。

CNN的独特之处在于它的3 d的神经元:宽度、高度和深度。卷积的CNN由一系列层,轮询层,完全连接层,和归一化层(12- - - - - -15]。卷积的神经元层只会连接到上一层的一个小区域。完全连接层,激活神经元层完全连接到所有的激活神经元在前面的层。完全连接函数可以表示为下面的向前和向后传播数学形式的规则: 在哪里和代表神经元的激活和梯度我在层l和是连接神经元的重量我在层l神经元j在层。

CNN的能力可以控制通过改变尺寸参数和当地建筑结构(12]。近年来,不同的CNN架构变化出现(12,15]。在考虑计算成本和攷虑应用局限性,AlexNet [12)是从事这项工作。

3.2。AlexNet

AlexNet [12]2012年来到现场ImageNet挑战(ILSVRC)显著减少了图像分类前5误差从26%降至15.3%。它是公认的高能力的体系结构。

AlexNet包含8学习层:前五个卷积紧随其后的是三个完全连接层。最后一层的输出输入softmax 1000 -方式可以创造1000个类标签。内核的第二、第四和第五层连接到内核的前层共享相同的GPU。内核在第三层,然而,是完全连接到第二层的内核。Response-normalization层与第一和第二层次。Max-pooling层放置后response-normalization层和第五层。ReLu非线性与每个学习相关层。完全连接层的神经元连接所有神经元在前一层,与每个(4096个神经元12]。

在这部作品中,网络是由以下细节:(我)层0:输入图像的大小(2)层1:与96年卷积过滤器,大小 ,第四步(3)层2:max-pooling大小过滤器,跨步2(iv)第三层:与256年卷积过滤器,大小 ,步1(v)第四层:max-pooling大小过滤器,跨步2(vi)第五层:与384年卷积过滤器,大小 ,步1(七)第六层:与384年卷积过滤器,大小 ,步1(八)第七层:与256年卷积过滤器,大小 ,步1(第九)层8:max-pooling大小过滤器,跨步2(x)层9:完全与512个神经元(十一)层10:完全与512个神经元(十二)层11:完全与22个神经元

神经元的数量在过去的22层设置为平衡数量的废物类别中讨论部分2。一个额外12层,其中包含1与乙状结肠神经元激活函数(可回收1和其他如0),培训期间使用。这一层然后删除的多层混合动力系统集成到摄食22层11的输出图像的特性。为此,CNN降低了低维表示的高维图像只健壮的特性。也储备重要身份特征的信息可能被最终包装分类(22]。此应用程序广泛采用人脸验证问题,人脸识别作为二元分类问题。

3.3。中长期规划

多层感知器(MLP),其中最深度学习建立结构非线性分类和回归,经常用于建模和预测(23- - - - - -26]。

放置在层的神经元,中长期规划的基本处理元素。第一层之间的层(输入)和最后一层(输出)被称为隐藏层。从事这项工作向MLP与10 1隐层神经元的建议(25),这个网络能够适应任何连续函数。每层神经元和加权输入,添加一个偏差之和,然后激活函数应用到过程之和,计算输出。神经元的信号处理可以在数学上表示为在哪里的输出是什么当前层神经元,和的重量和偏见吗输入的神经元,米输入的数量,是前一层的输出f是激活函数,这是一个s形的函数在这工作。

3.4。多层混合系统

多层混合系统(肉类)开发的这项工作模拟人类的感官和情报处理系统。肉类是综合了几个相互依存的子系统,包括:(1)图像系统(2)传感器系统和(3)中央端分类系统。

图2说明了多层混合动力系统三个子系统及其相关组件进行交互。箭头指示的处理流程和交互子系统。

当浪费项目接收到混合动力系统,摄像机和传感器被激活观察项。成像系统由摄像头捕捉图像,分析的CNN。传感器系统,同时,函数来获得对象的数字信息。最终的结果(二进制输出)获得使用延时系统,其输入是22输出从CNN和数字信息的传感器。中长期规划在这方面,系统可以被训练独立于CNN模型,和CNN的重量和偏见参数模型可以保持不受影响。另一方面,作为CNN的输出输入延时,这两个模型实际上函数同时生成二进制分类结果。

3.5。评价指标

每个分类预测提出系统相比,手动分类标签,设置为“真理”。混淆矩阵见表5量化的,也有失误自动分类系统。CNN-only模型完全相同的结构上面所讨论的是训练和评估作为参考模型。

系统性能评估精度,精度和召回。分类的准确性被定义为图像的比例正确分类:

精度,因此,代表分类预测系统的正确性。

召回代表分类预测系统的有效性。

将预测精度和召回可以减少偏见造成的不平衡数据集:少数类很难学习和模型往往与高度倾斜的数据在预测多数类(26]。

4所示。结果和讨论

肉类模型,训练用5000年的数据情况下,评估下两个不同的场景:物品放置固定和随机取向。模型表现与CNN模型相比,唯一的输入图像。每个模型的分类结果展示在表6。

表中给出的评估结果6表明,肉类方面明显优于CNN-only模型这三个矩阵(精度、精度和召回),特别是对“他人”的类别。

肉类达到准确率超过90%的第一次和第二次测试,这是比CNN-only模型(表高出10%6)。肉类模型也达到更高的精确率为98.5%,97.1%,88.6%,85.9%,分别指示肉类模型的有效性在预测可回收的物品。此外,肉类模型显示了巨大的性能召回(分别为99%和92%,第一次和第二次测试),表明,肉类是高度敏感的识别专用的可回收的垃圾物品。

以下表格显示三组的代表物品从测试结果返回。表7代表项正确分类肉类和CNN;表8代表项目正确分类的肉类,但错误分类的CNN。表9由项目分类精度较低的模型。

它可以注意到肉类和CNN调查项目时表现良好有很强的图像特征(表7)。然而,CNN表现不佳时浪费项目缺乏独特的形象特征,特别是对“其他”浪费。

例如,啤酒盖的图片和透明盒(表8)较弱区别实验背景。CNN很难提取图像特征在训练,因此在测试中失败。卷心菜项是不规则的外观显示不同的数据不同方向的位置。CNN模型本身不够充分准确的构造特征模式分类。蛋的人物,另一方面,过于简单的转移培训足够的信息模型导致有限的性能。

CNN只依赖于图像信息,如果研究项目是在图像的特性,其分类性能将受到负面影响。肉类可以解决这个问题通过集成图像和其他特性的信息。在图像信息不足的情况下,肉类可以利用其他有用的特性来决定最适当的分类。然而,对于物品的图像特征和其他数值特性都很弱,他们的肉类分类错误可能会增加。例如,肉类杯子的准确率约为60%(表9)。后检查每个错误分类的情况下,我们发现造成这些错误的主要原因是,这些对象有圆柱形状,通常被误诊为可回收的瓶子。

5。结论

自动分类系统基于多层混合深度学习(肉类)提出了分类处理垃圾在城市公共区域。系统模拟人类感官和情报处理系统通过部署高分辨率相机一起多个功能传感器。多层混合方法包括三个相互依赖的子系统,包括一个图像处理系统中,数字传感器系统和多层感知器(MLP)系统。图像处理系统部署AlexNet CNN提取垃圾图像信息作为输入电路的延时。传感器系统旨在测量其他废物特性数值输入延时。肉类是用于自动分类可回收或其他人的浪费项目形象和感官渠道整合信息。

总共50浪费项目是用来评估肉类的性能,这也是与CNN-only模型相比,只需要图像作为输入。结果表明,肉类达到显著提高分类性能:总体性能精度分别为98.2%和91.6%,(参考模型的准确性是87.7%和80.0%)在两个不同的测试场景。

此研究表明,提出的肉类的潜力提高垃圾分类的效率和有效性。在考虑废物的体积不断增加全球环保废物处理的迫切需求,提出的肉类都是经济和环境有益的。

数据可用性

图像和数值数据用于支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

作者欣然承认Shiwei秦提供的支持,鑫赵,和仙岳冯在废物的收集物品,协助硬件准备、数据分析和算法优化。作者也欣然承认这项技术的建议Yuanhui唐实验室和东莞理工大学的支持平台。这项工作部分是由中国国家自然科学基金资助(批准号11702073),深圳市重点实验室基金的机制和控制航空(批准号深圳ZDSYS201703031002066),基础研究计划(批准号。JCYJ20170413112645981和JCYJ20170811160440239)。

引用

d . Hoornweg和p . Bhada-Tata浪费:全球对固体废物管理美国,世界银行,华盛顿特区,2012年。
r·e·桑德森联邦环境保护局办公室活动的指导将EPA的污染防治战略纳入环境审查过程EPA,华盛顿,美国,1993年。
p·t·威廉姆斯,废物处理和处置威利,西萨塞克斯郡,英国,2005年。
t·h·克里斯滕森e .亲切的a . Boldrin a·w·拉森b . p . Weidema和m . Hauschild“C平衡,二氧化碳排放和全球变暖潜力LCA-modelling的废物管理系统”废物管理与研究,27卷,不。8,707 - 715年,2009页。
视图: 出版商的网站 | 谷歌学术搜索
美国环境保护署,事实和数字有关的材料,浪费和回收EPA,华盛顿,美国,2018年,https://www.epa.gov/facts-and-figures-about-materials-waste-and-recycling/advancing-sustainable-materials-management-0。
o . Kofoworola“复苏和回收实践在城市固体废物管理在拉各斯,尼日利亚,”废物管理,27卷,不。9日,第1143 - 1139页,2007年。
视图: 出版商的网站 | 谷歌学术搜索
j . Tai w·张,y切,d,“都市固体废物source-separated收藏在中国:一个比较分析,“废物管理没有,卷。31日。8,1673 - 1682年,2011页。
视图: 出版商的网站 | 谷歌学术搜索
a . m . Troschinetz十二个影响因素可持续发展中国家城市固体废物的再利用美国密西根科技大学霍顿,MI, 2005。
n . Kollikkathara h·冯·e·斯特恩,“废物管理进化的范围:特别强调美国“废物管理卷,29号2、974 - 985年,2009页。
视图: 出版商的网站 | 谷歌学术搜索
美国Al-Salem、p . Lettieri和j . Baeyens”塑料固体废物回收和复苏路线(PSW):复习一下,”废物管理卷,29号10日,2625 - 2643年,2009页。
视图: 出版商的网站 | 谷歌学术搜索
欧洲环境局废物回收,2018,https://www.eea.europa.eu/data-and-maps/indicators/waste-recycling-1/assessment。
a . Krizhevsky i Sutskever, g·e·辛顿“ImageNet分类与深卷积神经网络,”诉讼的神经信息处理系统会议太浩湖,CA,美国,2012年12月。
视图: 谷歌学术搜索
p . Sermanet d特征,x, m·马蒂厄·r·费格斯,和y Lecun (“OverFeat:综合识别、定位和检测使用卷积网络”学报学习国际会议上表示2014年4月,加拿大班夫。
视图: 谷歌学术搜索
m . d . Zeiler和r·费格斯“可视化和理解卷积神经网络”学报》13日欧洲计算机视觉(大会)2014年9月,瑞士苏黎世。
视图: 谷歌学术搜索
k . x张,他任美国,j .太阳,“深残余学习图像识别,”计算机视觉与模式识别会议学报》上美国,拉斯维加斯山谷,NV, 2016年6月。
视图: 谷歌学术搜索
o .敬畏,r·门格斯图,诉Sreedhar“智能垃圾净:浪费定位和分类,“arXiv预印本,2017。
g . Thung和m .杨”分类的垃圾再循环能力状态,“arXiv预印本,2016。
m . s . Rad, A . v . Kaenel A Droux et al .,“计算机视觉系统定位和分类废物街道上,”计算机视觉系统施普林格,页195 - 204年,可汗,瑞士,2017。
视图: 谷歌学术搜索
j·多诺万,这家网站TechCrunch Disrupt Auto-Trash垃圾自动分类,2018,https://techcrunch.com/2016/09/13/auto-trash-sorts-garbage-automatically-at-the-techcrunch-disrupt-hackathon/。
g·米塔尔,k b Yagnik m . Garg n c·克里希,“SpotGarbage:智能手机应用程序来检测垃圾使用深度学习,”《2016年ACM国际联合会议上普遍的和无处不在的计算美国,纽约,纽约,2016年。
视图: 谷歌学术搜索
S.-T。弓,模式识别和图像预处理泰勒和弗朗西斯,阿宾顿,英国,2002年。
y Taigman, m·杨,m . Ranzato和l .狼”DeepFace:缩小差距以人类性能验证,”程序的计算机视觉和模式识别(CVPR), 2014年IEEE会议2014年,哥伦布,美国。
视图: 谷歌学术搜索
微积分,神经网络:一个全面的基础新世纪,Inc .鞍上游,新泽西,美国,2008年。
c . m .主教“神经网络及其应用”审查的科学仪器,卷65,不。6,1803 - 1832年,1994页。
视图: 出版商的网站 | 谷歌学术搜索
m·尼尔森神经网络和深入学习,决心出版社,2015年。
f .教务长,“机器学习从101年不平衡数据集”AAAI学报》2000年研讨会不平衡数据集美国CA,门洛帕克,2000年。
视图: 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

17724年

下载

5292年

引用