研究文章|开放获取
使用Python在不完全数据下对室外聚碳酸酯使用寿命的研究
摘要
聚碳酸酯(PC)的变质取决于各种环境因素。同时,相关风化过程的复杂性也制约了基于环境因素的寿命预测。为阐明PC风化与环境因素的非线性关系,在我国8个试验站进行了3年的自然风化试验。利用额外树和基于Python的多层感知器网络,分析了PC的张力属性数据与环境和污染物数据之间的关系。结果表明:(1)PC拉伸性能的退化主要受实验周期的影响(76.37%),而环境或污染因素对其退化的影响较小(23.63%);(2)训练模型在训练集上的分类准确率为91%(91/100),在测试集上的分类准确率为72.13% (44/61);最后(3)通过对分类结果的误差分析,得出琼海和武汉地区聚碳酸酯的性能变化表现为先减小后略有改善。最后,我们证明了该方法的有效性,特别是在数据不完整的区域。
1.介绍
聚碳酸酯(PC)由于其优异的力学性能和低比重,是一种应用广泛的工程塑料。然而,PC材料的老化是不可避免的,并在很大程度上取决于其应用时的环境因素,例如太阳辐射、温度、接触水和大气污染[1- - - - - -4]。PC的风化除其物理化学性质外,还是多种环境因素共同作用的结果。这些环境因素之间的相互作用是如此复杂,预测PC产品在许多不同环境中的使用寿命是非常具有挑战性的。Hulme and Cooper [5[总结了预测聚合物使用寿命的困难如下:(1)聚合物依赖于时间、温度、环境和应力;(2)聚合物各种性能失效的极限通常是未知的;(3)使用条件一般各不相同,经常包括故障情况;(4)对于复杂应用,在加速测试中不可能完全复制使用条件。然而,当有关时间、温度、环境因素和聚合物力学性能的信息可以收集和大规模分析,上述挑战可以减轻。
人工智能(AI)近年来发展迅速。因此,支持各种AI任务的软件不断被提供。然而,只有少数人使用该软件应用最新的机器学习方法来研究材料的风化机理。有关新算法的信息有限,以及缺乏使用这些算法所需的技能,可能是原因之一。然而,通过附加的基本工具,最先进的AI算法可以通过Python部署,Python是一种适合科学和工程应用的高级语言。使用Python可使人工智能应用程序得以迅速而灵活地发展,并可通过附加扩展进一步加以改善[6]。此外,Python编程语言已成为科学计算领域最流行的语言之一[7]。由于其高水平的交互性和成熟的科学库生态系统,Python是算法开发和探索性数据分析的一个吸引人的选择[8,9]。Python易于学习和应用。因此,在目前的工作中,两种常见的机器学习方法(extra-tree和多层感知器网络)被用于分析各种环境因素和PC材料的力学性能。
事实上,使用Python的或其他的工具,机器学习方法科学应用越来越受到重视整合。Ong等。[10]开发了Python材料基因组学(pymatgen)库,一个强大的,开放源码Python库材料分析。尽管如此,一些研究人员已经应用Python作为研究气候机制的主要手段。同样,机器学习的帮助下,我们可以发现在大型数据集中隐藏的连接。
风化机理的研究仍然是一个显著的和有价值的研究课题。许多研究者通过各种基于实验室的方法,研究风化机制,无论是在宏观和微观层面[11- - - - - -14]。然而,为了在实际应用中加强材料的防护,有必要研究室外材料的风化机理。Liu等人[15]开发了用于基于PC的人工神经网络(ANN)的户外耐候寿命预测系统。
在我国8个暴露台站进行了为期3年的PC自然风化试验。在对风化PC进行拉伸强度和断裂伸长率因子分析后,我们在大规模数据分析过程中统计了所有环境因子值的频率分布,以确定影响最大的因素。因此,我们用一种额外树算法来分离最重要的因素,以减少不相关因素带来的干扰。最后,根据所观察到的特征环境参数、拉伸性能变化参数和使用寿命之间的关系,构建了多层感知器神经网络。在模型中引入了一种指导作用来研究风化机制。这种方法主要有两个优点:一方面,在原始数据没有统一尺度和不完整的情况下,可以最大限度地从收集到的数据中提取信息。另一方面,应用的方法可以在大规模数据分析的基础上识别宏观规律。
2.材料和方法
2.1。材料和样品制备
PC原料(K1300,帝金有限公司)采购。标准哑铃拉伸试样(规长150毫米, 纯PC的横截面)被注射成型一个UA120A注塑成型机(伊之密,中国)上。The injecting temperature, mold temperature, injection pressure, packing pressure, and pressure-holding time were 190°C, 40°C, 700 bar, 150 bar, and 10 s, respectively.
2.2。室外耐候实验
根据ISO 877标准,在国内8个自然暴露站进行了暴露试验。这些观测站被暴露在不同的气候类型中。八站位于武汉(WH、亚热带潮湿的城市气候类型),拉萨(LS、暖温带高原农村气候类型),变苍白(WN、热带海洋气候类型),敦煌(DH、暖温带、干燥和炎热的沙漠气候类型)、沈阳(SY、暖温带、潮湿的城市气候类型),江津(JJ,亚热带,郊区酸雨气候类型)、广州(广州、亚热带潮湿的城市气候类型),和青岛(QD、温带海洋气候类型)(图1)。主要环境因子的月平均值,如月平均、高、低温度(T);月平均、高、低相对湿度(RH);降雨持续时间(RD);降水(P);日照时间(年代);太阳总辐射(G);红外辐射(IR);紫外辐射(UV);二氧化硫(SD); hydrogen chloride (HC); nitrogen dioxide (ND); hydrogen sulfide (HS); sulfate ion rate (SR); ammonia (A); sea salts (SS); pH; sulfate ion (SI); chloride (Cl); and dust fall (DF)—of the exposure sites are supplied in the Supplementary materials (available在这里)。环境参数的数据收集,并从国家物资材料环境腐蚀平台计算。在室外风化的三年持续时间,PC样品固定在对铝合金框架两端,在45°倾斜从水平位置,并直接暴露在南没有任何背衬。
2.3。表征方法
根据ISO 527.2标准,采用通用材料试验机(CMT 6503, MTS系统公司)进行拉伸试验,拉伸速率为20mm /min。
2.4。数据源
所有的环境因素数据均来自该网站http://data.ecorr.org它是为公共研究而建的。原始数据记录在excel表格中,比如表格中显示的表格1和2。我们重点关注了环境因素被完全记录在案的五个领域。我们将这些地区以及数据积累地区(广州、青岛、沈阳、万宁、武汉)作为参考。其余三个区域称为不完整数据区(敦煌、江津、拉萨)。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
在青岛,万宁在沉阳和武汉在广州敦煌,江津2005年和2012年至2014年间和2006年至2014年间,2005年和2014年之间,并且2012年和2014年之间:在介绍实验中使用的数据在不同的时间间隔记录和拉萨。该实验的主要部分依赖于数据收集和预处理,如图1。
2.5。用Python实现的数据分析
2.5.1。带有额外树的属性选择
为了减少后续数学模型的误差,有必要识别出影响PC室外风化过程的最重要因素。因此,我们在属性选择中集成了额外树算法sklearn图书馆。
额外树算法是在随机决策树的基础上发展起来的,是一种经典的机器学习方法。传统的决策树是根据对象的特征是否符合单个分支的过滤条件,将所有对象划分为不同的分支。在算法上介绍了传统决策树的基本过程1。
|
||||||||||||||||||||||||||||||||||||||||||
Geurts等人[16]通过添加以下过程开发了额外树算法,极大地增加了决策树的随机性。
|
||||||||||||||
有关回归问题[16),我们有 在哪里表示输出的方差在样本集 , 和分别指向节点的右分支和左分支。
|
||||||||||||||||||||||||||
此外,Pierre Geurts证明了额外树学习算法可以提供接近最优的精度和良好的计算复杂度,特别是在分类问题上。
选择最优决策属性的标准是样本分类成功的关键。同样,如果将某一特定属性作为决定属性可以显著提高分类精度,那么该属性对于描述样品的风化机理也很重要。因此,有多种方法可以选择最优决定性的属性。
Geurts等人[17已经描述了随机化树在森林中的可变重要性。他们证明了由完全随机化的树和额外树计算出的平均减少杂质(MDI)重要性在评估变量的相关性时表现出令人满意的特性:当且仅当变量不相关且只依赖于相关变量时,它等于零。
利用该方法找出了影响PC材料风化过程的重要因素。
2.5.2。与多层感知网络的耐候性,寿命预测模型
随着人工智能在近几年的发展,人工神经网络获得的数据在各个行业加工广泛普及。有越来越多的方便计算机软件包,可以方便的使用,实现和人工神经网络的应用。例如,仅通过导入若干参数可以相应模型来在Python,这是在目前的工作中使用的实现。
多层感知器网络(作为最早的ANN模型之一)的结构和基本原理已经被许多研究者描述[18]。因此,多层感知器网络如图所示2是用Python实现的。
除了它的基本的使用过程中,sklearn库提供了可在各种情况下工作的备选激活函数和求解算法(权重优化的求解器)。例如,“lbfgs”是一个来自准牛顿法家族的优化器;“sgd”指随机梯度下降;“adam”是指Kingma和Ba提出的基于随机梯度的优化器[19]。此外,在Python的帮助文档中还指出,从训练时间和验证分数来看,默认的求解器“adam”在相对较大的数据集(包含数千个或更多的训练样本)上工作得很好。但对于小数据集,“lfbgs”收敛速度更快,性能更好。因此,本文选择了“lfbgs”求解器。
3.结果
3.1。数据概述和描述
作为表1和2表明,有28个记录的因素总共包括16个气候因素和12分的污染物的因素。根据现有的数据的质量和风化的聚合物材料的机理模型,7个因素(空气压力,风速和风向,太阳辐射天使,pH值,硫酸根离子和在雨中氯离子的浓度)在此不使用由于在与这些因素相关联的数据的高电平噪声的工作。
由于实验控制之外的原因,部分数据未被记录。因此,可以从完整的数据集中得出更准确的结论。因此,需要一种对少量缺失值具有鲁棒性的方法。
首先,构造频率分布图(图)3.和4)对于整个数据集,即对于每个因素,这样数据就可以直观的呈现出来。绘制各环境因子频数分布图,观察不同因子在各区域的分布情况,确定是否可以用中值来适当地表征和模拟实际环境。研究单个关键因素对性能数据的影响有相似之处。计算时,将各因子的最大值和最小值均匀划分为15个区间,根据不同区间内的数据量,确定该因子的总数据频率。
根据频率分布图,关于大多数因素的数据集中在一个特定的区间内,该区间依赖于区域。由于这两种气候因素周期性地随季节变化,所以温度和相对湿度显得比较嘈杂。然而,曲线波动之间存在明显的差异,这表明该噪声不会影响不同区域的环境差异。因此,根据区域选取各因素的中值来表征它们,如表所示3.和4。
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3.2。因素的重要性
类的ExtraTreesClassifier包sklearnPython 3.6的库提供了一个方便的方法来确定每个因素的重要性,如表所示5和6。在使用该算法时,我们以环境因素(包括污染因素和实验时间周期)作为原因,并以材料的断裂伸长率作为结果。随后,重复ExtraTreesClassifier操作100次。用100个结果的平均值和方差来确定每个有统计学意义的因素的重要性。
|
||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||
表5和6表明,实验期间是最重要的因素,因为它表现出的0.7637即比其他因素的较大的一个或两个数量级的重要性。因此,实验期间有助于最显著到PC材料的拉伸性能退化(76.37%)。这与大多数实验室的研究结果一致。此外,剩余的约25%,重要性可以归因于环境因素。这些关系示于图5。
根据已有的研究,高温会影响高分子材料的力学性能。因此,选择重要性参数大于月最高温度的所有因子进行下一步研究。表格7示出了所选择的因素的区域中具有部分缺失数据的数据。最终,数据用在这些区域中所测试的材料的机械性能相结合。
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3.3。培训和测试
对于训练数据集,以预测PC材料的室外使用寿命,我们设置实验期间,作为输出,并在表14个因素(11个环境因素7和3.机械性能:拉伸强度、屈服强度、断裂伸长率)作为输入。为了获得最佳性能,研究了在合理范围内的各种组合(特别是隐层结构和激活函数)。数字6显示了结果。数字6(a)为恒等激活函数;最佳隐藏层结构为27-38,精度达到62.30%。数字6(b)是逻辑激活函数;最好隐藏层结构是12-23,并且所实现的准确度是70.49%。数字6(c)为relu激活函数;最佳隐藏层结构为15-16,获得的精度为72.13%。数字6(d)为tanh激活函数;最佳隐藏层结构为10-31,实现精度为70.49%。
(一)
(b)
(c)
(d)
过拟合是机器学习模型中常见的问题。因此,在训练数据集上所达到的精度不能作为模型性能的参考标准。数字6给出了四种激活函数对几种隐藏层结构的准确性,并表明该精度能够可靠地衡量模型的性能。由图可知,最优组合为“relu”激活函数。
结合“relu”激活函数的两隐层神经网络,分别有15个和16个神经元,分类准确率最好,训练集为91%,测试集为72.13%。
4.讨论
经过100个输入特征训练的模型对训练数据和测试数据的识别准确率分别为91%(91/100)和72.13%(44/61)。此外,还可以从识别的细节中提取额外的信息。表8和9分别对不同的井数据积累区和不完整数据区进行分类。表10和11示出了在井数据的积累区域各种实验周期和不完整的数据的区域的分类精度,分别。
|
||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||
在训练数据的识别方面,青岛和沈阳的观测值(40个观测值)都得到了准确的分类,而万宁和武汉的观测值出现了一次误识别(8/9)(见表)8)。单一的错误识别是由于混淆了12个月和36个月,而没有混淆12个月和24个月,包括不完整的数据区域(表)11)。因此,可以推断出聚碳酸酯室外机械降解的特征是先发生降解,然后略有改善(如图所示)7)假设三个不同实验阶段的数据采集过程中产生的系统误差相同。
暴露于环境12个月和24个月的样品力学性能有明显的恶化。因此,他们之间没有观察到错误的识别。几乎所有的误分类(25/26)都与36个月样本有关。因此,暴露36个月的试样力学性能可能介于暴露12个月和24个月的试样之间。因此,暴露36个月的样本很难准确分类。样本的误分类暴露的频率为36个月样品暴露在12个月或样品暴露在24个月的力学性能取决于暴露了36个月接近样品的样品暴露在12个月或24个月样品暴露。从每个样本中获得的统计数据如图所示7这些研究结果的支持。
考虑图中所示的结果8,黑线是更可能与蓝线比红色的一致。此外,黑色线相交于73%的蓝线。在73%的交叉点也将所述三线分成两个部分:上的交叉点的右侧,所有三行显示出相同的趋势,达到100%它们的最大值;上的交叉点的左侧,红线不同于其它两个通过展示一半圆形峰。这表明,暴露三年(三年样品)的样品具有相似的断裂伸长值分布为一年的样本。然而,在三年的样品的断裂伸长率值将部分地向左移动为风化的结果,这些材料的机械性能的劣化。因此,三年样品的更高的比例达到73%以上之前断裂伸长率和低于73%的较低比例。类似地,在两年的样品具有相同的值分布和显著并浓缩左移,特别是在低于73%的部分。江等人。[20.[研究了双酚A聚碳酸酯的风化机理。他们的结果支持了我们的发现。Jiang等研究表明,这种现象是由风化引起的韧脆韧转变,部分原因是氧化引起的断链和交联之间的竞争。由此推断,我们的聚碳酸酯样品也表现出相同的风化机制。
表格9结果表明,实验区域在不完全数据区分类精度比井数据区分类精度低18.87%。有三个可能的原因:(1)由于在不完整数据区域中可利用的数据较少,中值表征的效果并不好。数据量越小,错误越明显(2)据统计,该数据范围的不完整数据领域的一些因素是远远超过在良好数据的积累区域。因此,识别所述测试数据的难度是超过由有限的训练数据训练的模型的容量(3)从根本上讲,不同的区域环境特征导致了训练数据区和测试数据区聚碳酸酯性能退化的本质差异
5.结论
通过使用Python的集成工具,可以方便地用最先进的数学方法分析数据。用树外算法识别出的影响断裂延伸率的重要气候因素和污染因素具有较高的稳定性和可解释性。此外,重要的参数指导了后续过程中数据的更加合理的使用,提高了多层感知器模型的性能。如果可用的数据数量有限,那么在所有可能的组合中循环使用高计算性能是找到机器学习模型的最优超参数的可靠方法。通过该方法得到的模型能够较准确地识别实验时段。这为大气环境中聚碳酸酯的风化过程研究和防护措施提供了重要的参考价值。
根据误差分析,从宏观上看,聚碳酸酯的室外力学性能先恶化后略有上升。这说明聚碳酸酯的室外风化过程是一个韧性-脆-韧性的转变过程。
用数据积累区样本预测不完全资料区样本的风化期是可行的,但误差不大。此外,利用数据积累较好的地区获得的数据预测某些样品的使用寿命更为准确。
数据可用性
材料机械属性的原始数据所需的再现这些结果不能在作为数据也形成一个持续的研究的一部分,这个时间被共享。环境数据能够在中国Geteway被发现Corrosijon和保护(http://data.ecorr.org/),附件是其中的一部分。
的利益冲突
作者声明,本论文的发表不存在任何利益冲突。
致谢
感谢国家自然科学基金(No. 51133009)的资助。我们也感谢中国科学院化学研究所杨明淑团队在样品制备方面的协助。
补充材料
在文件data.xlsx,片材名称地方-1手段这个地方的气象因素的数据。表名称地方-2装置这个地方的污染因子的数据。在该文件中的所有片材,广州,青岛,沉阳武汉被称为以及数据积累区。剩余的三个区域将被称为不完全的数据区(敦煌,江津,和拉萨)。在所呈现的实验中使用的数据中的各种间隔记录:在2005年青岛和2012之间,并且在2014年;2006年和2014年在沉阳和武汉之间;2005年和2014年在广州之间;与2012年和2014年在敦煌,江津和拉萨之间。在该文件中的所有表中包含的环境因素的每月数据,包括温度(月最大值,最小值,和平均),相对湿度(月最大值,最小值,和平均),大气压(月最大值,最小值,和平均),红外辐射,紫外线辐射,太阳辐射总量,日照时间,沉淀,降雨持续时间; monthly data of the pollutant factors, such as the concentration of sulfur dioxide and hydrogen chloride determined using the instantaneous method; the concentration of nitrogen dioxide, hydrogen sulfide, ammonia, sea salts, and sulfation rate determined using the continuous method; the pH, concentration of sulfate ions, and chloride ions in the rain; and the water-soluble and non-water-soluble dust fall quantity in the year.(补充材料)
参考文献
- “氧在双酚-聚碳酸酯光老化中的作用”,台北:清华大学出版社。聚合物降解与稳定性第2卷第1期1980年,第203-223页。查看在:出版商的网站|谷歌学者
- “塑料的潮湿老化:相对分子质量对聚碳酸酯力学性能和断口形貌的影响”,j.j. Gardner和j.r. Martin著。应用聚合物科学杂志第24卷第2期1979年,第1269-1280页。查看在:出版商的网站|谷歌学者
- M. Diepens和P. Gijsman, "双酚A聚碳酸酯户外加速风化的研究",聚合物降解与稳定性第96卷第1期4,第649-652页,2011。查看在:出版商的网站|谷歌学者
- M. Diepens和P. Gijsman,“双酚A聚碳酸酯的光降解,”聚合物降解与稳定性第92卷,no。3,第397-406页,2007。查看在:出版商的网站|谷歌学者
- A. Hulme和J. Cooper,“工业用聚合物的寿命预测”,密封技术2012年第3期9, 8-12页,2012。查看在:出版商的网站|谷歌学者
- t·e·奥列芬特,《科学计算的Python》,计算机科学与工程,第9卷,no。3, 2007年10-20页。查看在:出版商的网站|谷歌学者
- A. Swami和R. Jain,“Scikit-learn: Python中的机器学习”,机器学习研究杂志第12卷,no。10,第2825-2830页,2012。查看在:谷歌学者
- K. J. Millman和M. Aivazis,《科学家和工程师的蟒蛇》,计算机科学与工程第13卷,no。2,第9-12页,2011。查看在:出版商的网站|谷歌学者
- p·f·杜波依斯,《客座编辑介绍:Python:包括电池》,计算机科学与工程,第9卷,no。3, 2007年7-9页。查看在:出版商的网站|谷歌学者
- s.p.ong, w.d. Richards, a . Jain等人,“Python材料基因组学(pymatgen):用于材料分析的健壮的、开放源码的Python库,”计算材料科学,第68卷,第314-319页,2013年。查看在:出版商的网站|谷歌学者
- “聚碳酸酯的物理老化:焓松弛、蠕变反应和屈服行为”,杨建民,“聚碳酸酯的物理老化:焓松弛、蠕变反应和屈服行为”,大分子第32卷,no。15,第5046-5061页,1999。查看在:出版商的网站|谷歌学者
- J.巴托斯,J.米勒和J. H. Wendorff,“各向同性和各向异性聚碳酸酯物理老化,”聚合物第31卷,no。1990年,第1678-1684页。查看在:出版商的网站|谷歌学者
- “有限张力下聚碳酸酯薄膜的再生和物理老化”,T. Ricco和T. L. Smith,“聚合物第26卷,no。第13页,1979-1984,1985。查看在:出版商的网站|谷歌学者
- 布拉加和山崎,“聚碳酸酯板风化引起的表面微裂纹”,材料科学杂志第11卷,no。1976年,1513-1520页。查看在:出版商的网站|谷歌学者
- 刘海华,周明华,等,“人工神经网络构建的聚合物户外老化寿命预测系统”。1.对聚碳酸酯寿命的预测"聚合物降解与稳定性卷。105,第218-236,2014。查看在:出版商的网站|谷歌学者
- P. Geurts, D. Ernst, L. Wehenkel,《极其随机化的树》,机器学习第63卷,no。1, 2006年3-42页。查看在:出版商的网站|谷歌学者
- G. Louppe, L. Wehenkel, A. Sutera,和P. Geurts,“理解随机树在森林中的变量重要性,”神经信息处理系统的进展卷。2013年,第431-439,2013。查看在:谷歌学者
- 张志军,“人工神经网络在聚合物复合材料中的应用:综述”,复合材料科学与技术第63卷,no。14,第二○二九年至2044年,2003。查看在:出版商的网站|谷歌学者
- D. P.金玛和J.巴,“亚当:随机优化的方法,”计算机科学卷。2014年,文章1412.6980 2014。查看在:谷歌学者
- 蒋丽玲,周敏华,丁玉华,周玉华,丹,“双酚A聚碳酸酯老化引起的韧性-脆-韧性转变”,高分子杂志的研究第25卷,no。2,第39页,2018。查看在:出版商的网站|谷歌学者
版权
版权所有:安江丰等这是一篇开放获取下发布的文章知识共享署名许可,其允许在任何介质无限制地使用,分发和再现时,所提供的原始工作正确的引用。