文摘
一个增强的最近的邻居(nn)分类算法,它使用基于密度的相似性测量除了基于距离的相似性来提高诊断轴承故障诊断的性能。由于其仅使用基于距离的相似性度量,传统的分类精度nn恶化的重叠样品和异常值和极易受邻域大小,。本研究解决这些局限性提出了使用基于距离和密度的措施训练和测试样本之间的相似度。被提议的神经网络分类器是用于提高诊断轴承故障诊断方案的性能,它把不同故障条件下基于混合特征向量提取声发射(AE)信号。实验结果表明,该方案,它使用增强的神经网络分类器,产生更好的诊断性能和更健壮的邻域大小的变化,。
1。介绍
旋转的机器,在行业和普通家庭,使用轴承,以减少摩擦和保证稳定、节能运行。轴承减少噪音和振动水平与机器有关,这是至关重要的长期健康的机器和操作符。尽管轴承非常坚固的组件和有很长的使用寿命;然而,材料疲劳由于工作负荷的变化,由于放电电流,温度应力由于工作温度的变化,腐蚀,操作环境中污染物可以突然导致他们失败。轴承故障可能导致突然关闭机器,导致巨大的经济损失。轴承占50%以上的失败仅在感应电动机(1),这使得他们的状态监测必须防止任何突然的失败。因此,早期和可靠的轴承缺陷检测是非常重要的,因为这些缺陷导致轴承失效。
提出了许多数据驱动技术在轴承故障诊断。这些技术主要利用时频分析故障信号的提取有意义的信息关于潜在的缺点2,3]。故障信号,如定子电流、振动加速度,和声学排放,本质上是不稳定的,因此他们在时频域处理,利用短时傅里叶变换(STFT) [4),小波变换(5- - - - - -10),经验模态分解(EMD) [11- - - - - -15),简要地变换(16- - - - - -18),提取特征信息不同的轴承缺陷。声学排放具有低能量和非常高的带宽。他们捕获使用宽带声学传感器和非常有效的诊断初期故障(19- - - - - -21]。提出了一种数据驱动的方法在轴承故障诊断中提取混合特性的声发射(AE)信号,然后采用提出的增强神经网络分类器来诊断不同的轴承缺陷。
混合特征向量是由计算时间和频域的不同统计措施AE信号包络功率谱。这个相当广泛的构造特性来唯一地标识每个故障状态;然而,所有功能在给定故障分类并不同等效用的正确。此外,一个高维的特征向量必将使分类过程计算更加昂贵。此外,如果特征向量包含很多冗余或不相关的特性,它还可能降低分类器的精度。因此,特征向量的维数减少使用特征选择方法,修剪的高维特征向量并选择只有通过消除次优特性,这将导致分类精度最高。这些最优特性被用来创建一个模型的数据训练分类器,然后使用对未知故障信号进行分类。
由于其简单性和有效性,神经网络通常是首选的解决分类问题。然而,两个因素可以降低其性能。首先,神经网络确定两个样本之间的相似性只使用相似的距离测量;广泛使用的措施是欧几里得距离和曼哈顿距离。第二,分类决策,因此精度敏感街区大小,。这些问题已经突出显示在图1,未知的测试样本的分类决策(显示为红色圆圈)变化与邻域大小的变化。测试样品贴上“B”,而这是标记为“A”。传统的局限性神经网络,由于其使用基于距离的相似性度量,可以克服使用当地的异常因素(LOF) [22,23和本地相关积分(位点)24),这是相似的措施,基于样本数据的密度。因此,在这项研究中,混合相似性度量(即。,both distance and density based) are proposed to improve the diagnostic performance of the classical神经网络,使其更有弹性的选择邻域大小,。
本研究的主要贡献是一个增强提出了神经网络分类器,它使用混合措施数据样本之间的相似度,使之更适应社区大小的选择,,并增加其诊断性能相对于经典神经网络。基于密度的相似性测量(即。,LOF) is used to boost the decision of classical神经网络分类未知样本仅基于欧几里得距离其““最近的邻居使用少数服从多数原则。在提出神经网络,最近的邻居的一个未知的样本不属于同一类,然后LOF用于决定未知的简单的类成员。
剩下的纸是组织如下。节2,提出了故障模拟器设置和数据采集。节3故障诊断方案,提出增强详细讨论了神经网络分类器。节4,提供了实现结果的讨论,然而,在部分5,结论提供工作。
2。故障模拟和数据采集系统
声发射(AE)信号获得使用机械故障模拟器用于模拟不同故障条件下。故障模拟器采用圆柱滚子轴承(FAG NJ206-E-TVP2)元素,与裂缝的不同部分。AE信号收集的轴承nondrive一端模拟器使用宽带声学传感器和基于PCI-2数据采集系统,该样本的AE信号的速度250千赫25]。声学传感器连接到顶部的轴承箱,并在一个近似距离21.48毫米的轴承,如图2。nondrive端轴连接到驱动端通过一个齿轮箱减速比为1.52:1。
(一)
(b)
两种不同尺寸的轴承与裂缝播种(例如,3毫米和12毫米),介绍了这些裂缝上的一个或两个组件轴承研究单一和复合轴承缺陷。AE信号记录与3毫米裂缝和轴承的轴承12毫米裂缝被分组到单独的数据集。此外,对于每个裂纹大小,AE信号记录在两个不同的轴的速度(例如,300 RPM和350 RPM)。因此,总共四个数据集被认为是,每个AE信号记录在不同的轴转速和不同裂纹尺寸。单一的类型和复合轴承缺陷如图3;包括辊上的裂纹(BFR)内水沟(BFI)、外滚道(拍频振荡器),内部和外部调心(BFIO),内在的水沟和辊(BFIR)、外滚道和滚子(BFOR),内外调心和辊(BFIOR)。对于每个轴转速,AE信号对于一个健康的轴承(鲜果串)也记录下来。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
如前所述,AE信号分为4个数据集基于裂纹大小和轴转速,表中给出1。每一个轴承缺陷,90 AE信号记录;每个信号持续时间5秒。类似的,90年AE信号被记录为健康的轴承。因此,每个数据集都包含720 AE信号。
3所示。拟议的轴承故障诊断方法
拟议的轴承故障诊断方法在两个阶段工作,如图4。第一阶段包括一个离线过程包括特征提取和特征选择,详细讨论的部分3.1和3.2,分别。离线过程是用来确定一组最优特性,将产生分类精度最高。在第二阶段,一个在线过程用于分类未知的AE信号的使用提出了增强神经网络分类器。在线过程只计算最优的一组特性对于每个AE信号,仅使用这些特性,它标签未知的AE信号。
3.1。特征提取
为了准确识别每个轴承缺陷,一个高维混合特征向量构造使用AE信号的22个不同的特征。这些特性是有用的在提取最大每个故障的信息26),包括十时域AE信号的统计指标和三频域AE信号的统计指标。这些特性表中列出2随着数学关系的计算。此外,九个统计措施,计算AE信号的包络功率谱,也包含在混合特征向量。包络功率谱的特性包括均方根(RMS)值的三个缺陷频率和两个谐波。缺陷频率包括球通过频率内套(BPFI),球通过频率外环(BPFO)和球的旋转频率(BSF)。为这些缺陷的范围值频率及其谐波如图5。
(一)
(b)
(c)
缺陷的范围值频率和前两次谐波计算使用(1),(2)和(3),分别。 在哪里是显然的数量,是工作频率,错误率,内部缺陷的频率,外部缺陷频率,是笼中的频率,是滚子缺陷频率。
3.2。特征选择
虽然一个高维混合特征向量是非常可取的捕获不同类型的缺陷的特点,该方法的诊断性能可以通过潜在退化无关和冗余功能。此外,一个高维的特征向量计算需要增加成本在特征提取和分类,其中包括不同样本之间的距离和密度的计算25- - - - - -27]。因此,评估原始特征向量来确定一组最优特性,将产生最佳的诊断性能,降低了该方法的计算成本。
在这项研究中,连续向前选择(SFS)是用于特征选择,这是一个简单和快速贪婪的搜索算法。它始于一个最初空集,迭代,然后从最初的选择最重要的特性的集合,。这是通过首先选择一个功能从原来的集合,然后将它添加到集合,,只有新选中的功能最大化的目标函数值,。过程特性被丢弃和移动到下一个功能,如果所选择的特性减少目标函数的值为一组,。SFS的目标函数是由(4),基本上是组内的分离性比同类密实度(25]。组内的分离性是由组内的距离,而是同类密实度。虽然SFS很简单、高效和合理准确,它有自己的缺点。它遭受的嵌套问题;即功能保留一旦不能丢弃,这可能导致非最优特征选择(28- - - - - -30.]。
3.3。增强神经网络分类算法
传统的神经网络分类器标签未知试样根据大多数最近的邻国在训练集。最近的邻居决心使用距离测量,大部分是两个样本之间的欧氏距离。在多类分类问题,每个类的密度是不同的,使用一个基于距离的测量测试和训练样本之间的相似性会导致错误分类,使分类结果敏感街区大小的选择,,如图1。这是因为传统神经网络没有考虑密度的变化在不同的类中。因此,一个增强神经网络分类器,提出了利用基于距离和密度的相似性措施来改善其分类精度。对于一个给定的测试样本,首先计算不同类别的会员概率。这是通过投票的最近的邻居,进而确定使用的欧几里得距离测试样本的所有训练样本。如果会员测试样本的概率是(即之一。,all its nearest neighbors belong to a single class), then the proposed神经网络分类器承认这个结果和标签测试样本根据其最近的邻居。然而,如果会员测试样本的概率小于1,(即。,all the nearest neighbors do not belong to a single class), then the LOF based density measure is used to determine the label of the test sample. The use of LOF in conjunction with Euclidean distance makes the classification performance, of the enhancedk神经网络,对邻域大小,。
如图6,该神经网络首先计算会员使用概率概率未知的测试样品神经网络,利用欧氏距离作为相似性的测量。的概率神经网络不分配任何类标签测试样品;相反,它只计算会员的所有类的概率。
对于每个类,如果会员测试样本的概率小于1.0,然后少数服从多数原则的输出将被忽略,最后加入测试样本使用LOF值决定,如图7。
3.4。计算局部离群值因子(LOF)
当地的离群值因子(LOF)已被用于检测异常值或异常数据点22),概率相对较低的任何类的成员。未知的样本分类,比较其密度与邻国。相应的点与他们的邻居等密度进行分类;即点较低的密度是根据他们的邻居密度较低,而密度较高的点标记显示他们的邻居有更高的密度。LOF可以计算如下:(我)第一个,计算每个数据点的距离””th最近邻(例如,计算),对吗,见图8(一个)。(2)第二个为每个数据点”,”,其可达性对距离的数据点””(即,计算)是真正的点之间的距离”和“的最小值,如图8 (b)。它可以计算如下: (3)第三为每个数据点”,”,其局部密度可达性(例如,)被定义为计算其平均可达性距离的倒数”“最近的邻居,因为在(6)。的价值””设置为16,给定的表3: (iv)最后为每个数据点”,”,其局部离群值系数或LOF值,通过比较其本地密度可达性的”“最近的邻居使用以下关系:
(一)
(b)
LOF值的所有训练样本计算使用(7在训练阶段。未知的测试样本进行分类基于相似性的LOF值他们的邻居。
4所示。结果与讨论
在本节中,讨论实验结果通过提供轴承故障诊断的方法。如前所述,四个数据集被用来测试方法,给出了表的详细信息1。使用增强的方法神经网络分类器,提出了解决传统的局限性神经网络。增强的神经网络分类器与表中给出的参数使用3。
演示的有效性k神经网络分类器,内套故障样本数据集的分类如图19,使用传统和提议神经网络分类器与邻域大小的3和7(即,和)。红色椭圆内所示的样本分类;他们真正的标签是“inner_race_fault”(即,these samples belong to the inner race fault class). However, the classification result of the traditional神经网络分类器的值随(即。,因为);它正确地分类这些样本内座圈故障样本,而,它将这些作为外环故障样本,这是不正确的。这是因为传统神经网络采用少数服从多数原则决定的类标签未知试样。在这种特殊情况下,在最近的三个邻居这些未知的测试样品,两个内套的错,一个是外环的错。因此,的情况下,他们正确地归类为内部种族故障样本。然而,在最近的七个邻居这些未知的测试样品,四是外环内部故障和三个种族的错。因此,的情况下不正确归类为外环故障样本。相比之下,建议nn总是把这些样本内座圈故障样本,无论大小的社区(即。的价值,)。
(一)
(b)
(c)
(d)
被提议的神经网络分类器正确分类这些未知的测试样品,因为它使用LOF,这是一种基于密度的相似性度量。LOF只有当使用最近的邻居的一个给定的测试样本(即不属于同一类。,投票不一致)。因此,类成员概率未知确定测试样品。在这种特殊情况下,,一个给定的概率测试样本属于内部种族断层是66.7%,和它属于外圈故障的概率是33.33%。由于两类成员概率小于1,提出神经网络分类器采用LOF值未知的测试样品和他们的邻居来确定最终的类标签。这是显示在图10显示了LOF值测试样品和他们最近的邻居。LOF值测试样品的外环故障类5.09,5.069和4.979,而内心的种族故障类,他们的LOF值是3.33,3.399,和3.192,分别。如果这些测试样品的LOF值外和内圈故障类的LOF值相比,最近的训练样本,它可以观察到的LOF值内座圈故障的测试样品是类似于LOF值内座圈故障训练样本的类。因此,可以说,这些测试样品异常值的外环故障类和内围层或内座圈故障类的成员。
同样的,当,一个给定的概率测试样本属于内部种族断层是42.86%,和它属于外圈故障的概率是57.14%。在这里,类成员概率小于1,,因此,建议神经网络分类器采用LOF值未知的测试样品和他们的邻居来确定最终的类标签。使用LOF值的测试样品和他们最近的训练样本,测试样本被归类为内部种族故障类的成员。
同样,对于其他数据集和故障类型,这是如何提出的传统的神经网络分类器提高了分类精度神经网络。图中一览无遗11比较这两个分类器的性能,平均分类精度,和表4列出了每个数据集的分类精度和个别故障类型。此外,它还可以观察到,拟议的准确性k神经网络不受邻域大小的影响,,而传统的准确性神经网络在附近随变化大小,。它达到最大精度。
(一)
(b)
(c)
(d)
最优规模的社区,最大化传统的分类精度神经网络,在案件的基础上确定。没有工作的一般规则同样在所有情况下,类,这可能是一个挑战,因为它使整个过程需要大量的计算和呆板。提出的鲁棒性神经网络在社区的大小变化,,使它更加灵活和有效的使用。它提供更好和更稳定的性能。此外,在多类问题的考虑在这项研究中,不同类别的密度不同,传统神经网络执行不佳,因为它没有考虑密度的变化。被提议的神经网络考虑密度变化不同的类,并使用LOF决定在这种情况下测试样本的类成员。
5。结论
在本文中,一个增强最近的邻居(nn)分类算法,提出了采用基于密度和距离相似性措施改善诊断轴承故障诊断的性能。LOF,基于密度的相似性度量是用来提高传统的分类性能nn,恶化的重叠的样本,离群值,多个类分布表现出不同特征。此外,基于距离的相似性度量使传统的分类性能神经网络极易受到邻域大小,。这些限制是通过使用基于距离和密度的相似性度量,在训练和测试样本。使用增强的神经网络分类器,提出了轴承故障诊断的诊断性能方案明显改善,结果是更健壮的邻域大小的变化,。
相互竞争的利益
作者宣称没有利益冲突。
确认
这项工作是支持的基本融合技术在电力行业的发展(贸易、工业和能源,201301010170 d);部分由区域Neo行业领先的人力资源培训计划通过韩国国家研究基金会(NRF),科技部,ICT,和未来规划(NRF - 2016 h1d5a1910564);部分由韩国研究所能源技术评估和规划(KETEP)和贸易、工业、和能源(MOTIE)的大韩民国(没有。20162220100050);部分由业务启动研发由2016年韩国中小企业管理局(赠款S2381631和C0395147);和部分由“领导人工业大学合作”项目由教育部(MOE)。