【机械制造与检测技术】
滚动轴承在机械设备中占据着举足轻重的地位,通常也是机械设备中最容易出现故障的部分[1],据机械故障统计,旋转机械中的滚动轴承故障比例占据了机械故障的40%[2-3]。因此,开展轴承故障诊断研究具有重要意义。
传统故障诊断方法是提取传感器采集原始振动信号中的有用特征,常用的方法有:短时傅里叶变换(STFT)[4],包络分析(EA)[5],小波变换(WT)[6]等。传统的方法是基于理论出发对问题进行分析,虽然在原理上具备可解释性,但诊断精度低。随着“互联网+智能制造”的快速发展,以数据驱动的机器学习方法逐渐应用到故障诊断中。如SVM[7],朴素贝叶斯[8],K最近邻[9]等,与传统信号处理方法不同,这些算法在诊断精度及直观性方面都有较大的提升,但也需要更高的计算能力。这类方法在很大程度上取决于人工特征提取的质量,这就依赖于专家经验和先验知识[10]。
因此,为了克服这一问题,实现特征自提取。近些年,一些学者将深度学习技术应用到故障诊断领域的研究,如深度置信网络(DBN)、深度自动编码器(DAE)[16]、卷积神经网络(CNN)等。其中CNN在轴承故障诊断中的应用最为广泛。文献[11-13]中提出将一维卷积神经网络应用于滚动轴承自适应故障诊断方法。这些研究虽然省去人工提取特征的工作,但基于一维时序信号的处理方法仍存在着丢失特征的缺陷,而将原始时序信号转变为灰度图像信号后进行特征提取会很大程度上改进这个问题[14]。文献[15]中以滚动轴承时频图像作为研究对象输送至ResNet进行分类,实验证明了该方法的有效性。文献[16]中提出一种将振动信号进行灰度转换,然后输入卷积神经网络进行分类,从而实现了对航空故障中介轴承的快速分类的方法。WAN等[17]提出了将深度自动编码器与卷积神经网络相结合的方法,先利用小波变换构造不同状态下的时频图,再采用卷积神经网络对DCAE降噪后的时频图进行故障分类,实验结果验证了该方法可在高噪声情况下具备更高的识别率。上述研究表明,首先将时域信号转为图像形式,然后输入卷积神经网络进行特征提取与分类,同样能取得出色的分类效果。结合CNN的结构特点,其自带的softmax分类器存在着易陷入局部最优的缺陷[18]。由于极限树回归计算分裂的方式具有随机性,选取完全随机所得到最优分叉值,这就有效避免了softmax分类的不足。针对该问题,本文提出一种二维卷积神经网络与极限树回归相结合的自适应轴承故障诊断方法。在此基础上增加随机搜索算法,相较于网格搜索,可快速地检索到该模型较优参数组合。最后将CNN-ETR算法与传统的DT、CNN、CNN-DT算法进行比较,验证了CNN-ETR模型对轴承故障具有很好的分类能力。
CNN具有自动提取复杂的非平稳振动信号特征的强大能力。通常CNN包括若干卷积层、池化层、一个全连接层和一个输出分类器。图1为卷积神经网络基础架构。
图1 卷积神经网络基本结构示意图
根据上述结构,CNN的处理流程如下,无论输入是图像还是数据集都将转换为数组,并将其传递到输入层。然后由卷积层创建的卷积核在前一层的矩阵上进行卷积操作,获得低级特征子图。为了增强神经网络模型的表达能力,引入ReLU让卷积神经网络具有非线性输出的能力。
(1)
其中:表示第j层的第i个输出矩阵;表示第j-1层的第k个输入矩阵;表示处于第j层的第i个输出矩阵及第j-1层的第k个输入矩阵之间的卷积核;n为输入矩阵的数量;是第j层的第i个输出矩阵的偏置,每个卷积层后均有一个池化层,该池化层主要用于减小矩阵的尺寸与参数的数目。通常情况下,采用最大池化以获取特定区域内的最大值为:
(2)
其中:与为第i个特征矩阵进行最大池化操作前后的矩阵;而s代表池化窗口的步幅大小。
在经过重复的卷积和池化操作后,高级特征矩阵会进一步映射为一维向量。最后,通过softmax分类器对运行状态进行分类。若为N种输入信号,类别标签设为i所对应输出yi概率为:
(3)
其中:wi表示由第i个输出神经元连接的权重矩阵;bi是偏置;而x表示softmax层的输入。
极限树回归作为集成分类模型的一种,当特征属性以类别为标准时,随机选择具有类别的样本作为左分支,其他类别样本作为右分支,可以应用基尼系数进行分类
(4)
其中:m为数据集中样本类型的数量; Pi是第i类样本的占比。当特征属性以特征值为标准时,利用与特征值比较大小将样本分类,可以应用均方误差进行分类
(5)
其中, 测试数据共有m个目标数值为模型预测结果。极限树回归就是通过这种方式遍历节点内的所有属性,并选取完全随机所得到最优分叉值进行分叉。
为了提高该算法的准确性,除了将本文模型设计不要过于复杂的同时,仍需对极限树回归中的超参数(评估器、最大深度及学习率等值)的选优。由于集成模型的超参数个数较多,如果使用网格搜索,那么搜索所需时间会将呈指数级增长,而随机搜索会在超参数空间内随机搜寻数十或上百个点,可快速的检索到较优的参数组合,这种做法比网格搜索要快很多,因此本文选用随机搜索算法。
CNN-ETR模型主要包括两部分:训练CNN模型用来提取故障轴承特征;然后将CNN全连接层的128维特征向量输入极限树回归中进行训练及测试,从而诊断出轴承故障。此外,为了进一步提高该模型的诊断精度,采用随机搜索匹配适用模型的较优参数组合。CNN-ERT诊断流程如图2所示。
图2 CNN-ETR诊断流程框图
本研究采用了CUT-2实验平台(见图3)进行数据采集,测试轴承放置在试验台的右端。实验轴承型号为6900ZZ,使用电火花加工技术在轴承内圈、外圈及滚动体上分别布置直径为0.2 mm与0.3 mm的故障(见图4)。轴承故障如图所示,在电机转速为1 500 r/min,采样频率为2K时,选取10种故障类型,每类故障类型包含330个样本,每个样本包含512个数据点(见表1)。样本按照随机75%的训练集和25%的测试集进行划分并用于训练及测试。本次实验在电脑Win10×64位操作系统,处理器为:Inter(R)Core(TM):i5-6500CPU@3.20GHz,RAM:8GB的配置环境下进行的。
图3 CUT-2轴承实验平台
图4 轴承故障位置实物图
表1 CUT-2实验数据
故障位置及直径外圈故障直径/mm内圈故障直径/mm球体故障直径/mm样本长度样本数量样本标签正常51233000.2无无5123301无0.2无5123302无无0.251233030.3无无5123304无0.3无5123305无无0.351233060.20.3无5123307无0.20.351233080.2无0.35123309
3.2.1 激活函数的选择
本次实验选择最常用的Sigmoid、Tanh、ReLU及PReLU四类激活函数进行了比较,为了避免实验结果出现偶然性,采用了10次交叉验证方法,从表2中可以看出,在同等条件下,选用ReLU激活函数能达到最佳实验精度。
表2 不同激活函数性能表
实验卷积层1卷积层2卷积层3全连接层准确率/%1SigmoidSigmoidSigmoidSigmoid74.892TanhTanhTanhTanh95.113ReLUReLUReLUReLU98.454PReLUPReLUPReLUPReLU98.14
3.2.2 优化器的选择
本次实验选用较为常用的Adam、SGD、RMSprop三类优化器,且分别在学习率为0.000 1、0.001、0.005、0.01、0.05五种情况下测试出每种分类器的性能。
如图5所示,Adam优化器在学习率为0.005时取得了最佳分类效果,此外,该优化器在设定区间内(0.000 1~0.05)稳定性最好,因此本次实验选取学习率为0.005的 Adam 优化器。
图5 不同优化器及学习率直方图
3.2.3 批处理样本数目
批处理样本数目指模型每轮更新参数所需训练的样本数量。若批样本处理数目选择较少,即会增加模型陷入局部最优的风险和模型训练时间;若批样本处理数目选择较少,则无法保证模型参数的最佳优化方向[11]。本研究在选取ReLU激活函数,选取Adam优化器及学习率为0.005的条件下测试不同大小的批量训练数据对模型的性能影响。数据大小分别取8、16、32、64、128,实验结果如表3所示,当批量训练数据大小为64时,该模型在测试集上取得最佳的分类表现。因此选取批量训练数据大小为64。
表3 块大小取得的准确率
块大小8163264128准确率/%96.197.499.199.698.5平均训练时间/s53.2241.1534.6923.4829.19
根据上述的参数选择,CNN-ETR模型最终确定的模型参数如表4所示。
表4 CNN-ETR模型参数
参数名称数值全连接层节点数128丢弃率0.25激活函数Relu优化器Adam学习率0.005批量训练数据大小64
为了展示该模型对不同类型故障的提取能力,使用t_SNE技术分别提取不同层的特征映射成二维并进行可视化。具体效果如图6所示。图6(a)为输入原始信号样本的分类结果,可以看出信号之间具有亢余性,导致各类别难以区分。在经过多次的卷积池化操作后,图6(b)展示全连接层的特征提取结果,除第六类样本中少量样本被误分在第五类,及第一类样本中少量样本被误分入第四类中,其余类别的样本均能很好的聚拢在相应区域内。
图6 不同层级的特征可视化效果图
在上述的基础上,更为直观地考察CNN-ETR模型在识别故障轴承的能力及具体细节,本文引入混淆矩阵对诊断结果进行量化分析,在图7中,可以清楚的观察到该模型对每类轴承诊断情况。从总体上来看,该模型准确率平均维持在99%以上,近一半类别故障轴承诊断精度甚至达到了100%,证明了该模型在故障轴承的类别诊断方面具有出色的表现。
图7 多分类混淆矩阵元素图
考虑到在实际工程应用中,滚动轴承发生故障的方式多样化,因此本文对CNN-ETR模型的泛化能力进行了实验,以验证不同故障占比率对该模型精度的影响。在总样本容量保持不变的基础上,分别对故障占比率处于70%~94%的数据进行测试。实验结果如图8所示,可以看出仅故障占比率在76%及82%时,对应的故障识别率略低于99%,分别为98.94%、98.95%,其余测试结果均稳定在99%及以上。证明了该模型具有较好的鲁棒性,对轴承运转状态监测有着重要意义。
图8 故障占比率对算法精度的影响曲线
由于极限树回归由多个决策树组成,为了验证CNN-ETR算法的有效性,本文选取DT、CNN、CNN-DT算法分别进行了对比实验。并将所有实验的准确率、精确率、召回率及F1指标进行了绘制。在决策树模型中,在对数据进行标准化后,选取C4.5生成树算法使用熵,其他参数默认初始化配置。为了增加实验可信度,每种模型取20次重复性试验的平均值。所得结果如图9所示。
图9 对比算法有效性的直方图
从上述可以看出,使用DT模型分类时,准确率、精确率、召回率及F1指标均为最低,这是因为DT模型对有时间序列的数据并不敏感,此外当其在某一节点发生分类错误时,那错误会沿着该节点一直延伸下去。在使用ETR进行分类时,可以看出该模型在组合了大量决策树的基础上,其分类能力有了明显的提升,但依旧在很大程度上取决于人工提取特征的质量。值得关注的是,借助卷积神经网络强大的特征自提取能力,CNN的故障诊断准确率为90.2%,而CNN-DT的故障诊断准确率达到了95.7%,相比于卷积神经网络的训练结果有了较大的改进。CNN-ETR采用了随机搜索算法,可快速搜索极限树回归模型中较优的参数组合,并利用该模型实现快速分类,该算法的故障轴承诊断准确率达到了99.6%,比CNN-DT算法还要高出3.9%,由此从四项分类指标中验证了CNN-ETR模型的有效性。
CNN-ETR是一种结合了卷积神经网络与极限回归树的自适应诊断算法,相较于传统算法具有更高的精确度,并具备以下特点:
1) 在数据预处理阶段,将时域信号转为灰度图像后输入卷积神经网络进行特征提取,可有效地保留信号特征。
2) 利用极限树回归对卷积神经网络提取的特征进行快速分类,可提高故障分类的精度,增加模型的泛化能力。
3) 采用随机搜索算法可快速搜索极限树回归模型中较优的参数组合。分类准确率都能稳定在99%以上,该模型在故障诊断领域中有着良好的识别能力。
[1] ZHANG S,ZHANG S,WANG B,et al.Machine Learning and Deep Learning Algorithms for Bearing Fault Diagnostics-A Comprehensive Review[J].IEEE Access,2019.
[2] CIABATTONI L,FERRACUTI F,FREDDI A,et al.Statistical Spectral Analysis for Fault Diagnosis of Rotating Machines[J].IEEE Transactions on Industrial Electronics.2018,65(5):4301-4310.
[3] TRA V,KIM J,KHAN S A,et al.Bearing Fault Diagnosis under Variable Speed Using Convolutional Neural Networks and the Stochastic Diagonal Levenberg-Marquardt Algorithm[J].Sensors, 2017,17(12):2834.
[4] 李恒,张氢,秦仙蓉,等.基于短时傅里叶变换和卷积神经网络的轴承故障诊断方法[J].振动与冲击,2018,37(19):124-131.
[5] 许萌.基于声发射技术的高速列车滚动轴承健康监测方法研究[D].北京:北京化工大学,2019.
[6] 赵靖,廖英英,杨绍普,等.基于无迹卡尔曼滤波的动态贝叶斯小波变换在轴承故障诊断中的应用[J].振动与冲击,2020,39(11):53-62.
[7] 丁嘉鑫,王振亚,姚立纲,等.广义复合多尺度加权排列熵与参数优化支持向量机的滚动轴承故障诊断[J/OL].中国机械工程:1-9[2020-0717].
[8] 朱兴统.基于核主成分分析和朴素贝叶斯的滚动轴承故障诊断[J].现代计算机(专业版),2019(09):18-22.
[9] 朱兴统.基于小波包分解和K最近邻算法的轴承故障诊断方法[J].装备制造技术,2020(02):24-27+45.
[10] 汪嘉晨.基于特征网络的轴承故障诊断方法研究[D].贵阳:贵州大学,2019.
[11] 顾鑫,唐向红,陆见光,等.基于深度CNN和ELM的滚动轴承故障诊断研究[J].兵器装备工程学报,2020,41(03):154-158.
[12] 曲建岭,余路,袁涛,等.基于一维卷积神经网络的滚动轴承自适应故障诊断算法[J].仪器仪表学报,2018,39(07):134-143.
[13] 宫文峰,陈辉,张泽辉.基于改进卷积神经网络的滚动轴承智能故障诊断研究[J].振动工程学报,2020,33(02):400-413.
[14] 肖雄,王健翔,张勇军.一种用于轴承故障诊断的二维卷积神经网络优化方法[J].中国电机工程学报,2019,39(15):4558-4568.
[15] 黄驰城.结合时频分析和卷积神经网络的滚动轴承故障诊断优化方法研究[D].杭州:浙江大学,2019.
[16] 王奉涛,薛宇航,王洪涛,等.GLT-CNN方法及其在航空发动机中介轴承故障诊断中的应用[J].振动工程学报,2019,32(06):1077-1083.
[17] 万齐杨,熊邦书,李新民,等.基于DCAE-CNN的自动倾斜器滚动轴承故障诊断[J].振动与冲击,2020,39(11):273-279.
[18] 徐瑶,李栓,韩英华.基于CNN-GS-SVM的用户异常用电行为检测[J].控制工程:1-10[2020-07-17].
Citation format:CHEN Gongsheng, TANG Xianghong, LU Jianguang, et al.Research on Fault Diagnosis of Rolling Bearing Based on CNN-ETR[J].Journal of Ordnance Equipment Engineering,2021,42(06):251-255,275.