装备可靠性工程专栏
异步电机在船舶机械传动结构中得到了广泛的应用。但由轴承引发的故障在异步电机故障中所占比例最大,约为40%[1]。因此对异步电机内的轴承进行故障诊断研究具有重要意义[2],可以减少设备停机时间、降低维护成本,并保证电机的可靠性和安全性,对降低故障率、保证动力系统的正常运行至关重要。
传统的电机轴承故障诊断方法主要是通过频谱分析仪、冲击脉冲技术、共振解调技术等方法对轴承的工况进行监测,例如基于快速傅里叶变换[3]、离散小波变换[4]、支持向量机[5]的故障诊断方法。但这一类方法提取特征繁琐、泛化性能较差、应用起来受到较大限制[6]。基于深度学习的各类故障诊断方法研究近年来广受关注,研究学者们提出了一系列基于深度学习的方法来改进故障诊断效果。熊天旸等[7]在小波包降噪的基础上,提取故障信号的特征参数后输入BP神经网络中,对自动倾斜器轴承进行故障诊断,该方法降低了背景噪声的干扰。张龙等[8]针对噪声背景下特征信号提取难的问题,提出基于小波包分解与频率加权能量算子相结合的滚动轴承故障诊断方法,取得了较好的结果。庄雨璇等[9]提出一种基于长短时记忆网络的端到端故障诊断模型e2e-LSTM,该方法能够一次性诊断多种轴承故障,对轴承诊断泛化能力欠佳的问题进行了优化。李思琦等[10]使用本征模态函数对故障信号进行重构,对重构信号进行指标计算后使用卷积神经网络以及多种方法进行故障诊断,该方法能够有效地进行故障诊断。梁敏健等[11]利用长短时记忆网络针对门座式起重机减速箱机械故障数据构建模型,经过数据测试表明该模型能够快速对故障进行诊断和分类与传统的卷积神经网络诊断分类模型相比,准确率提高了4.1%。Chen等[12]提出了一种新型的门卷积注意力神经网络,将其应用于鼠笼式异步电机故障诊断领域,该方法在抗噪性和泛化性方面表现较好的性能。上述方法对异步电机内轴承的故障诊断都取得了一定的效果。然而,仅仅依靠卷积或循环神经网络难以充分提取周期振动信号的特征信息。因此Li等[13]提出一种AHBi-LSTM网络模型,使用原始振动信号进行故障诊断,通过增加注意力机制,可以提高网络提取特征的能力。Hao等[14]结合卷积神经网络和LSTM网络的优势提出了一种CNN-LSTM相混合的神经网络故障诊断模型。Fu等[15]在将CNN与BiLSTM网络相结合的基础上,添加了残差模块网络模型,经过多次数据测试后在不同工况和不同信噪比下取得了更好的诊断精度。上述方法体现了卷积神经网络与改进后的RNN相结合的优势,但轴承在强噪声的工作环境下的故障诊断方法还存在问题。
针对强噪声环境下异步电机轴承故障诊断问题,本文中提出了一种基于AM-MSCNN-BiLSTM融合模型的故障诊断方法,该方法通过引入注意力机制增强对多尺度数据特征的提取能力,改善了卷积神经网络的学习机制,同时结合BiLSTM网络能够充分提取时序特征的能力。针对原始振动故障信号进行数据预处理,通过故障诊断模型输出得出故障诊断准确率,并引入残差模块以进一步减小噪声影响,以此提高故障诊断能力。
利用卷积神经网络(CNN)模型研究轴承故障的方法近年来高速发展,各种网络层出不穷,由于异步电机故障信号数据是一维振动信号,故而本文中选择了多尺度卷积神经网络(MSCNN)进行模型搭建。当故障数据量较大时,由于普通单尺度的CNN只能够提取到数据集局部的特征信息,从而可能忽略了数据的全局特征,进而丢失某些重要特征信息,而MSCNN方法由多个不同尺度的卷积核构成,因此本文中通过MSCNN方法来抓取故障数据集中更多更深层次的特征信息。基于一维故障信号输入的MSCNN网络主要由卷积层、多尺度卷积层、池化层、全连接层组成,其结构如图1所示:其中最重要的卷积层用来提取输入故障信号中隐含的特征信息,再通过卷积核进行卷积计算,卷积操作公式如下所示:
(1)
图1 MSCNN模型结构
Fig.1 MSCNN model structure
式(1)中:是卷积计算之后第l+1层的特征,是卷积核,是指l层第i个特征图中第j个特征值,k为偏置项,L是卷积核的尺寸大小。
长短时记忆网络(LSTM)在循环神经网络的基础上增加了“遗忘机制”,在每次通过权重决定过去数据的影响,从而解决了数据梯度爆炸的问题,促使循环网络的运行时间减少、提高模型的准确率[16]。因为其自身结构无法记录长时间序列的数据联系,为此LSTM网络通过遗忘、输入和输出门来控制和保护单元状态,通过sigmoid、tanh激活函数等组成了一种综合类门结构,其结构如图2。
图2 LSTM结构
Fig.2 LSTM structure
在图2中,σ表示激活函数中的sigmoid,输出在0~1之间,其作用是帮助更新或遗忘信息,tanh激活函数的作用是在-1至1之间调节数值大小进而帮助调节神经网络的输出[17]。图中剩余变量具体含义如下文公式说明。
遗忘门的作用是对信息的保留或者遗忘,其输出为
ft=σ(Wxfxt+Whfht-1+bf)
(2)
式(2)中:Wxf是输入与遗忘门之间的权重矩阵,Whf是历史输出与遗忘门之间权重矩阵,bf是遗忘门的偏置项,xt是当前输入,ht-1是前一时刻输出, ft是遗忘门输出。
输入门的作用是用来更新单元状态:
it=σ(Wxixt+Whiht-1+bi)
(3)
式(3)中:it是输入门的输出,Wxi是输入与输入门之间权重矩阵,bi是输入门偏置项,Whi是历史输出与输入门权重矩阵。
输出门的作用是确定下一隐藏状态,其输出为
Ot=σ(Wxoxt+Whoht-1+bo)
(4)
式(4)中:Wxo是输入与输出门权重矩阵,Who是历史输出和输出门权重矩阵,Ot是输出门的输出,bo是输出门偏置项。
BiLSTM由2个独立的LSTM网络组成,2个网络分别相对为前向和后向LSTM层,其结构如图3所示。
图3 BiLSTM网络结构
Fig.3 BiLSTM network structure
相较于单向LSTM网络而言,其每次输出都具有神经元的前后两项输出,因此可以更全面考虑到时间序列的前后关系,针对具有周期性的故障数据,能够更有效的提取输入的时间特性,从理论能够提高故障诊断的最终准确率。
输入的故障数据通过输入层进入BiLSTM网络,在前向LSTM层和后向LSTM层中分别计算得出输出值,隐藏层中的值由这2个值共同决定。其决定公式如下:
(5)
(6)
(7)
1.3.1 通道注意力机制
通道注意力机制的作用是体现不同通道特征的重要程度,其结构示意图如图4所示。第1步是对经过卷积后的每个通道的故障数据进行全局平均池化来获得整体信息的缺点,第2步是通过卷积核大小是K的一维卷积层在不同通道进行交互,其中K的值由自适应函数和通道数量决定,最后一步是用σ(sigmoid)函数产生每个通道的权重值,由权重值和原始特征共同决定得到具有通道注意力的特征。
图4 通道注意力机制结构
Fig.4 Channel attention mechanism structure
1.3.2 自注意力机制
自注意力机制即是在故障数据中将在不同位置的单个序列数据相关联的注意力机制,通过关注故障数据中同一序列中的所有位置并计算每一个位置的响应,因此自注意力机制可以在训练时更好的获得通用特征,即更适用于故障诊断模型,也因此通过自注意力机制得到的故障特征会比一般特征更具有代表性,从另一方面降低了冗余和噪声的干扰,提高故障诊断的性能,使用Softmax进行归一化,其公式如下:
(8)
式(8)中:Q是查询值,K是计算值,V是权重值,f (Q,KT)是Q与K的相似度,dk是特征向量维度。
残差网络的核心思想主要是通过引入“残差块”,致使网络能够学习恒等映射,以此来解决深度神经网络中的梯度消失问题。在传统的卷积神经网络中,每层的输出都是输入的非线性变换,但是在残差网络中,残差块通过将输入直接加到非线性变换的输出中,因此残差网络的加入理论上可以提高故障诊断的准确率,增加故障诊断模型的可靠性。图5为本文中模型中的残差块结构,由2个3×3卷积层、2个BatchNorm层和2个ReLU层组成[18]。
图5 残差块结构
Fig.5 Residual block structure
本文中构建了基于AM-MSCNN-BiLSTM融合模型的异步电机故障诊断模型,并添加了残差模块,其结构如图6所示。
图6 异步电机故障诊断模型
Fig.6 Fault diagnosis model
首先把实验故障模拟测得的振动信号进行重叠采样并将其分成训练集与测试集样本,接着通过特征的筛选和本文中所提到的多尺度提取更好的提取数据的空间特征,然后通过BiLSTM层提取时序特征,并添加残差模块减小噪声及冗余的干扰,通过自注意力机制将不同序列进行关联,最后通过softmax函数进行分类输出故障诊断结果。
模型说明如下,模型数据的输入中特征筛选极其重要,会对模型的性能产生影响,针对异步电机故障数据而言,在一定范围内,相同步长下,卷积核越大越能抑制高频噪声,且采集出的故障数据都是周期信号,较大的卷积核可以更好的反应整体特征。因此本模型在开始会采用较大卷积核的卷积层来进行特征筛选,然后按流程进行批归一化和最大池化。在特征筛选之后本模型添加了多尺度特征提取模块,基于Inception模块进行优化,采用7×1、5×1、1×1并行卷积增强在不同尺度下的特征提取能力,添加注意力模块,产生每个通道的权重并在训练中不断优化权重、更新模型网络结构参数。通过多尺度特征提取模块获取中不同特征特征的重要性,抑制了干扰信号并保留主要特征,最后合并经过最大池化层保留重要故障特征。接着经过BiLSTM层来提取周期振动信号的时序信息,并添加了残差网络结构来进一步消除冗余信号的影响,其中BiLSTM网络的输入和输出都添加了自注意力机制,增加了对重要特征的注意力,通过平均池化进行特征降维并整合,模型最后通过Softmax分类器输出故障诊断结果。
本文中将最终诊断故障的准确率和诊断过程中的损失函数输出作为指标,来评价在模型预测下真实故障标签与预测故障标签是否基本符合一致,如图7为模型对异步电机的诊断流程。
图7 异步电机故障诊断流程
Fig.7 Asynchronous motor fault diagnosis flow
过程如下:
1) 将实验测得的原始故障数据划分为训练集、验证集和测试集。
2) 搭建故障诊断模型,初始化模型参数,设置批量大小等超参数。
3) 通过训练集数据对模型进行训练,初步提取故障特征,为得到最大似然估计,要求模型输出的预测分布应该与数据的实际分布情形尽量相近,因此采用在神经网络做分类问题时经常使用的交叉熵损失函数,其公式如下:
(9)
式(9)中:x是故障样本,y是实际的标签,a是预测的结果,n是故障数据样本总数。
首先将多尺度卷积神经网络的最后一层输出,得到即每个分类的得分,然后通过softmax函数得到概率输出,最后通过交叉熵函数将模型预测的类别概率和实际类别进行计算得到损失函数的计算值。
4) 通过验证集验证训练结果,并根据结果逐步调整模型参数。
5) 判断迭代次数是否已到目标次数,如果迭代结束则进入下一步,否则返回第3)步。
6) 将测试集进行测试模型性能,得出故障诊断准确率并输出。
本实验所采用的数据集来自某实验室2023年研究异步交流电动机的故障模拟数据,采样频率为12.8 kHz,采样的周期性振动信号均为无负载情况下且恒定转速1 000 r/min。故障数据集包含了异步电机的正常工况信号、偏心故障、闸间短路故障及轴承的内圈、外圈、滚动体故障下共6种故障的周期性振动信号。每种故障数据量约106个,每种故障截取部分其波形如图8所示。
图8 6种故障振动波形
Fig.8 Six kinds of fault vibration waveform
将原始实验数据中的异常信号进行剔除,并划分为1 000 个样本,将故障数据进行重叠采样,获得的样本长度为1 024[19],将数据集按 70%、15%、15%的比例划分为训练集、验证集和测试集。数据集详情如表1所示。
表1 故障数据集
Table 1 Fault data set
编号采样频率/kHz训练集验证集测试集故障类型标签12345612.8700150150正常工况0700150150偏心故障1700150150匝间短路故障2700150150轴承内圈故障3700150150轴承外圈故障4700150150滚动体故障5
本实验采用pytorch深度学习框架,使用python编译语言,在Windows 10系统中运行,实验参数设置如表2所示,设置网络结构参数如权重、偏置、卷积核数量及尺寸大小,通过多次实验选择了较为合适的超参数,特征筛选层的大小为64×1,其中多尺度特征提取模块共3层卷积核大小分别为 7×1、5×1、1×1,步长统一为1,以此来提高模型训练效率,通过对比后设置学习率为0.000 5,批大小为32,BiLSTM隐藏单元数为16。实验主机型号为Z7M-KP7GA,处理器为Intel Core i7-8750H。
表2 模型参数
Table 2 Model parameter
层数名称核大小步长输出0输入层--1 024×11大卷积层64×11664×162池化层2×1232×163多尺度卷积层1(7×1)(5×1)(1×1)132×16通道注意力模块多尺度卷积层2(5×1)(1×1)132×32通道注意力模块多尺度卷积层3(1×1)(1×1)132×32通道注意力模块4池化层2×1216×805BiLSTM层16-32×806残差模块---7自注意力层---8全局平均池化--1×809Softmax输出层--1×6
将本文中所提及故障数据集输入诊断模型,进行迭代40次,其故障诊断准确率及损失值迭代变化如图9所示。可以观察得出,在不断迭代中训练集的准确率在基本保持上升态势,且损失函数值稳步下降并都最终趋于稳定,这体现出模型性能的不断增强和本文中方法的可行性。经过多次实验得出最后针对异步电机故障的准确率高达98.5%。
图9 故障诊断准确率及损失
Fig.9 Fault diagnosis accuracy and loss
为了进一步了解本文中针对异步电机故障类型的诊断情况,使用了混淆矩阵来查看故障数据集的分类结果,如图10所示,图中横轴为预测分类的类别,纵轴为数据真实的故障类别,对角线则为预测正确的数据占比,从图中可知针对异步电机的故障预测中正常工况、轴承滚动体故障、匝间短路故障、轴承外圈故障的预测准确率为100%,内圈故障数据中有4%的数据被误判为偏心故障,而偏心故障同样有4%的数据被误诊为内圈故障,误判率较小并在可接受的范围内,虽诊断类型错误但故障的发生还是全部诊断正确。所以可以得出本文中的模型方法具有较好的故障诊断性能。
图10 混淆矩阵
Fig.10 Confusion matrix
为了更加直观地发现本文中方法的对于特征提取能力的优势,图11是自注意力层后的特征进行t-SNE降维可视化的结果。全部数据被划分成6个类别,数据集的经提取后特征显示聚集,且不存在交叉异类项,故障的可分性增强,同时正常工况下的数据与故障数据之间距离较远,特征的分散程度较高,实现了高精度的故障诊断[20]。
图11 特征可视化
Fig.11 Feature visualization
为了避免实验的偶然性并突出本文中模型的性能,验证本文中方法的稳定性,将同一故障数据集分别选择BiLSTM、CNN-LSTM、1DCNN、ResNet这4种常见方法进行实验对比,通过随机初始化网络参数,统一迭代40次并实验10次取平均值,其结果如表3所示,不同方法故障诊断准确率图像如图12。
表3 不同方法准确率
Table 3 Different methods accuracy %
方法名称迭代初始准确率/迭代10次准确率迭代20次准确率迭代30次准确率迭代40次准确率BiLSTM4972737374CNN-LSTM34929293941DCNN3882868488ResCNN5391909293本文中模型5297929598
图12 不同方法准确率
Fig.12 Different methods accuracy
由表3可得知本文中模型针对异步电机的故障诊断率最高,其平均准确率达到了98%,相比于其他基础卷积模型准确率有明显的提高,而BiLSTM结构的模型故障诊断准确率远低于其他卷积模型,原因是单一BiLSTM结构对于故障特征的提取能力较弱,体现了卷积结构对故障特征的提取能力更强,更突出了本文中模型的优越性。
1) 本文中提出一种基于AM-MSCNN-BiLSTM融合模型的异步电机故障诊断模型。该模型具有多尺度的特征提取能力,通过在多尺度卷积神经网络中添加了通道注意力模块改进了模型学习机制,加入自注意力机制用于关注重要的故障特征,并添加残差模块也更好的降低噪声和冗余的干扰。
2) 通过故障诊断准确率评价模型性能,本文中模型准确率高达98.5%,高于其他一般方法,采用混淆矩阵和t-SNE降维方法来评估故障诊断分类的性能。
3) 通过与其他单一方法进行对比实验,本文中模型展现出较强的特征提取能力和较高故障诊断精度。特别是在异步电机的故障分类方面,本文中表现准确且稳定。然而,对于小部分偏心故障和内圈故障的分类可能存在较小的错误。此外,本文中模型在混合偶发故障和其他机械故障的使用性方面还需要进一步的实验和研究。
[1]YASSINE M,KAMEL EMO,MOHAMED B,et al.The propagation mechanism of fault signatures in squirrel cage induction motor drives[J].Journal of Electrical Engineering &Technology,2019,14(1):121-133.
[2]杨颖.三相异步电机定子故障诊断方法研究[D].西安:西安工业大学,2023.YANG Ying.Research on stator fault diagnosis method of three-phase async-hronous motor[D].Xi’an:Xi’an Technological University,2023.
[3]RANMANESH A.Nonlinear signal analysis of dynamic systems based on empirical mode decomposition and fast fourier transformation method for fault detecting[J].Journal of Applied Physical Science International,2016,7(1):18.
[4]ALVES N D H,FONSECA B N R.An algorithm based on discrete wavelet transform for fault detection and evaluation of the performance of overcurrent protection in radial distribution systems[J].IEEE Latin America Transactions,2014,12(4):602-608.
[5]GODSE R,BHAT S.Combined morphology and svm-based fault feature extraction technique for detection and classification of transmission line faults[J].Turkish Journal of Electrical Engineering &Computer Sciences,2020,28(5):2768-2788.
[6]谢扬筱,王国强,石念峰,等.融合注意力机制的MSCNN-BiLSTM滚动轴承故障诊断方法[J].轴承,2024(8):86-94.XIE Yangshao,WANG Guoqiang,SHI Nianfeng,et al. An MSCNN-BiLSTM rolling bearing fault diagnosis method incorporating attention mechanism[J].Bearing,2024(8):86-94.
[7]熊天旸,张先辉,李新民,等.基于BP神经网络的自动倾斜器轴承故障诊断[J].航空科学技术,2017,28(11):69-73.XIONG Tianyang,ZHANG Xianhui,LI Xinmin,et al.Fault diagnosis of tilting pad bearing based on BP neural network[J].Aeronautical Science and Technology,2017,28(11):69-73.
[8]张龙,刘晶,熊国良,等.基于小波包分解和频率加权能量算子的滚动轴承故障诊断[J].机械设计与研究,2018,34(6):80-84.ZHANG Long,LIU Jing,XIONG Guoliang,et al.Fault diagnosis of rolling bearings based on wavelet packet decomposition and frequency-weighted energy operator[J].Mechanical Design and Research,2018,34(6):80-84.
[9]庄雨璇,李奇,杨冰如,等.基于LSTM的轴承故障诊断端到端方法[J].噪声与振动控制,2019,39(6):187-193.ZHUANG Yuxuan,LI Qi,YANG Bingru,et al.End-to-end method for bearing fault diagnosis based on LSTM[J].Noise and Vibration Control,2019,39(6):187-193.
[10]李思琦,蒋志坚.基于EEMD-CNN的滚动轴承故障诊断方法[J].机械强度, 2020,42(5):1033-1038.LI Siqi,JIANG Zhijian.Fault diagnosis method for rolling bearings based on EEMD-CNN[J].Mechanical Strength,2020,42(5):1033-1038.
[11]梁敏健,彭晓军,刘德阳.基于LSTM算法的门座式起重机减速箱故障诊断研究[J].计算机测量与控制,2021,29(12):67-72.LIANG Minjian,PENG Xiaojun,LIU Deyang.Research on fault diagnosis of portal crane gearbox based on LSTM algorithm[J].Computer Measurement &Control,2021,29(12):67-72.
[12]CHEN L,MA Y,WANG H,et al.A novel deep convolutional neural network and its application to fault diagnosis of the squirrel-cage asynchronous motor under noisy environment[J].Measurement Science and Technology,2023,34(11):115113.
[13]LI X,SU K,HE Q,et al.Research on fault diagnosis of highway Bi-LSTM based on attention mechanism[J].Eksploatacja i Niezawodno Maintenance and Reliability,2023,25(2):110587.
[14]HAO S,GE F,LI Y,et al.Multisensor bearing fault diagnosis based on one-dimensional convolutional long short-term memory networks[J].Measurement,2020,159:107802.
[15]GUANGHUA F,QINGJUAN W,YONGSHENG Y,et al.Bearing fault diagnosis based on CNN-BiLSTM and residual module[J].Measurement Science and Technology,2023,34(12):125050.
[16]任春.基于多尺度卷积网络和胶囊神经网络的滚动轴承故障诊断方法研究[D].重庆:重庆大学,2022.REN Chun.Research on fault diagnosis method of rolling bearings based on multi-scale convolutional network and capsule neural network[D].Chongqing:Chongqing University,2022.
[17]吕云开,武兵,李聪明.基于SNN-LSTM的小样本数据下轴承故障诊断方法[J].机电工程,2023,40(1):62-68.LV Yunkai,WU Bing,LI Congming.Bearing fault diagnosis method under small sample data based on SNN-LSTM[J].Mechanical and Electrical Engineering,2023,40(1):62-68.
[18]刘付琪,张达,宋建华,等.基于CNN-BiLSTM的液压系统故障诊断[J].计算机与现代化,2023(9):10-19.LIU Fuqi,ZHANG Da,SONG Jianhua,et al.Fault diagnosis of hydraulic system based on CNN-BiLSTM[J].Computer and Modernization,2023(9):10-19.
[19]刘恩雨,蒋强.基于残差网络的UR5机械臂故障诊断方法[J].南方农机,2023,54(22):180-182.LIU Enyu,JIANG Qiang.Fault diagnosis method of UR5 robotic arm based on residual network[J].Southern Agricultural Machinery,2023,54(22):180-182.
[20]谢锋云,王玲岚,宋明桦,等.基于GCN的多源变工况滚动轴承故障诊断[J].铁道科学与工程学报,2024,21(5):2109-2118.XIE Fengyun,WANG Linglan,SONG Minghua,et al.Fault diagnosis of multi-source variable operating conditions rolling bearings based on GCN[J].Journal of Railway Science and Engineering,2024,21(5):2109-2118.
[21]雷春丽,焦孟萱,薛林林,等.小样本下基于MTF与SSCAM-MSCNN的滚动轴承变工况故障诊断方法[J].计算机集成制造系统,1-19[2023-12-09].http://kns.cnki.net/kcms/detail/11.5946.TP.20220829.1106.004.html.LEI Chunli,JIAO Mengxuan,XUE Linlin,et al.Fault diagnosis method for variable operating conditions of rolling bearings based on MTF and SSCAM-MSCNN[J].Journal of Computer Integrated Manufacturing Systems:1-19[2023-12-09]http://kns.cnki.net/kcms/detail/11.5946.TP.20220829.1106.004.html.