【基础理论与应用研究】
故障率是航空装备可靠性分配、维修性预计等工作的重要数据源。故障率预测可为故障趋势监控、维修策略制定、备件支援辅助决策等提供重要支撑。故障率时间序列顾名思义就是将故障率的数值按照其发生的先后顺序排列而成的数列,在试飞阶段,由于试验机数量少、试飞周期短,故障率时间序列样本量少,非线性和非平稳性特征明显。
在国内外开展的相关研究中,时间序列通常采用机器学习模型进行预测。但不同模型存在各自适用范围及特点。比如反向传播(BP)神经网络基于经验最小化原理,存在对训练样本过学习缺陷[1-2];自回归(AR)模型对于非线性、非平稳信号预测效果不好[3];径向基函数(RBF)神经网络较为复杂,结构过于庞大,运算量大[4];而最小二乘支持向量机(LSSVM)模型基于结构风险原则,可有效避免过学习和维数灾难[5-7]。
对于复杂的故障率时间序列,任何单一模型均存在预测精度不高的问题。针对这个问题,本文引入了经验模态分解(EMD)理论,基于EMD分解和LSSVM预测模型将原始的故障率时间序列分解成若干规律性较强的子序列,然后分别针对子序列建立预测模型,可以有效的降低预测的风险,提高预测的精度。同时本文借鉴民航可靠性控制的方法,对故障率警戒值进行监控,希望能为试飞阶段航空装备基于“可靠性预测—状态监控—维修方案改进”体系的构建提供有意义的参考。
试飞阶段飞机故障率时间序列预测与预警监控方法的总体思路如下:通过外场可靠性数据采集系统获取所选机型试飞阶段的故障率时间序列数据;将时间序列进行EMD分解,得到多个IMF(固有模态函数)和一个RF(趋势项);针对各IMF数据和RF数据利用LSSVM进行训练并获得预测结果;将预测得到的IMF数据和RF数据相加便可得到故障率时间序列预测值,然后进行误差检验;在给定置信度的情况下,基于历史数据,通过计算均值和标准差得到故障率时间序列的警戒值,将预测结果与警戒值进行对比,根据告警级别评估影响程度,适时采取纠正措施。
EMD是一种针对非线性、非平稳信号的自适应信号分解算法。它可解释为以信号极值特征尺度的时-空滤波过程。鉴于故障率时间序列信号具有的非线性和非平稳性特征,可由EMD分解成有限个IMF和一个RF。EMD相当于用窄带滤波器对时间序列进行自适应滤波,各IMF分量频率随着阶数的增大而减小,RF则体现了原始信号的平均趋势[8-10]。
IMF必须满足以下条件:时间序列信号的极值点(极大值或极小值)数目和过零点数目相等或最多相差一个;由局部极大值构成的上包络线和由局部极小值构成的下包络线的平均值为零。
EMD的具体步骤为:
1) 设有故障率时间序列信号 x(t),找出信号中所有的局部极大值,然后用3次样条函数连成上包络,同样找出所有局部极小值,连成下包络;
2) 分别求出上下包络的平均值m1,求出原始信号与m1的差值h1;
h1=x(t)-m1
(1)
3) 若h1满足IMF条件,h1就是第1个IMF分量,否则h1将作为原始信号进行以上的步骤1)、步骤2),直到第K次迭代后的差值h1,k(t)成为一个IMF,记为:
C1(t)=h1,k(t)
(2)
上面K步迭代的终止准则是:
(3)
4) 从原信号减去C1(t)得到第1阶的剩余信号为r1(t);
5) 将剩余信号r1(t)作为原信号进行步骤1)~步骤4)的过程直到
rN-1(t)-CN(t)=rN(t)
(4)
终止准则是当第N阶的剩余信号rN(t)不存在负的局部极大值和正的局部极小值,EMD分解终止。
任一时间序列信号都可以分解成若干个IMF分量和一个RF之和。IMF分量表征了信号从高频到低频的不同频段的信号成分,原始时间信号的主要信息都包含在EMD分解出来的几个高频分量中(图1)。
图1 仿真信号EMD分解结果
原始的时间序列信号具有典型的非线性和非平稳性特征,表面上看似杂乱无章,但实际上蕴含了多种有用的成分信息。但如果不对原始时间序列信号进行预处理,直接对其采用机器学习模型进行预测,会导致预测结果误差较大。
EMD分解最大的优点是在预测前可以对原始时间序列信号进行预处理,将原始时间序列信号的有用成分以IMF分量的形式提取出来,然后针对这些规律性较强的IMF分量分别建立预测模型,从而可以有效的规避预测的风险,提高预测的精确度。
下面举例说明,给定一仿真信号:
y=5sin(2π10t)+10sin(2π35t)
(5)
对仿真信号进行EMD分解,从图1可以看出,EMD分解可将仿真信号中的两个有效成分5sin(2π10t)和10sin(2π35t)提取,从而使复杂信号包含的有序规则直观的反映出来,这也进一步验证了EMD方法在故障率时间序列预测中的优越性。
支持向量机(SVM)是一种在统计学习理论上发展起来的机器学习方法,它的基本思想为:如果训练样本在低维空间线性不可分,可通过一个非线性映射映射到一个高维空间,利用风险最小化原理去构建决策函数,然后用一个超平面进行拟合。LSSVM与SVM的区别在于将SVM方法中的不等式约束转变为等式约束,它将非线性向量φ(x)映射到高维的空间,将其转化为一个解线性方程组的问题。
f(x)=ωTφ(x)+b
(6)
其中:ω 是代表权值向量;b为偏差。 然后将线性回归问题转化为求解如下的优化问题:
(7)
f(xk)=ωTφ(xk)+b+ek
(8)
以上两式中:γ代表正规化函数;ek代表误差;k代表空间向量的第k个维度。
由于ω属于高维空间,不能直接进行求解,需要引入核函数,本文引入RBF作为核函数:
(9)
式中:σ为尺度参数。
基于LSSVM的时间序列预测方法的基本步骤包括:
1) 利用EMD分解得到有限个IMF分量和1个趋势项;
2) 由于预测模型的建立模式与传统时间序列模型存在本质差异,因此需要选择合适的时间序列嵌入维数[11],将IMF分量和趋势项转化为训练样本集进行训练;
3) 利用训练预测模型计算出后续时间序列的IMF预测值和趋势项预测值;
4) 将IMF预测值和趋势项预测值相加即可得到时间序列的预测值。
在军机的设计定型试飞中,可靠性维修性工作的主要目的是对其指标进行考核,评估是否满足装备研制总要求,可靠性与维修性工作是相对孤立的,无法产生协同作用。而在民机适航体系中,通过对CCAR121.368条、AC-121-54R1[12-13]以及航空公司可靠性控制方案的研究,民机的可靠性工作不关注指标的考核,而是注重对可靠性参数的持续跟踪,通过设定警戒值对飞机、系统、附件的状态进行监控,根据警戒等级决定是否对维修方案进行优化改进,从而促进维修保障效率的提升。
通过建立的预测模型,如果只是为了获得预测结果,以证明预测模型的适用性,这对于指导外场维护保障工作意义有限。预测得到的结果必须要有参照标准可依,以便判断飞机状态发展趋势,为采取及时有效的纠正措施提供技术支撑。基于此,引入了民机可靠性监控体系中警戒值的概念,以此判断飞机状态的发展态势。
警戒值是一种设定出现率,用于监控系统、附件和结构,用于监控趋势是否偏离期望。警戒值正常基于过去12个月的使用经验进行计算。故障率警戒值通过正态分布的概率计算来确定,通常是设置95%置信度以上的平均值水平作为警戒标准,其计算公式如下:
(10)
(11)
(12)
其中:UCL为警戒值; 为均值;σ为标准差;K为警戒系数;n为样本量。
K值的大小,影响虚假警告的多少,根据正态分布的分散性统计,K值等于2时,其假警告的概率约为4.5%,适用于故障率数据分布较为分散的情况;K值等于3时,其假警告的概率约为0.3%,适用于故障率数据分布较窄的情况。
试飞阶段故障率警戒值的设定,以飞机调整试飞结束定型试飞开始作为起点,在型号试飞12个月后第1次计算警戒值,此后每隔12个月重新计算1次。
这个警戒值将一直使用到获得了12组数据为止,并且每隔12组数据重新计算1次。故障率警戒值的告警级别如下:
1) 当月值和3个月的平均值两者都高于警戒值时,产生红色告警(R),应当对系统进行分析调查,发布相关的地面预防性维修措施和设计优化更改措施;
2) 连续2个月的值超出警戒值,而3个月的平均值低于警戒值时,产生黄色告警(Y),应当引起重视,必要时组织设计单位进行会商;
3) 当月值小于等于警戒值,而3个月的平均值和上个月的值大于警戒值时,保持警告状态(RA),对系统状态进行密切监控;
4) 当3个月的平均值低于警戒值时,为正常状态(C)。
将故障率预测模型和警戒值监控手段相结合,可以对飞机状态的发展趋势进行研判,提前采取预防性维修或软硬件优化改进等干预措施,确保飞机的战备完好性和出勤可靠度,提高试飞效率。
某歼击机在试飞阶段共投入6架试验机。以调整试飞结束、定型试飞开始作为数据采集的起始点,并以月份为单位进行统计,获得了近4年时间内的每飞行小时故障率数据,从数据库中筛选出了综合航电火控系统33组故障率时间序列数据,如图2所示,将其前30组数据作为训练样本,对后3组数据进行预测。
将经过EMD分解得到的IMF和趋势项子序列作为训练样本,分别利用LSSVM建立预测模型,预测后3组数据的故障率。从图2可以看出,综合航电火控系统30组原始故障率时间序列经EMD分解后,可以得到3个IMF分量和一个趋势项。各IMF分量都具备比较明显的规律,而且趋势项也能够比较准确的反映原始故障率时间序列的变化趋势,因此在EMD分解基础上利用机器学习模型进行故障率时间序列预测具有天然的优势。
图2 故障率时间序列EMD分解结果
采用LSSVM模型分别对各IMF分量和趋势项进行预测,选取核函数为RBF,正规化函数和核参数通过留一交叉验证法进行确定。同时为了便于对比,对原始故障率时间序列采用LSSVM模型单独进行了预测,通过对比可以发现,基于EMD和LSSVM的预测方法通过分解子序列使预测风险分散化,从而提高了预测的精度,预测结果如表1所示。
表1 预测结果
序号实际值/10-2LSSVM预测值/10-2相对误差/%EMD+LSSVM预测值/10-2相对误差/%311.61.2919.371.736.25322.31.9515.222.418.69332.52.1314.802.687.20平均相对误差16.467.38
为了通过预测结果对飞机状态进行判断,根据前文所述的方法计算警戒值,以得到预测结果告警级别,其中警戒系统K取2,取第19组到30组共12组时间序列值进行计算,平均值为2.28,标准差σ为0.54,最后根据式(10)计算得到的警戒值UCL为3.36。从表1可以看出:预测的3组时间序列值均低于警戒值,根据告警级别的定义,处于正常状态,暂时不需要采取相关的预防性维修和设计优化改进措施。
基于EMD和LSSVM的故障率时间序列预测模型,针对分解后规律性更强的子序列分别建立预测计算模型,使预测的风险分散化,有效提高了预测的精度。引入的故障率警戒值监控方法,解决了预测结果无评价标准可依托的问题,可为维修方案的优化改进提供技术支撑。
利用外场数据进行了验证,充分表明了预测模型和预警监控方法的有效性。对该模型和方法加以持续深入的研究与改进,可为后续故障趋势监控、预测性维修和定检周期优化奠定基础。
[1] 王宁,罗汝斌.基于小波包分解的BP神经网络的短期风速预测[J].控制与信息技术,2019(4):1-6.
[2] 齐帅,陈智,吴志强,等.基于神经网络的核安全级主控制器负荷率预测研究[J].自动化与仪表,2019,34(7):5-9.
[3] 钱青,唐桂忠,张广明,等.基于AR-DBN的建筑分项能耗短期预测[J].计算机工程,2019,45(6):290-296.
[4] 戴建彪,岳东杰,陈健,等.基于PCA-RBF神经网络模型在桥梁变形预测中的应用分析[J].勘察科学技术2019(3):39-48.
[5] 凃伟平,李春祥.基于混合智能算法优化LSSVM的短期风压预测[J].上海大学学报,2019,25(2):347-356.
[6] 崔建国,高波,蒋丽英,等.基于灰色和LSSVM的航空发动机状态预测[J].计算机工程与设计,2017,38(10):2809-2813.
[7] 张悦,孙惠香,冯盛辉,等.基于IGWO-LSSVM的弹体侵彻地下洞室毁伤效应预测[J].空军工程大学学报,2017,18(6):95-100.
[8] GAO Jing,SHANG Pengjian.Anyalysis of complex time series based on EMD energy entropy plane[J].Nonlinear Dynamics,2019,96(1):465-482.
[9] 孟小璐.基于神经网络分位数回归的行业成本预测研究[J].重庆工商大学自然科学版,2018,35(4):44-51.
[10] 张义平,李夕兵,左宇军.爆破振动信号的HHT分析与应用[M].北京:冶金工业出版社,2008.
[11] 张弦,王宏力.嵌入维数自适应最小二乘支持向量机状态时间序列预测方法[J].航空学报,2010,31(12):2309-2314.
[12] CCAR-121-R5,大型飞机公共航空运输承运人运行合格审定规则[S].北京:中华人民共和国交通运输部,2017.
[13] AC-121-54R1,可靠性方案[S].北京:中国民用航空局飞行标准司,2017.