无人机具有易开发、成本低、灵活性强等特点,近年来在军事、民用领域得到了长足发展和广泛应用[1]。其中,固定翼无人机(Fixed-Wing Unmanned Aerial Vehicles,FW-UAVs)集成技术先进、造价高、系统复杂,一般应用于速度快、距离远和续航久的场景。FW-UAV的性能会随着运行时间增加逐渐衰退,导致故障发生率增高。FW-UAV一旦因故障坠毁会导致较大的经济损失甚至引发军事、政治和社会影响[2]。故使用故障预测和健康管理技术提升无人机设备的可靠性与可用性具有重要意义,众多学者围绕此问题进行了大量深入研究[3-6]。
FW-UAV的设备复杂性、任务规划多变性和环境多样性导致其工作状态反复切换,呈现多工况特征,这给基于数据的故障预测和健康管理带来诸多挑战。因此,有必要对无人机的多工况问题进行研究。从数据挖掘[7]角度看,FW-UAV的多工况分析是典型的数据分组问题,可以使用聚类算法解决,在线数据分类则属于模式识别问题。常见的聚类算法有层次聚类、密度聚类和谱聚类等。目前已经出现了基于相似性(距离)、基于神经网络和基于机器学习等方法的模式识别,并被广泛应用于工业、军事等领域。例如,张俊楠等[8]将支持向量机与二叉树结构相结合对分布式光纤扰动传感系统的扰动模式进行了有效识别。别锋锋等[9]利用ICEEMDAN算法提取了往复泵的故障特征,并使用GRNN神经网络进行故障识别,有效提高了识别准确度。王烁等[10]基于反向传播神经网络对多因素作用下破片对靶板的侵彻毁伤模式进行了有效识别。刘凡等[11]利用小波包分解提取了电力变压器的多维度能量特征,进而使用K近邻算法实现局部放电超高频信号的模式识别。张阳阳等[12]使用概率神经网络对齿轮箱典型故障进行了有效识别。
以上方法在不同领域应用收到了较好效果,但无法直接应用于FW-UAV工况分析。主要原因在于:含类标的FW-UAV数据很难获取,导致监督模式识别算法无法应用;FW-UAV数据链传输速率快,在线数据量大,对工况识别算法时效性要求高。为解决以上问题,本文将聚类分析与模式识别算法相结合,采用组合算法来实现无人机多工况的高效分析。拟提出一种基于分组的非监督密度聚类(Group-based DBSCAN,G-DBSCAN)算法,在不依赖数据工况类标基础上实现多工况分析;并将提出一种基于多维度分解的快速工况识别算法(Pattern Recognition based on Dimensional Decomposition,PRDD),PRDD将进一步与聚类算法深度融合以实现FW-UAV在线数据工况识别的快速性和准确性。
FW-UAV执行任务的全流程包含起飞、巡航、遂行任务、返航、回收等多个阶段,属于典型的多工况过程,若将其简单处理为一个工况,则会因模型失配降低故障预测、故障诊断、剩余寿命预测等数据驱动算法的准确率。
这里以某FW-UAV实际飞行数据集中纵向控制回路与速度控制回路相关数据为例,展示其多工况特征并说明工况分析的必要性。FW-UAV纵向控制回路与速度控制回路均是闭环反馈回路,相关的变量包括俯仰角、升降舵偏角、发动机缸温、发动机转速和高度共5维数据。图1为某飞行时间段该5维数据归一化后的飞行曲线。从图1可以看出,随着时间推移曲线幅值波动较大且各维度数据呈现非线性关系,无法从直观角度辨识工况。为进一步分析无人机工况特征,下一节将基于数据分布特征,提出一种密度聚类算法对其进行多工况分析。
图1 FW-UAVs某飞行时间段飞行曲线
Fig.1 Flight curve of FW-UAVs
DBSCAN作为基于密度的聚类算法,能够在数据集中找出具有不同大小和形状的簇,对噪声有较强的鲁棒性,能基于数据自主推测聚类个数[13]。DBSCAN的主要参数为扫描半径ε和核心点最小数据量MinPts,算法将数据集中的样本点分为核心点、边界点和离群点3类。在DBSCAN算法中定义了两点之间3种特殊关系:直接密度可达、密度可达以及密度相连[14-15]。经典DBSCAN算法将原始数据集D中的所有样本点视为潜在的核心点逐个扫描,若确认为核心点则将与其密度相连的所有数据点视为同一类。以下提出了一种基于分组的DBSCAN算法,它将数据分布特性融入经典DBSCAN算法,旨在提高算法的效率。
对于数据集中的给定点p,q∈D,令Disp,q表示点p和q之间的距离,Disp,(i)表示点p到其第i个最近邻点p(i)的距离。在距离基础上进一步定义分组核心点、分组离群点和分组待定点。
1) 分组核心点:对于给定点p∈D,若Disp,(MinPts)≤ε,则将该点标记为分组核心点。这就意味着点p与其第MinPts个最近邻点的距离小于ε。
2) 分组离群点:对于给定点p∈D,若Disp,(MinPts)>2ε,则将该点标记为分组离群点。
证明:即p是一个非核心点。假设存在一个核心点q∈D,且满足为核心点,且得到出现矛盾故假设不成立。故q必不是核心点,又p不在任何核心点的ε邻域内,故p一定是离群点。
3) 分组待定点:给定点p∈D,当ε<Disp,(MinPts)≤2ε时,将其标记为分组待定点。显然,边界点以及离群点都有可能是待定点,因此还需进一步采取策略进行识别。
使用基于KD树的最近邻搜索算法获取数据集D中的每个点到其第MinPts个最近邻点的距离,并将得到的距离值以升序进行排序,就可以得到距离曲线(MinPts-th distance Curve,MC),如图2所示。
图2 样本点到其第MinPts个最近邻点的距离曲线
Fig.2 The distance from points to their MinPts neighbour
令Dc、Du、Do分别表示分组核心点、分组待定点以及分组离群点。以图3(a)为例,此时MinPts=3,所有核心点c1、c2、c3、c4、c5均属于Dc。因为Diso3,(3)=Diso3,c1>2ε,故点o3属于Do,而另外2个真实离群点o1与o2被临时收集在Du中。此例说明Dc包含了所有的核心点,Do包含了部分的真实离群点,而Du包含了边界点和离群点。其中Do中的离群点并不参与最终的聚类结果,因此可以被直接剔除以提高算法效率。由于核心点将决定最终聚类的形状、大小以及数量,因此可以对Dc使用经典DBSCAN算法,并设置MinPts=1,以获得聚类结果,如图3(b)所示。由于已经获得了数据间的距离矩阵,聚类结果获取时可直接调用该矩阵以进一步提高算法效率。
图3 2种方法的聚类结果示意图
Fig.3 Clustering results of two methods
令和分别表示和的簇类标,其中依据以下方法来识别
(1)
在方程组式(1)中,ω表示位于点的ε邻域内的点的总和,如果ω=0,则是一个离群点。如果仅有一个核心点位于点的ε邻域内,则和具有相同的簇ID。如果在的ε邻域内有多个核心点,则选择周围最近核心点的簇ID赋予算法的伪代码如下:
输入:
(1) D:原始数据集
(2) ε:扫描半径
(3) MinPts:核心点最小数据量
输出:
(1) IDc、IDu、IDo:分组核心点、待定点、离群点类标
方法:
(1) 初始化Dc=φ,Du=φ,Do=φ
(2) 使用基于KD树的最近邻搜索获取MC曲线及距离矩阵
(3) for D中每个点Di
if MCi≤ε then Dc=Di∪Dc
else if ε<MCi≤2ε then Du=Di∪Du
else Do=Di∪Do
end if
end for
(4) 将Do中的所有点都标记为噪声
(5) 执行DBSCAN算法(Dc,ε,1)来获得每个核心点的簇ID
(6) for Du中每个点
if ω=0,标记为噪声点
end if
end for
前一节使用G-DBSCAN算法对FW-UAV原始数据完成聚类分析后,会将原始数据集D分为若干个簇,并标以不用的类标,即完成数据分组。本文将密度聚类算法与工况识别深度结合,充分利用已完成聚类的核心点信息,融合主成分分析法,提出一种基于多维度分解的模式识别算法(PRDD),完成新数据的聚类类标模式识别。
该算法首先将聚类获得的核心点数据以及新数据使用主成分分析法(principal component analysis,PCA)降维,以提高运算效率,进而对两类数据进行维度分解,通过判断各个维度上新数据一定邻域内核心点数据的分布情况,结合逻辑运算粗略推定新数据周边有无核心点。之后根据核心点数量以及与新数据的真实距离准确识别测试数据的类标。
令表示新数据集T中的第i个新数据点的所属类标,则伪代码如下:
输入:
(1) P: G-DBSCAN中的核心点矩阵
(2) L: G-DBSCAN中的核心点类标矩阵
(3) T: 测试数据,即新数据
(4) ε: G-DBSCAN算法中邻域半径
输出:
(1) IDT:新数据的多工况识别类标
方法:
(1) 基于PCA实现P、T的降维
(2) 初始化类标矩阵IDT
(3) for T中每个点Tido
创建Ti的邻近点集合N,并初始化
for P中每个点Pjdo
for Pj和Ti的每个维度为维度数
将Pj加入邻近点集合N
end if
end for
end for
if N=φ then
标记Ti为噪声点
else if num(N)==1 then %仅一个核心点
if ‖N-Ti‖2≤ε then%‖·‖2为二范数计算
将该核心点类标赋予
else 标记Ti为噪声点
end if
else 从N中剔除与Ti距离大于ε的核心点
if N=φ then
标记Ti为噪声点
else if num(N)==1 then
将该核心点类标赋予
else if num(N)>1 then
if N中所有核心点类标相同 then
将该类标赋予
else找出N中距Ti最近点的核心点类标赋予
end if
end if
end if
end for
以上算法相比较于传统模式识别算法具有以下优势:
1) 无额外参数。该算法仅需输入G-DBSCAN算法(或是其他以密度聚类为核心的算法)的扫描半径ε,因此可摆脱部分机器学习算法中所存在的超参数调节困扰;
2) 无需建模。该算法在深度研究密度聚类算法的基础上,从维度分解以及数学规律层面对新数据进行工况识别,无需依靠训练数据进行建模,故也不存在模型过拟合、欠拟合以及陷入局部最优的问题;3) 开销小。该算法充分利用维度分解的便利性,在各个维度上分别执行查找运算,之后通过逻辑判断将待处理范围缩小后再运行计算开销较大的距离运算。与其他基于相似性/距离、基于神经网络和基于机器学习的模式识别方法相比,本算法具有显著的计算优势。
工况聚类和在线工况识别是无人机故障诊断和健康管理的前提,多工况分析平台设计如图4所示,该平台可进一步服务于无人机故障诊断和健康管理系统。图4中,机载飞行控制计算机采集飞机俯仰角、升降舵偏角、高度、发动机缸温和转速状态信息,并编码形成遥测数据通过数据链发送至地面设备。地面设备接收并处理遥测信息,在对遥测数据清洗和采样后存入历史飞行数据库。终端设备封装了G-DBSCAN算法以及PRDD工况识别算法,执行多工况聚类与识别算法运算。以下首先以获得的实飞数据为例进行算法验证。
图4 无人机多工况分析平台框图
Fig.4 UAV multi-working analysis platform
利用图4所示分析平台获取了FW-UAV的实飞数据集,以下取某次飞行数据用于算法验证。从数据集中选取数据量m=500的数据样本,数据维度n=5(飞行数据曲线见图1)。首先使用PCA算法降至二维,并设置G-DBSCAN算法参数MinPts=8,ε=0.07,算法首先得到飞行采样数据MC曲线。根据MC曲线纵轴距离值与的关系可将飞行采样数据划分为分组核心点、分组待定点和分组离群点。如图5所示,图中纵轴距离值小于等于ε的区间聚集了所有的分组核心点,在ε与2ε区间聚集了待定点数据,在大于2ε的区间收集了分组离群点,这一结果与3.1算法描述一致。
本文算法测试环境为Matlab 2020b,终端设备配置为主频2.2 GHz,内存16 G。根据G-DBSCAN算法步骤,图6(a)、图6(b)和图6(c)为使用分组策略所获取的3种不同数据的聚类结果。图6(a)为算法筛选出的离群数据。图6(b)为筛选得到的分组核心点数据在重新设定MinPts=1之后执行经典DBSCAN算法所获得的聚类结果,从图中可以看出分组核心点被聚为5类,由于分组核心点聚类结果表征了聚类的大致分布结构,因此可以断定最终聚类结果将被分为5类,且边界点将分布在此5类核心点数据簇的边缘。在图6(c)中,分组待定点中的边界点被划分到各核心点组成的簇中,而离群点被单独标记。此过程将针对分组待定点的聚类分析过程转化为了聚类类标识别过程,提升了算法效率。汇总以上结果即可得到算法最终聚类结果,如图6(d)所示。图6(e)为传统DBSCAN算法聚类结果,对比G-DBSCAN算法,后者在保证了不影响原有聚类效果的前提下,平均运行时间从0.021 27 s减少到0.006 3 s,有效提高了算法的效率。
图5 无人机飞行数据的MC曲线
Fig.5 The MC curve of UAV flight data
图6 FW-UAVs飞行数据聚类结果示意图
Fig.6 Clustering results of FW-UAVs flight data
综上,G-DBSCAN算法能更快获取到聚类核心点,无需重复遍历原始数据集,结合后续模式识别算法将有效提高整体技术路线运行效率。
从已完成聚类分析的数据集T中提取核心点矩阵P及其对应的类标矩阵L,同时从该数据集中分别随机选取20%、35%、50%的数据制成测试数据T20%、T35%、T50%用于PRDD工况识别算法的验证。首先使用PCA算法将核心点矩阵P及3组测试数据降至2维,并将降维后的P、T20%、T35%、T50%以及ε参数(聚类时设置的参数)输入PRDD算法,结果如图7所示。该算法在3种测试数据集下的识别率均达到100%。
图7 3种测试数据集下的识别结果示意图
Fig.7 Recognition results under three test data sets
为了进一步检验该算法的优劣,选取了几类常见的模式识别算法进行比较:加权K近邻算法(weighted K-nearest neighbor,WKNN)、反向传播神经网络(back propagation neural network,BPNN)、概率神经网络(probabilistic neural network,PNN)以及支持向量机(support vector machine,SVM)。从数据集T中随机选取80%作为上述算法的训练数据,剩余20%作为测试数据,使用上述算法分别对无人机工况进行识别,并将识别结果与PRDD算法的结果列表。如表1所示。
表1 不同模式识别算法的识别结果
Table 1 Comparison of different pattern recognition algorithms
算法名称准确率/%运行时间/sPRDD1000.005 6WKNN96.875 00.072 3BPNN94.791 71.123 3PNN97.202 80.056 1SVM96.875 00.081 5
由表1可知:文章所提算法在识别准确率和运行时间方面较其他算法具有明显优势,进一步验证了算法的有效性和实用性。
提出了“聚类分析-模式识别”相结合的多工况识别技术路线。聚类分析阶段从数据挖掘角度分析FW-UAV飞行数据,使用非监督改进型密度聚类算法G-DBSCAN解决了FW-UAV工况划分难题,与工况识别紧密结合,融合主成分分析法,提出了基于多维度分解的快速工况识别算法。在已有聚类核心点类标的基础上,充分利用维度分解的计算便利性,通过执行查找和组合逻辑运算减小了计算开销,并进一步进行精确识别。相比较于传统模式识别算法,能够在保持较高工况识别准确率的同时有效提高算法效率。
[1] 汪浩洋,杨梅枝.美军无人机发展现状及趋势[J].飞航导弹,2020(02):46-50.
Wang H Y,Yang M Z.The development status and trend of US military UAV[J].Aerodynamic Missile Journal,2020(02):46-50.
[2] 梁少军,张世荣,郑幸,等.基于DKPCA的固定翼无人机多工况在线故障诊断[J].西北工业大学学报,2020,38(03):619-626.
Liang S J,Zhang S R,Zheng X,at al.Online fault detection of fixed-wing UAV based on DKPCA algorithm with multiple operation conditions considered[J].Journal of Northwestern Polytechnical University,2020,38(03):619-626.
[3] 苗建国,王剑宇,张恒,等.无人机故障诊断技术研究进展概述[J].仪器仪表学报,2020,41(09):56-69.
Miao J G,Wang J Y,Zhang H,at al.Review of the development of fault diagnosis technology for unmanned aerial vehicle[J].Chinese Journal of Scientific Instrument,2020,41(09):56-69.
[4] GUO K,LIU L,SHI S,et al.UAV sensor fault detection using a classifier without negative samples:a local density regulated optimization algorithm[J].Sensors(Basel,Switzerland),2019,19(04):771.
[5] GINO I,GIUSEPPE C,AMELIA T.Fault diagnosis for uav blades using artificial neural network[J].Robotics,2019,8(03):59.
[6] ABBASPOUR A,ABOUTALEBI P,YEN K K,et al.Neural adaptive observer-based sensor and actuator fault detection in nonlinear systems:Application in UAV.[J].ISA transactions,2017,67(02):317-329.
[7] 高志鹏,牛琨,刘杰.面向大数据的分析技术[J].北京邮电大学学报,2015,38(03):1-12.
Gao Z P,Niu k,Liu J.Analytics towards big data[J].Journal of Beijing University of Posts and Telecommunications,2015,38(03):1-12.
[8] 张俊楠,娄淑琴,梁生.基于SVM算法的φ-OTDR分布式光纤扰动传感系统模式识别研究[J].红外与激光工程,2017,46(04):219-225.
Zhang J N,Lou S Q,Liang S.Study of pattern recognition based on SVM algorithm for φ -OTDR distributed optical fiber disturbance sensing system[J].Infrared and Laser Engineering,2017,46(04):219-225.
[9] 别锋锋,都腾飞,庞明军,等.基于ICEEMDAN-GRNN神经网络的往复泵故障诊断方法研究[J].机械设计与制造,2021(03):127-131.
Bie F F,Du T F,Pang M J,at al.Study on the method of ICEEMDAN-GRNN neural network of reciprocating pump fault diagnosis[J].Machinery Design & Manufacture,2021(03):127-131.
[10] 王烁,石全.基于人工神经网络的侵彻毁伤模式识别[J].兵器装备工程学报,2017,38(10):60-64.
Wang S,Shi Q.Penetration pattern recognition based on artificial neural network[J].Journal of Ordnance Equipment Engineering,2017,38(10):60-64.
[11] 刘凡,张昀,姚晓,等.基于K近邻算法的换流变压器局部放电模式识别[J].电力自动化设备,2013,33(05):89-93.
Liu F,Zhang Y,Yao X,at al.Recognition of PD mode based on KNN algorithm for converter transformer[J].Electric Power Automation Equipment,2013,33(05):89-93.
[12] 张阳阳,贾云献,吴巍屹,等.概率神经网络在车辆齿轮箱典型故障诊断中的应用[J].汽车工程,2020,42(07):972-977.
Zhang Y Y,Jia Y X,Wu W Y,at al.Application of probabilistic neural network to typical fault diagnosis of vehicle gearbox[J].Automotive Engineering,2020,42(07):972-977.
[13] 冯少荣,肖文俊.基于密度的DBSCAN聚类算法的研究及应用[J].计算机工程与应用,2007(20):216-221.
Feng S R,Xiao W J.Research and application of DBSCAN clustering algorithm based on density[J].Computer Engineering and Applications,2007(20):216-221.
[14] K.M K,A.R M R.A fast DBSCAN clustering algorithm by accelerating neighbor searching using groups method[J].Pattern Recognition,2016,58(07):39-48.
[15] YEWANG C,SHENGYU T,NIZAR B,et al.A fast clustering algorithm based on pruning unnecessary distance computations in DBSCAN for high-dimensional data[J].Pattern Recognition,2018,83(11):375-387.
Citation format:LU Jungang, ZHANG Shirong, LIANG Shaojun, et al.Study on multi-working clustering and recognition of fixed-wing UAV[J].Journal of Ordnance Equipment Engineering,2022,43(01):221-227.