基于自注意力机制和CNN-LSTM的空战目标机动轨迹预测

李战武1,张 帅1,乔英峰2,王 强2,姜 勇2,张 飞1

(1.空军工程大学 航空工程学院, 西安 710038;2.93066部队, 黑龙江 牡丹江 157000)

摘要:空战目标机动轨迹是有丰富时空特征的多维时间序列,具有高度复杂性和不确定性。针对现阶段轨迹预测运动学模型建立困难、时序预测的方法难以提取时空特征且只能单一的从TT+1时刻的顺序式训练的问题,文中提出了一种自注意力机制(self-attention,ATT)和卷积神经网络(convolutional neural network,CNN)-长短期记忆网络(long short-term memory,LSTM)结合的模型(CNN-LSTM-ATT)。离线状态下训练模型,获得的最优模型可以实现目标机动轨迹的高精度预测。文中模型与CNN-LSTM、LSTM模型进行单步预测对比分析,具有良好的单步预测和不同过载机动预测的能力。考虑到电磁干扰和复杂环境导致传输数据的误差和缺失,进行了目标轨迹的5步预测,预测结果和评价指标均优于CNN-LSTM、LSTM模型。

关键词:机动轨迹预测;空战数据分析;多层次时间序列;Self-Attention;多步轨迹预测

0 引言

空战中,机载传感器、指挥平台、数据链等实时传输目标状态信息,如能预测目标机动轨迹,将对我方提前形成优势占位、创造开火条件产生重要影响。轨迹预测广泛应用于民航交通管理(ATM)[1-2]、船舶轨迹预测[3]、导弹轨迹预测[4]、行人轨迹预测[5],航路规划[6]。空战中,如果能对目标下一时刻或下一时间段的轨迹进行预测,将有利于我方飞行员进行实时态势感知和对敌作战意图进行分析。

目标机动轨迹预测的一种方法是应用滤波算法、线性拟合等方法结合飞机运动学模型进行预测,王超等[7]按照不同飞行阶段特点构造三维剖面,拟合生成完整的4D轨迹。文献[8]采用随机非线性混合系统对飞机进行动力学建模,为解决模型的非高斯性质采用了粒子滤波的方法,为贝叶斯网络提供数值解。Zhao等[9]针对模型预测带来的线性化误差,提出了一种基于配置法的非线性预测模型,既满足了误差要求又确保了实时性要求。乔少杰等[10]提出了一种基于动态卡尔曼滤波的动态估计预测方法,较传统的轨迹预测方法提高了精度。谢丽等[11]提出了交互式多模型的滤波算法,并且在文章中证明了改进算法的有效性。黄景帅等[12]为了适应目标灵活多样的机动模式,基于正交性原理和无迹卡尔曼滤波算法实现了模型中机动频率参数的自适应。Wang等[13]将动态测量与灰色系统理论相结合,该方法误差是卡尔曼滤波法的1/5。Zhang等[14]建立了目标的动力学模型,而后用贝叶斯推理和蒙特卡洛方法实现了对弹道的预测。上述目标机动轨迹预测方法在运动特性相对简单、相对平稳目标上能起到较好的效果,但是空战过程中,目标的机动较大,且存在很多的不确定性,无法建立完备的、与运动特点相适应的运动学模型,导致模型的适用性差、预测误差大。

另一种目标机动轨迹预测方法是利用智能算法进行相应的优化。李战武等[15]利用改进的蝙蝠算法优化Volterra泛函级数轨迹进行预测,并且针对不同的预测问题得出最佳的截断阶数。谢磊等[16]利用自适应增强的粒子群优化LSTM的算法来预测无人机机动轨迹。王新等[17]在Elman神经网络的目标函数中引入时间收益因子,对三维坐标分别进行预测。张宏鹏等[18]基于卷积神经网络对无人作战飞机飞行轨迹进行预测,解决了原始动力学模型不能正确仿真滚转角有偏差的筋斗机动的弊端。Qiao等[19]通过分析隐马尔可夫模型的缺点,提出了一种自适应参数选择算法HMTP*,可以获取预测所需参数,提高了预测效率。上述方法达到了预期的效果,但是在应用的过程中对数据的类型要求相对比较严格,没有考虑目标多维状态信息对目标轨迹预测的影响,也未发掘出反映目标状态的时序信息之间的内在关系。

卷积神经网络(convolutional neural network,CNN)、长短期记忆网络(long short-term memory,LSTM)等深度学习模型广泛应用于自然语言处理[20]、时间序列处理[21]领域。针对目标轨迹预测过程中建立运动学模型困难和容易忽略目标状态信息的问题,本文中提出了自注意力机制(self-attention,ATT)和CNN-LSTM结合的深度学习模型,既能充分利用目标的速度、高度、方位、距离等多维状态信息,也能挖掘出目标时序状态信息之间隐含的内在联系。首先,利用卷积神经网络对目标状态信息进行特征提取,将得到的结果转型后输入对长时间序列处理能力更强的长短期记忆神经网络中,挖掘数据的时序特征;在输出层前接入自注意力模块,突出全局时序数据的特征,反映出目标在进行不同机动动作时数据特征的重要情况,从而达到目标在做不同机动时对目标轨迹的预测能力。最后,通过输出层将预测结果输出。本文采用了文献[17]中的整体法进行预测,同时本文还验证了模型对目标多步轨迹预测的结果。

1 空战数据分析与预处理

1.1 空战数据分析

空战中,机载传感器、指挥平台、数据链传输了大量的目标信息,包括目标的敌我属性、方位、速度、高度、距离等静态数据、动态数据、指令数据,属多层次时间序列[22]

1.2 数据集构建

输入数据需包含样本和标签,为保证和采集数据频率一致,时间步长设置为50,单步预测数据集构建如图1所示。

图1 单步预测数据集构建

Fig.1 Data set construction for single step prediction

图1中,利用T-49到T时刻的多维的特征数据来预测T+1时刻的标签数据,采取滑动窗口的方式,以保证在时间上的连续。

1.3 数据归一化与反归一化

为避免各特征数据量纲的不同对预测数据产生影响、加快模型的训练和收敛速度、防止出现过拟合,对数据进行了归一化处理,归一化方法如式(1)所示。

式中:x′为归一化后的数据;xmin、xmax为特征数据的最小值、最大值。

反归一化方法,如式(2)所示。

y'=y(ymax-ymin)+ymin

(2)

2 模型构建

2.1 卷积神经网络(CNN)

卷积神经网络(convolutional neural network,CNN)主要由卷积层、池化层、全连接层组成,各层的数量可以根据模型需要进行调整。单通道的CNN(Conv2D)网络结构如图2所示。

图2 CNN网络结构

Fig.2 Structure diagram of CNN

卷积层:用来提取时间序列的特征。卷积层在局部感知、权值共享、空间不变性上有很大的优点。

池化层:卷积运算后数据维数较大,为防止过拟合,包括最大池化(max pool)和平均池化(mean pool)。

全连接层:将得到的特征进行映射,传递给具体的分类器进行分类或回归处理。

2.2 长短期记忆网络(LSTM)

长短期记忆网络(long short-term memory,LSTM)[23]通过门控解决了在处理长时间序列时易出现梯度爆炸和梯度消失[24]的问题,可以对有价值的信息进行长期记忆,减小了网络的学习难度。

LSTM通过遗忘门、输入门、输出门控制神经元状态。神经元结构如图3所示。

图3 LSTM神经元结构

Fig.3 Structure diagram of LSTM neuron

遗忘门:对T-1时刻状态选择性“忘记”。fT如式(3)所示。

fT=σ(Wf·[hT-1,XT]+bf)

(3)

式中:σ为激活函数;Wf为权重;bf为偏置量。

输入门:激活函数σ计算iT,通过tanh计算新的向量更新细胞状态表达式如式(4)—式(6)所示。

iT=σ(Wi·[hT-1,XT]+bi)

(4)

式中:WiWC为权重;bibC为偏置量;tanh为激活函数。

输出门:输出当前时刻确定输出的信息。oThT表达式如式(7)、(8)所示。

oT=σ(Wo·[ht-1,XT]+bo)

(7)

hT=oT*tanh(CT)

(8)

式中:Wo为权重;bo为偏置量。

2.3 自注意力机制(self-attention)

自注意力机制(self-attention)[25]是Transformer模型中重要组成部分。文献[26]介绍了其与RNN的关系,不仅可以并行运算,在计算过程中还充分考虑了不同输入之间存在的内部关系,可以提高预测的准确率。

自注意力机制利用数据特征内部固有的信息进行注意力的交互,通过Input与Input计算查询向量Q(Query)、键向量K(Key)和值向量V(Value),计算过程如式(9)所示。自注意力机制结构如图4所示。

图4 自注意力机制结构

Fig.4 Structure diagram of self-attention

式中:dkK的维度,目的是对QK点乘后数值进行放缩。

2.4 CNN-LSTM-ATT轨迹预测模型

空战中,目标轨迹预测受多种因素影响,时间序列间存在相互关联成分。引入CNN模型,对输入的多维序列数据进行特征提取,挖掘各维度数据相互关系,将经特征提取的时间序列作为LSTM输入,构建CNN-LSTM预测模型。自注意力机制(ATT)能很好的解决CNN-LSTM网络只能单一的从TT+1时刻的顺序式的训练过程,通过挖掘全部时间序列中每一时刻信息的重要度,保证全部时间序列中各个特征维度内部特征的关联,保证了目标在不同时刻、做不同机动特别是进行较大机动时的强预测能力。构建的CNN-LSTM-ATT模型结构如图5所示。

图5 CNN-LSTM-ATT模型结构

Fig.5 Structure diagram of CNN-LSTM-ATT model

3 仿真试验

3.1 数据集划分

数据集采样频率50 Hz,共19 000条数据,按6∶2∶2比例划分为训练集、验证集、测试集,数据集的目标机动轨迹划分如图6所示。

图6 目标机动轨迹划分

Fig.6 Division of target maneuver trajectory

3.2 模型参数设置

在仿真中运用Python语言,专业版Pycharm,TF2.1深度学习框架。模型训练超参数设置如表1所示。

表1 模型超参数

Table 1 Hyperparameters for model

模型超参数数值Batch_size64OptimizerAdamLr0.000 1Epoch30

3.3 目标轨迹预测步骤

划分好的训练数据,输入深度学习模型,利用实时可视化工具Tensorboard观察训练集Loss值和测试集Loss值,判断模型拟合并满足精度后保存模型,而后进行预测,输出结果。轨迹预测流程如图7所示。

图7 轨迹预测流程

Fig.7 Flow chart of target maneuver trajectory prediction

3.4 目标机动轨迹预测

3.4.1 目标机动轨迹单步预测

仿真中,首先进行目标轨迹的单步预测,即只进行目标下一时刻轨迹的预测,模型收敛情况如图8所示。

图8 模型收敛情况

Fig.8 Convergence of the model

图8中,观察Loss值,训练集在第8轮已经收敛,同时验证集在14轮也能够收敛,构建的模型已经拟合。

在对目标机动轨迹进行预测时,与CNN-LSTM、LSTM模型进行了对比分析。XYZ轴以及三维轨迹对比结果如图9—图12所示。

图9 预测轨迹X轴对比

Fig.9 X-axis comparison from predicted trajectories

图10 预测轨迹Y轴对比

Fig.10 Y-axis comparison from predicted trajectories

从图9—图12可以看出,3种模型对目标的预测轨迹与实际轨迹保持了相同的趋势,但是本文中构建的模型对目标轨迹单步预测精度更高,并且随着预测时刻的增加也表现出了良好的性能。图9—图11中的子图可以看出,目标在做机动时(XYZ数值变化剧烈),模型也能够保持较小的误差,并且优于LSTM和CNN-LSTM模型,体现了自注意力机制在不同时刻的特征提取能力从而提高预测性能。

图11 预测轨迹Z轴对比

Fig.11 Z-axis comparison from predicted trajectories

图12 预测轨迹三维对比

Fig.12 3D comparison from predicted trajectories

3.4.2 目标机动轨迹5步预测

空战态势瞬息万变且传输数据存在误差,对目标的单步预测可能满足不了作战需要,所以本文对目标轨迹进行了5步预测,结果如图13所示。

图13 目标机动轨迹5步预测

Fig.13 5-step target trajectory prediction

图13中,在对目标进行5步预测时,3种预测模型会随着时间点的积累而出现累计误差,本文中的模型不仅保证了较小的累积误差,还保证了在目标进行机动时较小的误差,在多步预测的结果上明显优于CNN-LSTM和LSTM模型。

3.5 模型的评价指标

3.5.1 评价指标选取

深度模型预测中经常采用均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)评价指标来评价模型的预测能力和模型的稳定性。计算方法如式(10)—式(12)所示。

式中:Pi表示i时刻预测的值;Ri表示与Pi相对应的真实值;n表示预测的时序点个数。

3.5.2 模型评价指标计算

在进行模型评价指标计算时是对XYZ轴分别进行计算。表2、表3计算出了单步预测和5步预测各模型的评价指标。

表2 单步预测各模型评价指标数值

Table 2 Model evaluation index value for single step prediction

模型RMSEMAEMAPELSTMX32.648 633.318 20.012 3Y29.590 432.651 50.013 7Z20.576 322.250 00.012 5CNN-LSTMX26.185 625.631 60.010 3Y18.815 017.782 90.008 7Z12.252 911.098 70.007 1CNN-LSTM-ATTX16.324 815.947 40.007 6Y15.726 315.157 90.008 4Z5.577 25.236 80.004 0

表3 5步预测各模型评价指标数值

Table 3 Model evaluation index value for five steps prediction

模型RMSEMAEMAPELSTMX168.537 8162.575 80.049 5Y120.559 4117.409 10.046 4Z88.501 491.848 50.048 1CNN-LSTMX152.845 6124.736 80.038 7Y84.115 876.223 70.039 3Z80.252 652.125 90.046 1CNN-LSTM-ATTX25.602 722.552 60.018 0Y21.112 718.750 00.011 3Z12.245 77.145 60.019 7

从仿真图9—图13和模型评价指标表2、表3可以看出,模型在进行目标机动轨迹的单步预测和5步预测的过程中,评价指标均优于CNN-LSTM和LSTM模型,特别是在进行目标多步预测时,模型仍能保持较优的评价指标,体现出了模型对长时间序列的预测能力和稳定性。

4 结论

1) CNN-LSTM-ATT模型进行目标轨迹预测时,训练集Loss和验证集Loss均能够可靠、快速收敛,满足模型使用需求。

2) 从模型评估中可以看出,评价指标数值上均优于CNN-LSTM和LSTM模型。

3) 在对目标轨迹进行预测,特别是做机动动作时自注意力机制能够发挥其远距离学习、提高局部注意力的能力,从而保证机动时目标轨迹预测的精度。

4) 在进行目标的多步预测上,本文的模型误差随着步数的增加增长很小,不会出现误差快速积累的情况。

参考文献:

[1] ZENG W,QUAN Z,ZHAO Z,et al.A deep learning approach for aircraft trajectory prediction in terminal airspace[J].IEEE Access,2020,8:151250-151266.

[2] LEEGE A D,PAASSEN M V,MULDER M.A machine learning approach to trajectory prediction[C]//AIAA Guidance,Navigation,& Control.2013:4782.

[3] 吴鹏程,罗亮.基于RNN-LSTM的船舶运动轨迹预测[J].造船技术,2021,49(3):11-16.

WU Pengcheng,LUO Liang.Ship motion trajectory prediction based on RNN-LSTM[J].Marine Technology,2021,49(3):11-16.

[4] 宋波涛,许广亮.基于LSTM与1DCNN的导弹轨迹预测方法[J].系统工程与电子技术,2023,45(2):504-512.

SONG Botao,XU Guangliang.Missile trajectory prediction method based on LSTM and 1DCNN[J].Systems Engineering and Electronics,2023,45(2):504-512.

[5] ALAHI A,GOEL K,RAMANATHAN V,et al.Social lstm:Human trajectory prediction in crowded spaces[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition.2016:961-971.

[6] BENAVIDES J V,KANESHIGE J,SHARMA S,et al.Implementation of a trajectory prediction function for trajectory based operations[C]//AIAA Atmospheric Flight Mechanics Conference.2014:2198.

[7] 王超,郭九霞,沈志鹏.基于基本飞行模型的4D航迹预测方法[J].西南交通大学学报,2009,44(2):295-300.

WANG Chao,GUO Jiuxia,SHEN Zhipeng.Prediction of 4D trajectory basic flight models[J].Journal of Southwest Jiao Tong University,2009,44(2):295-300.

[8] LYMPERPOPOULOS I,LYGEROS J.Adaptive aircraft trajectory prediction using particle filters[C]//AIAA Guidance,Navigation &Control Conference &Exhibit.2008:7387.

[9] ZHAO K,WANG C,XIAO G,et al.Research for nonlinear model predictive controls to laterally control unmanned vehicle trajectory tracking[J].Applied Sciences,2020,10(17):6034.

[10] 乔少杰,韩楠,朱新文,等.基于卡尔曼滤波的动态轨迹预测算法[J].电子学报,2018,46(2):418-423.

QIAO Shaojie,HAN Nan,ZHU Xinwen,et al.A dynamic trajectory prediction algorithm based on kalman filter[J].Acta Electronica Sinica,2018,46(2):418-423.

[11] 谢丽,张军峰,隋东,等.基于交互式多模型滤波算法的航迹预测[J].航空计算技术,2012,42(5):68-70,74.

XIE Li,ZHANG Junfeng,SUI Dong,et al.Aircraftrajectory prediction based on interacting multiple model filtering algorithm[J].Aeronautical Computing Technique,2012,42(5):68-70,74.

[12] 黄景帅,李永远,汤国建,等.高超声速滑翔目标自适应跟踪方法[J].航空学报,2020,41(9):297-310.

HUANG Jingshuai,LI Yongyuan,TANG Guojian,et al.Adaptive tracking method for hypersonic glide target[J].Acta Aeronautica et Astronautica Sinica,2020,41(9):297-310.

[13] WANG Q,ZHANG Z,WANG Z,et al.The trajectory prediction of spacecraft by grey method[J].Measurement Science and Technology,2016,27(8):085011.

[14] ZHANG K,XIONG J J,LI F,et al.Bayesian Trajectory Prediction for a Hypersonic Gliding Reentry Vehicle Based on Intent Inference[J].Yuhang Xuebao/Journal of Astronautics,2018,39(11):1258-1265.

[15] 李战武,彭明毓,高春庆,等.基于SABA优化的Volterra级数空战目标机动轨迹预测[J].北京航空航天大学学报,2023,49(3):503-513.

LI Zhanwu,PENG Mingyu,GAO Chunqing,et al.Air combat maneuver trajectory prediction of target based on Volterra series optimized by SABA algorithm[J].Journal of Beijing University of Aeronautics and Astronautics,2023,49(3):503-513.

[16] 谢磊,丁达理,魏政磊,等.AdaBoost-PSO-LSTM网络实时预测机动轨迹[J].系统工程与电子技术,2021,43(6):1651-1658.

XIE Lei,DING Dali,WEI Zhenglei,et al.Real time prediction of maneuver trajectory for AdaBoost-PSO-LSTM network[J].Systems Engineering and Electronics,2021,43(6):1651-1658.

[17] 王新,杨任农,左家亮,等.基于HPSO-TPFENN的目标机轨迹预测[J].西北工业大学学报,2019,37(3):612-620.

WANG Xin,YANG Rennong,ZUO Jialiang,et al.Trajectory prediction of target aircraft based on HPSO-TPFENN neural network[J].Journal of Northwestern Polytechnical University,2019,37(3):312-620.

[18] 张宏鹏,黄长强,唐上钦,等.基于卷积神经网络的无人作战飞机飞行轨迹实时预测[J].兵工学报,2020,41(9):1894-1903.

ZHANG Hongpeng,HUANG Changqiang,TANG Shangqin,et al.CNN-based real-time prediction method of flight trajectory of unmanned combat aerial vehicle[J].ACTA Armamentarii,2020,41(9):1894-1903.

[19] QIAO S,SHEN D,WANG X,et al.A self-adaptive parameter selection trajectory prediction approach via hidden markov models[J].IEEE Transactions on Intelligent Transportation Systems,2015,16(1):284-296.

[20] CHEN T,XU R,HE Y,et al.Improving sentiment analysis via sentence type classification using BiLSTM-CRF and CNN[J].Expert Systems with Applications,2017,72:221-230.

[21] 张巧灵.基于深度学习的时间序列数据融合算法研究及应用[D].西安:西安电子科技大学,2021.

ZHANG Qiaoling.Research and application of time series data fusion algorithms based on deep learning[D].Xi’an:Xidian University,2021.

[22] LIM B,ARK S Ö,LOEFF N,et al.Temporal fusion transformers for interpretable multi-horizon time series forecasting[J].International Journal of Forecasting,2021,37(4):1748-1764.

[23] HOCHREITER S,SCHMIDHUBER J.Long short-term memory[J].Neural Computation,1997,9(8):1735-1780.

[24] LE Q V,JAITLY N,HINTON G E.A simple way to initialize recurrent networks of rectified linear units[J].arXiv Preprint arXiv:1504.00941,2015.

[25] VASWANI A,SHAZEER N,PARMAR N,et al.Attention is all you need[J].Advances in Neural Information Processing Systems,2017,30.

[26] KATHAROPOULOS A,VYAS A,PAPPAS N,et al.Transformers are RNNs:Fast Autoregressive Transformers with Linear Attention[C].2020.

Maneuvering trajectory prediction of air combat targets based on self-attention mechanism and CNN-LSTM

LI Zhanwu1, ZHANG Shuai1, QIAO Yingfeng2, WANG Qiang2, JIANG Yong2, ZHANG Fei1

(1.Aviation Engineering School, Air Force Engineering University, Xi’an 710038, China; 2.Unit 93066, Mudanjiang 157000, China)

AbstractAn air combat target maneuver trajectory is a multi-dimensional time series with rich temporal and spatial characteristics, and high degrees of complexity and uncertainty. At present, establishing kinematic models for trajectory prediction is very difficult. Besides, it is also difficult for time-series prediction methods to extract temporal and spatial features, and only single sequential training can be achieved from T to T+1. In this view, this paper proposes model CNN-LSTM-ATT, which combines Self-Attention (ATT) mechanism with Convolutional Neural Network (CNN) and Long Short-Term Memory (LSTM). This model is trained offline, and the obtained optimal model can realize high-precision prediction of target maneuver trajectories. Compared with CNN-LSTM and LSTM models for single-step prediction, this model has a good single-step prediction performance and different overload maneuvering prediction abilities. Considering the errors and missing of the transmitted data caused by electromagnetic interference and complex environment, the 5-step target trajectory prediction is carried out, and the prediction results and evaluation indexes are better than those of CNN-LSTM and LSTM models.

Key wordsmaneuvering trajectory prediction; analysis of air combat data; multi-level time series; Self-Attention; multi-step trajectory prediction

收稿日期:2022-12-15;

修回日期:2023-02-13

基金项目:研究生创新实践基金项目(CXJ2022001)

作者简介:李战武(1978—),男,博士,教授。

通信作者:张帅(1997—),男,硕士研究生,E-mail:1334711440@qq.com。

doi:10.11809/bqzbgcxb2023.07.028

本文引用格式:李战武,张帅,乔英峰,等.基于自注意力机制和CNN-LSTM的空战目标机动轨迹预测[J].兵器装备工程学报,2023,44(7):209-216.

Citation format:LI Zhanwu, ZHANG Shuai, QIAO Yingfeng, et al.Maneuvering trajectory prediction of air combat targets based on self-attention mechanism and CNN-LSTM[J].Journal of Ordnance Equipment Engineering,2023,44(7):209-216.

中图分类号:V246

文献标识码:A

文章编号:2096-2304(2023)07-0209-08

科学编辑 沙建科 博士(四川航天技术研究院研究员)责任编辑 胡君德