基于Bahdanau注意力机制的大口径火炮双向GRU轨迹预测

彭晨洋,陈龙淼,张鸣洋

(南京理工大学 机械工程学院, 南京 210094)

摘要:针对大口径火炮弹丸轨迹预测问题,提出一种基于Bahdanau注意力机制与双向门控循环单元网络的序列到序列轨迹预测模型(S2S ATT-BiGRU)。通过不同条件下六自由度弹丸运动模型仿真,得到大量弹丸轨迹数据样本,并利用滑动窗口法和差分法构造仿真数据集;将所提轨迹预测模型与GRU模型在仿真数据集下进行实验。研究结果表明,S2S ATT-BiGRU模型在输入时间为0.5 s预测未来时间为5 s的情况下,其MSE为13.89 m2,MAE为1.84 m,MAPE为0.29%,其预测精度远高于GRU模型。在其余情况下S2S ATT-BiGRU模型的预测结果均优于GRU模型。这表明S2S ATT-BiGRU模型具有更强的存储输入轨迹序列信息和自适应关注重要输入轨迹信息的能力,为弹丸轨迹预测研究提供有利参考。

关键词:轨迹预测;弹道模型;S2S ATT-BiGRU模型;深度学习

0 引言

大口径火炮是陆军施行火力突击任务的主要装备,具有全天时、全天候作战等特点,其打击精度对火炮的整体作战性能起着决定性作用[1]。而实现高精度打击的关键在于火炮闭环校射系统能否稳定地获取弹丸轨迹参数。然而,由于地形复杂、天气多变等因素,弹丸轨迹参数的获取时常面临缺失的困境。为了确保在弹丸轨迹参数信息不完整的情况下,打击精度依然能够保持稳定和可靠,通常采用弹丸轨迹预测技术来重构和预测弹丸的飞行轨迹。这项技术所处理的输入序列按照其长度可以大致分为短序列和长序列两类。值得注意的是,长、短序列的界定并没有一个固定的标准,而是需要根据实际应用场景进行灵活判断。由于在传统循环神经网络中,当输入时间序列长度通常超过10个时间步时,会存在梯度消失或梯度爆炸问题,因此本文中规定输入序列长度小于10时,为短序列,反之为长序列。

弹丸轨迹预测技术主要包括基于线性弹道模型的方法与近年来出现的基于深度学习的方法。线性弹道模型是一种基于物理原理的弹道模型,具有实时解算效率高、模型稳定等特点,但当弹丸运动速度较高或弹道较长,空气阻力和重力加速度等因素的影响不容忽视时,线性弹道模型无法准确预测弹丸的运动轨迹。李兴隆等[2]将六自由度刚体外弹道模型线性化,并结合剩余飞行弧长估算公式,推导出弹道落点快速预测模型,通过在不同射角和预测点下进行弹丸预测精度仿真实验对比,结果表明线性弹道方程在大射角范围满足落点预测精度要求,但需要较多弹道参数,适用场景有限。Raza等[3]提出一种使用固定前缘矫正弹头的122 mm火箭弹的二阶段制导与控制算法,通过基于修正弹丸线性理论的打击点预测方法实现校正阶段的反馈控制,以提高火箭弹的弹着精度,实验结果表明火箭弹的圆概率误差(CEP)显著降低,但几乎50%的火箭弹与目标的脱靶距离大于火箭弹的致命半径,无法满足实战要求。

基于深度学习的弹道轨迹预测是一种通过数据驱动构建弹丸精确动力学模型的方法,具有弹道参数需求量少,气象变化适应性强等优点,比线性弹道模型具有更高的预测准确性和更强的自适应性。其中,循环神经网络(RNN)擅长于对序列数据进行建模,它通过差分方程的形式来表达序列中各个元素之间的依赖关系[4]。基于门控机制的循环神经网络是一种改进的循环神经网络模型,通过门控机制可有效地控制信息的流动和传递,从而有效减缓了梯度消失和梯度爆炸问题,使得模型可以更好地处理长序列数据。此外,门控机制也可以使模型更具有可解释性,便于调试和优化,常见的门控循环神经网络模型包括长短期记忆网络(LSTM)和门控循环单元网络(GRU)[5-7]。任济寰等[8]提出一种增强上下文信息长短期记忆网络模型(CE-LSTM)进行弹道轨迹长期预测,通过将相邻LSTM单元的隐藏层进行线性加权组合,增强网络模型短期记忆能力,实验结果表明CE-LSTM网络对炮弹弹道轨迹预测精度高、解算实时性强,但未考虑弹丸结构、质量等不确定性因素。郑志伟等[9]提出基于卷积神经网络与长短期记忆网络(CNN-LSTM)的弹道轨迹预测方法,通过六自由度弹道方程数值模拟建立弹道轨迹仿真数据集,并同LSTM网络、GRU网络和BP网络做实验对比,实验结果表明CNN- LSTM预测精度高于单一模型,但在异步序列预测时,弹道轨迹累积预测误差增长较快。Lui等[10]提出一种基于LSTM神经网络的导弹机动轨迹预测方法,通过对比实验证明了该方法相比于物理模型方法在预测精度和鲁棒性方面有明显的优势,并对LSTM模型的可解释性进行了深入探讨,揭示了LSTM模型能够对轨迹预测问题进行有效建模的内在原理,但实验数据集较小无法完全反映真实情况下的效果,需更多的数据集进行验证。Sun等[11]基于LSTM神经网络,提出一种用于拦截高超声速滑翔飞行器的弹道轨迹预测方法,其通过捕捉输入轨迹数据中的非线性动态特征,提高了预测准确性,并采用管道流程设计,简化了问题的复杂度,降低了算法实现的难度,但没有考虑输入轨迹数据之间的时间关系,可能导致长期依赖问题。Roux等[12]提出了一种基于LSTM的弹道轨迹估计方法,旨在解决GNSS信号受限环境下的弹道轨迹预测问题。通过对比实验表明,该方法能够在缺少GNSS信号的情况下准确地估计弹道轨迹,比传统基于卡尔曼滤波器的方法具有更高的精度和更快的响应速度,但在弹道轨迹出现突然变化或者与训练数据差异较大的情况,LSTM网络的预测精度可能会受到影响。

综上所述,现有的基于门控机制的循环神经网络模型虽在处理短序列输入数据时解决了传统循环神经网络存在的长程依赖问题,但基于门控机制的循环神经网络模型在处理长序列输入数据时,仍然会出现长程依赖问题。因为在处理长序列输入数据时门控机制难以有效地捕捉到序列中的长期依赖关系,从而导致信息难以在较长时间内传递和保持,影响序列预测的准确性。与此同时,对于多步序列预测,现有的基于门控机制的循环神经网络模型仍然采用递归模型的方式进行预测,这意味着模型在每一步预测中均需使用前一步的预测结果作为输入预测后一步,这期间的预测误差会随着时间的推移逐步累积,导致预测精度下降。针对在处理输入长序列预测多步序列过程中存在的长程依赖和误差累积问题,自然语言处理等领域采用注意力机制和编码器-解码器结构来处理预测过程中的长期依赖和预测误差累积问题已取得了显著的成果,但目前将注意力机制与编码器-解码器结构用于炮弹轨迹预测在国内外公开发表的文献中鲜有报道。

针对弹丸轨迹预测问题,本文中提出了一种基于Bahdanau注意力机制与双向长短期记忆网络的序列到序列轨迹预测模型(S2S ATT-BiGRU),进行火炮弹丸轨迹预测。S2S ATT-BiGRU模型通过引入注意力机制与编码器-解码器架构,显著增强了网络对输入轨迹序列信息的存储能力和对关键输入轨迹信息的自适应关注能力。由此,模型预测精度得以提升,有效缓解了基于门控机制的循环神经网络在处理长序列输入数据时面临的长程依赖问题,同时也减轻了基于递归网络模型进行多步预测时可能产生的预测误差累积问题。此外,S2S ATT-BiGRU模型采用双向GRU网络增强模型上下文建模能力和预测能力,同时降低模型过拟合风险。

在本文中的后续部分,我们选取了六自由度弹丸运动模型作为研究的基础仿真模型。利用弹丸的实际参数,并充分考虑了极端气象条件和不同的射击方式,通过数值仿真方法获得了大量的弹丸轨迹数据样本。为了提高轨迹数据的平稳性,我们采用了1阶差分法进行处理,并通过滑动窗口法构建了仿真数据集。随后,我们对S2S ATT-BiGRU模型和GRU模型在构建的仿真数据集上进行了优化训练,并进行了轨迹预测对比实验。在评估预测结果时,我们选用了平均绝对误差(MAE)、均方误差(MSE)和平均绝对百分比误差(MAPE)作为评价指标,以此全面验证S2S ATT-BiGRU模型的有效性和实验的可靠性。

1 弹丸动力学建模及轨迹数据库建立

基于深度学习的弹丸轨迹预测的前提条件是足量的弹丸飞行轨迹观测数据。针对真实弹丸飞行轨迹数据较少的问题,通过建立弹丸运动微分方程组,并利用数值积分方法获得弹丸飞行轨迹仿真数据集。非线性六自由度弹丸运动方程是最常用的描述弹丸空中运动状态的方法,当提供所有的气动力、气动力矩和初始条件,其可精确描述旋转稳定弹和非旋转稳定弹的弹道和飞行动力学现象,故将其作为本文中的弹丸动力学模型[2,13]

1.1 非线性六自由度弹道模型

针对155 mm车载火炮,考虑计算精度,以非线性六自由度弹道模型[14]作为弹道仿真模型,其由12个非线性的微分方程和3个方位角关系式组成。六自由度弹道方程的状态变量为: x=[x y z v θa ψ2 φa γ φ2 ωξ ωη ωζ],其中,xyz为地面坐标系下弹丸位置分量;θa为速度高低角,ψ2为速度方向角;φa为弹轴高低角,φ2为弹轴方位角,γ为弹丸自转角;v为弹道坐标系下的速度;ωξωηωζ为弹轴坐标系下弹丸角速度分量。在六自由度刚体弹道方程的基础上,忽略科氏惯性力、弹丸尾翼导转力矩,并且不考虑弹箭质量和外形不对称情况,六自由度弹道模型的状态空间形式可表达如下:

(1)

式(1)中:m表示弹丸质量;AC分别表示弹丸赤道转动惯量和弹丸极转动惯量;Fx2Fy2Fz2分别表示弹丸在弹道坐标系下的气动力分量;MξMηMζ分别表示弹丸在弹轴坐标系下的气动力力矩分量。相关坐标系的定义、角度几何关系式、力和力矩的定义见文献[14]。

1.2 弹道轨迹仿真数据集建立

155 mm车载火炮的弹丸轨迹受到火炮发射扰动、气象不稳定、弹丸质量等诸多不确定性因素的影响。设定火炮缠度η为20,地球自转角速度ωD=7.292×10-5 rad/s,中国有效地球半径R=6 358.299 km,重力加速度地面标准值G=9.80 m/s2,空气比热比K=1.404,弹丸长度L=0.9 m,弹丸弹径D=0.155 m,火炮发射初始坐标值均为0,外弹道气动力参数通过对弹丸飞行实验数据进行参数辨识得到,其余不确定参数见表1。

表1 不确定参数

Table 1 Uncertain parameters

编号力学参数分布类型均值标准差1炮口初速扰动vQE/(m·s-1)正态分布052弹丸质量m/kg正态分布45.50.104

为实现弹道轨迹多样化,通过不同的地面风速、火炮发射初速、火炮高低射角,共得到864条弹道轨迹,其参数设置如表2 所示。

表2 弹丸轨迹采样参数

Table 2 Sampling parameters of projectile trajectory

参数采样值采样间隔发射角/(°)[20,60]5初始速度/(m·s-1)[600,900]20地面风速/(m·s-1)[0,10]2

在实际弹丸飞行实验中,弹丸的射程、高度、横偏、速度、倾角可通过弹载雷达[15]较容易获取,因此将弹丸射程、弹丸高度、弹丸横偏、弹丸速度、弹丸倾角作为弹丸轨迹数据库的特征属性。弹丸仿真轨迹如图1所示。图1中弹丸初始高角分别设置为20°、30°、40°,弹丸初始速度为900 m/s,地面风速为5 m/s。

图1 弹丸仿真轨迹图

Fig.1 Simulated trajectory of projectile

2 轨迹预测模型

2.1 BiGRU简介

针对RNN神经网络模型存在的长期依赖问题,Chung等人通过研究门控机制,并于2014年提出GRU神经网络模型[16],其神经单元结构如图2所示。

图2 GRU神经单元结构

Fig.2 GRU neural unit structure

图2中,GRU神经网络主要由更新门、重置门和存储单元组成。存储单元是核心部件,其负责序列信息的线性传递。2种类型的门控机制具有控制序列信息传输路径和信息累积速度的功能,其中更新门有选择的存储上一时刻的累积信息,重置门决定上一时刻的状态对当前时刻候选状态的控制程度。

假定GRU神经单元处于时刻t,rtzt分别表示重置门、更新门;分别表示当前时刻t的网络输出、输入和候选状态;ht-1表示上一时刻的网络输出;σ表示sigmoid函数; Wb分别对应门控机制和存储单元的权重矩阵和偏差。GRU神经单元的方程组如式(2)—式(5)所示:

rt=σ(Wxrxt+Whrht-1+br)

(2)

zt=σ(Wxzxt+Whzht-1+bz)

(3)

(4)

(5)

BiGRU是GRU的扩展版,通过考虑过去和未来的状态信息来提高预测性能,其单元结构[17]如图3所示。BiGRU通过正向GRU网络和反向GRU网络同时对时间序列数据进行学习优化,其输入数据为时间序列的两端点值,输出由两单向GRU共同决定。

图3 BiGRU神经单元结构

Fig.3 BiGRUneural unit structure

2.2 序列到序列长短期记忆网络简介

GRU输入一定长度的时间序列数据,输出固定长度的预测序列数据,对可变序列预测的适应性低,通过递归GRU的方法可提高对可变序列预测的适应性,但此种方法会累积预测误差导致预测性能降低。

针对上述问题,引入基于编码器-解码器结构的序列到序列门控循环单元网络(GRU Seq2Seq),其在不降低预测性能的基础上,可提高对可变序列预测的适应性。

GRU Seq2Seq包含编码器网络和解码器网络2部分,其编码器网络和解码器网络均由GRU堆叠构建而成,其网络结构[18]如图4所示。

图4 序列到序列门控循环单元网络结构

Fig.4 Sequence-to-Sequence Gated Recurrent Unit structure

GRU Seq2Seq通过编码器网络将输入时间序列数据转换为固定长度的上下文向量,利用解码器在迭代过程中逐步将上下文向量转换为可变长时间序列数据。

2.3 Bahdanau注意力机制简介

当输入序列很长时,Seq2Seq模型难以通过上下文向量存储输入序列的全部信息,导致模型预测性能下降。因此,引入Bahdanau注意力机制[19],其使传统Seq2Seq模型的解码器网络能够关注输入序列的特定部分,避免编码器网络将输入序列信息压缩成固定长度的上下文向量,如图5所示。

图5 Bahdanau注意力机制

Fig.5 Bahdanau attention mechanism

Bahdanau注意力机制本质是将解码器的隐状态同编码器所有位置输出隐状态做相似度计算,并根据相似度值使解码器关注输入序列特定部分,达到改善Seq2Seq模型的目的,其表达式如式(6)—式(8)所示:

ei, j=vatanh(Wa[si-1,hj])

(6)

(7)

(8)

式(6)—式(8)中:Tx表示输入序列长度;ei, j表示解码器网络i-1时刻的隐状态与编码器网络第j个位置隐状态的关联度;αi, j表示关联概率分布;ci表示时刻的上下文向量。

2.4 S2S ATT-BiGRU轨迹预测模型

弹道轨迹是连续且具有复杂内部规律的时间序列数据集,其上下文信息具有强关联性,在此基础上提出基于Bahdanau注意力机制与双向长短期记忆网络的序列到序列弹道轨迹预测模型,其结构如图6所示。

图6 S2S ATT-BiGRU弹道轨迹预测框架

Fig.6 S2S ATT-BiGRU framework for ballistic trajectory prediction

S2S ATT-BiGRU弹道轨迹预测模型由编码器网络层、注意力机制层和解码器网络层3部分构成。编码器网络由一个具有4个神经元的全连接输入层和2个具有256个神经元的BiGRU层堆叠构建而成。弹道轨迹输入序列为{p1,p2,…,pn},全连接输入层首先将弹丸三维向量p转换为三维特征向量,以捕获弹道轨迹数据的复杂结构,然后通过两层BiGRU堆栈得到编码器隐状态集h,并传送给注意力机制层。

注意力机制层由concat模块、softmax模块和Linear模块3部分组成。首先,conact模块通过解码器t-1时刻隐状态st-1和编码器隐状态集h得出关联度矩阵;然后,softmax模块将关联度矩阵转换为关联概率矩阵;最后,Linear模块将关联概率矩阵作为输入,输出t时刻解码器所需的上下文向量ct

解码器网络由一个具有4个神经元的全连接输入层,2个堆叠的具有256个神经元的GRU层和一个具有4个神经元的全连接输出层组成。在训练过程中,解码器首先通过编码器最后输出隐状态向量对GRU堆叠层进行初始化,并将输入弹道轨迹序列的最后一个值pn,作为解码器网络的第一个输入值;其次根据教师强制率和介于0和1之间的随机数n的大小关系,确定编码器的输入值;最后,通过全连接层输出弹道轨迹预测值。在网络训练过程中,通过重复试探超参数组合使模型预测精度最佳的方法,最终选择0.001作为模型的学习率。在测试过程中,解码器将弹道轨迹预测序列作为输入值。

S2S ATT-BiGRU弹道轨迹预测模型的目的是在输入序列明确的情况下,最小化预测序列与目标序列的距离,其可被定义为如式(9)所示[20]:

(9)

式(9)中:m表示输入序列特征维度;L表示损失函数;表示预测序列;Y表示目标序列;D表示概率分布函数。定义为:表示非线性函数,C表示上下文矩阵。

3 轨迹预测仿真实验

本仿真实验基于pycharm平台和pytorch深度学习框架,实验全程使用NVIDIAGeForce RTX 3060 GPU进行网络训练。轨迹预测仿真实验包含离线训练和在线预测2个阶段,如图7所示。在离线训练阶段,首先对轨迹数据进行1阶差分和归一化预处理;其次,使用滑动窗口法将预处理数据进行样本数据集与目标数据集的划分;最后,利用反向传播算法对S2S ATT-BiGRU模型进行训练优化,并将优化模型在验证集上进行验证预测实验,选择预测效果最好的模型作为在线预测阶段的预测模型。在在线预测阶段,将经过1阶差分和归一化预处理后的轨迹数据输入已优化好的S2S ATT-BiGRU模型,并经过反差分方法输出预测轨迹。

图7 轨迹预测实验流程图

Fig.7 Experimental flow of trajectory prediction

3.1 弹道轨迹预处理与评价指标选取

弹道轨迹数据集可表示为三维向量T={T1,T2,…,Tk},k表示弹道轨迹的总数,其中为第i条弹道轨迹数据,n表示为轨迹点总数,vxyz分别为速度、射程、射高和横偏四个轨迹特征。针对弹道轨迹数据的非平稳性和预测模型的滞后性,对原始数据进行1阶差分[21]。针对单条样本轨迹数据的轨迹特征具有不同量纲和数量级问题,采用弹道轨迹归一化的方法,归一化公式如下:

(10)

式(10)中:Px表示归一化后的轨迹数据;P表示原始轨迹数据;Pmax表示样本轨迹数据中的最大值;Pmin表示样本轨迹数据中的最小值。

弹道轨迹预测属于监督学习中的回归问题,在离线训练过程中需将轨迹数据分为样本特征和样本标签两部分,其中样本标签为轨迹序列。训练样本构造方法,如图8所示。

图8 训练样本构造

Fig.8 Structurally training sample

图8中,设定输入轨迹序列长度为N,目标轨迹长度为M。从弹道起始位置开始,连续选取N个轨迹点作为样本特征1,再连续选取接下来的M个轨迹点作为样本标签1,间隔L个采样时间步长按照同样方法确定样本特征2和样本标签2,以此类推得到整个训练样本。

为衡量S2S ATT-BiGRU弹道轨迹预测模型的有效性,使用平均绝对误差(MAE)、均方误差(MSE)和平均绝对百分比误差(MAPE)作为评价指标。假定ytt时刻的真值,t时刻的预测值,N为预测序列长度,MSE被定义为被定义为被定义为实验选取864条弹道轨迹作为训练集,并从训练集中选取77条弹道轨迹作为验证集,选取86条弹道轨迹作为测试集。

3.2 实验模型结构

3.2.1 S2S ATT-BiGRU模型

S2S ATT-BiGRU模型由编码器双向门控循环单元网络、注意力机制和解码器门控循环单元网络3部分构成,其中的GRU单元均添加Dropout层,以防止模型过拟合,其总体网络模型结构如表3所示。

表3 S2S ATT-BiGRU模型结构参数

Table 3 Structure parameter of S2S ATT-BiGRU model

层定义层参数层输入输出全连接层1神经元数量4输入:(None,1,4)输出:(None,1,4)BiLSTM层1神经元数量256输入:(None,1,4)输出:(None,4,256)Dropout层1Dropout率0.2输入:(None,4,256)输出:(None,4,256)全连接层2神经元数量256输入:(None,2,512)输出:(None,2,256)tanh层_输入:(None,1,256)输出:(None,1,256)全连接层3神经元数量256输入:(None,1,768)输出:(None,1,256)tanh层_输入:(None,1,256)输出:(None,1,256)全连接层4神经元数量1输入:(None,1,256)输出:(None,1,1)Softmax层_输入:(None,1,1)输出:(None,1,1)GRU层1神经元数量256输入:(None,1,516)输出:(None,1,256)Dropout层1Dropout率0.2输入:(None,1,256)输出:(None,1,256)全连接层6神经元数量4输入:(None,1,771)输出:(None,1,4)

3.2.2 对比模型

神经网络预测法的主要思想是神经网络模型通过误差反向传播算法将已测弹道轨迹数据进行离线学习,并将离线学习过程中表现优异的神经网络模型用于弹道轨迹在线预测过程。LSTM模型和GRU模型,常用于解决序列预测问题,其网络模型结构参数,如表4所示。

表4 网络模型结构参数

Table 4 Structure parameter of network model

网络模型层定义层参数GRU模型GRU层1神经元数量256神经层数2全连接层神经元数量4

3.3 实验结果与分析

S2S ATT-BiGRU模型在训练过程中,MSE损失曲线,如图9所示。MSE损失值经过100次迭代更新后平稳变化,这表明模型对序列特征信息的提取已经达到极限,模型收敛。

图9 MSE损失曲线

Fig.9 MSE loss curve

适宜的教师强制率可提高S2S ATT-BiGRU模型学习速率,使模型快速达到稳定状态。通过重复试探教师强制率使模型在测试集中的预测精度达到最佳的方法,确定模型的学习强制率。例如,在输入30个弹丸观测点,预测后100个弹丸轨迹点的情况中,试探不同教师强制率,选取0.3作为强制教师率时,射程、射高和横偏的平均MSE达最小值,试探结果如图10所示。

图10 教师强制率试探结果

Fig.10 The test result on teacher forcing ratio

GRU模型和S2S ATT-BiGRU模型在同一数据集上,采用相同数据划分方式,进行弹丸轨迹预测实验。5种模型在训练过程中,均使用自适应估计优化器(Adam),并使用射程、射高和横偏的MAEMSEMAPE的平均值作为模型预测效果评估。

实验将训练过程中表现优异的神经网络模型用于在线预测,使用测试集进行在线预测实验的输入数据和目标数据划分。实验将在轨迹点的采样时间为0.01 s的情况下,分别输入30和50个轨迹点,分别预测接下来的100、300、500个轨迹点,并通过预测值同目标值计算误差得到平均 MAE(m)、MSE(m2)和MAPE指标。在预测1、3、5 s三种情况下,5种模型的平均误差结果分别如表5所示。

表5 误差评估

Table 5 Error assessment

输入时间/s输出时间/s模型MSEMAEMAPE/%0.3135S2SATT-BiGRU0.150.220.033GRU0.440.290.019S2SATT-BiGRU5.571.190.19GRU27.132.330.37S2SATT-BiGRU23.352.530.14GRU167.916.010.410.5135S2SATT-BiGRU0.260.260.036GRU13.391.850.15S2SATT-BiGRU7.621.570.79GRU360.329.680.48S2SATT-BiGRU13.891.840.29GRU1012.1516.987.24

通过对表5的误差评估结果进行综合分析可以得出:

1) 在输入时间为0.3 s和0.5 s并预测未来1、3、5 s的情况下,2种模型的预测精度均降低,这是因为过长的预测序列可能会引入更多的噪声,从而影响模型的预测能力。

2) 随着输入时间的增加,两种模型的预测精度总体上呈现下降趋势,但S2S ATT-BiGRU模型预测精度下降最少。这是因为输入时间的变长,S2S ATT-BiGRU模型虽然无法完全解决长程依赖问题,但比GRU模型更能起到减缓问题的作用。

3) S2S ATT-BiGRU模型的预测精度在输入时间为0.3 s和0.5 s并预测未来1、3、5 s的情况下均高于GRU模型的预测精度。这是由于S2S ATT-BiGRU模型采用的序列到序列模型比传统基于门控机制的循环神经网络预测精度更高,因为传统的循环神经网络在处理轨迹序列时会出现信息丢失等问题,而序列到序列模型引入了编码器-解码器的架构,可以将输入轨迹序列映射为一个固定长度的向量,大幅度改善了轨迹序列信息丢失问题。同时,S2S ATT-BiGRU模型引入注意力机制,相比于循环神经网络能够通过调整注意力权重,更好地捕捉输入序列与输出序列之间的关系,从而提高预测精度。

4 结论

针对弹丸轨迹预测问题,通过对弹丸6自由度非线性运动方程进行数值仿真,建立训练和测试数据集,并用于轨迹预测实验,得出以下结论:

1) S2S ATT-BiGRU模型在所有情况下的预测结果优于GRU模型,这表明S2S ATT-BiGRU模型更适用于弹丸轨迹预测。

2) 随着预测时间的增长,S2S ATT-BiGRU模型的预测精度相比于GRU模型的预测精度有大幅提升。特别在输入时间为0.5 s预测未来时间为5 s的情况下,S2S ATT-BiGRU模型的MSE仅为13.89 m2,MAE仅为1.84 m,MAPE仅为0.29%,远低于GRU模型,优势十分明显。这说明基于编码器-解码器结构和注意力机制的神经网络具有更强的存储输入信息的能力,可以更加灵活地对不同时间步的输入进行加权,使得模型能够更准确地获取关键信息并将其传递到后续时间步,这有助于提高长序列建模的能力,避免信息在时间序列中的逐渐稀疏和衰减,从而提高预测精度。因此比传统的循环神经网络更能准确预测弹丸轨迹。

本文验证了基于编码器-解码器结构与注意力机制的双向GRU网络模型对弹丸轨迹预测问题的有效性,后续还需探究采样时间的不同对模型的影响,并将模型运用于真实实验数据上进行进一步验证。

参考文献:

[1] 钱林方,陈光宋.中远程压制火炮射击精度理论[M].北京:北京科学出版社,2020.QIAN Linang,CHEN Guangsong.The theory of long-range suppression artillery shooting accuracy[M].Beijing:Beijing Science Press,2020.

[2] 李兴隆,贾方秀,王晓鸣,等.基于线性弹道模型的末段修正弹落点预测[J].兵工学报,2015,36(7):1188-1194.LI Xinglong,JIA Fangxin,WANG Xiaoming,et al.Impact point prediction of terminal correction projectile based on linear trajectory model[J].Acta Armamentarii,2015,36(7):1188-1194.

[3] RAZA A,WANG H.Range and accuracy improvement of artillery rocket using fixed canards trajectory correction fuze[J].Aerospace,2022,9(1):32.

[4] SHERSTINSKY A.Fundamentals of recurrent neural network (RNN) and long short-term memory (LSTM) network[J].Physica D:Nonlinear Phenomena,2020,404:132306.

[5] 邱锡鹏.神经网络与深度学习[M].北京:机械工业出版社,2020.QIU Xipeng.Neural networks and deep learning[M].Beijing:China Machine Press,2020.

[6] WEERAKODY P B,WONG K W,WANG G,et al.A review of irregular time series data handling with gated recurrent neural networks[J].Neurocomputing,2021,441:161-178.

[7] FANG W,CHEN Y,XUE Q.Survey on research of RNN-based spatio-temporal sequence prediction algorithms[J].Journal on Big Data,2021,3(3):97.

[8] 任济寰,吴祥,薄煜明,等.基于增强上下文信息长短期记忆网络的弹道轨迹预测[J].兵工学报,2023,44(2):462-471.REN Jihuan,WU Xiang,BO Yuming,et al.Ballistic trajectory prediction based on context-enhancedLong short-term memory network[J].Acta Armamentarii,2023,44(2):462-471.

[9] 郑志伟,管雪元,傅健,等.基于卷积神经网络与长短期记忆神经网络的弹丸轨迹预测[J].兵工学报,2023,44(10):2975-2983.ZHENG Zhiwei,GUAN Xueyuan,FU Jian,et al.Projectile trajectory prediction based on convolutional neural network and long and short-term memory neural network[J].Journal of Military Engineering,2023,44(10):2975-2983.

[10] LUI D G,TARTAGLIONE G,CONTI F,et al.Long short-term memory-based neural networks for missile maneuvers trajectories prediction?[J].IEEE Access,2023,11:30819-30831.

[11] SUN L H,YANG B Q,MA J.Trajectory prediction in pipeline form for intercepting hypersonic gliding vehicles based on LSTM[J].Chinese Journal of Aeronautics,2023.

[12] ROUX A,CHANGEY S,WEBER J,et al.LSTM-based projectile trajectory estimation in a GNSS-Denied environment[J].Sensors,2023,23(6):3025.

[13] WERNERT P,THEODOULIS S,MOREL Y.Flight dynamics properties of 155 mm spin-stabilized projectiles analyzed in different body frames[C]//AIAA Atmospheric Flight Mechanics Conference.2010:7640.

[14] 佟妮宸,吴兴富,刘启明.火炮弹丸落点散布的区间多目标优化设计[J].兵器装备工程学报,2022,43(11):202-213.TONG Nichen, WU Xingfu, LIU Qiming.Interval multi-objective optimization design for dispersion of projectile landing points[J].Journal of Ordnance Equipment Engineering,2022,43(11):202-213.

[15] 何浪.基于Zynq的弹载雷达信号处理SoC系统设计与开发[D].西安:西安电子科技大学,2022.HE Lang.Design and development of SoC system for missile-borne radar signal processing based on Zynq[D].Xi’an:Xidian University,2022.

[16] CHUNG J,GULCEHRE C,CHO K H,et al.Empirical evaluation of gated recurrent neural networks on sequence modeling[J].arXiv preprint arXiv:1412.3555,2014.

[17] PARK J,HWANG E.A two-stage multistep-ahead electricity load forecasting scheme based on LightGBM and attention-BiLSTM[J].Sensors,2021,21(22):7697.

[18] WANG C,MA L,LI R,et al.Exploring trajectory prediction through machine learning methods[J].IEEE Access,2019,7:101441-101452.

[19] SEHOVAC L,GROLINGER K.Deep learning for load forecasting:Sequence to sequence recurrent neural networks with attention[J].IEEE Access,2020,8:36411-36426.

[20] KUZNETSOV V,MARIET Z.Foundations of sequence-to-sequence modeling for time series[J].arXiv preprint arXiv:1805.03714,2018.

[21] OSTROKI D,SLOVENEC I,et al.Anomaly correction in time series data for improved forecasting[C]//2021 16th International Conference on Telecommunications (ConTEL).IEEE,2021:85-88.

[22] TEIMOURZADEH H,MORADZADEH A,SHOARAN M,et al.High impedance single-phase faults diagnosis in transmission lines via deep reinforcement learning of transfer functions[J].IEEE Access,2021,9:15796-15809.

[23] KARUNASINGHA D S K.Root mean square error or mean absolute error? Use their ratio as well[J].Information Sciences,2022,585:609-629.

[24] RAO A,LIU Y,MA F.Study of NOx emission for hydrogen enriched compressed natural along with exhaust gas recirculation in spark ignition engine by Zeldovich’mechanism,support vector machine and regression correlation[J].Fuel,2022,318:123577.

Bidirectional GRU trajectory prediction for large-caliber artillery based on bahdanau attention mechanism

PENG Chenyang, CHEN Longmiao, ZHANG Mingyang

(School of Mechanical Engineering, Nanjing University of Science and Technology, Nanjing 210094, China)

AbstractIn response to the trajectory prediction problem of large-caliber artillery projectiles, a sequence-to-sequence trajectory prediction model (S2S ATT-BiGRU) based on the Bahdanau attention mechanism and bidirectional gated recurrent unit network is proposed. A large number of projectile trajectory data samples are obtained through the simulation of the 6-degree-of-freedom projectile motion model under different conditions, and the simulated dataset is constructed using the sliding window method and difference method. The proposed trajectory prediction model is compared with GRU model through simulation experiments on the simulated dataset. The research results show that the S2S ATT-BiGRU model, when predicting the future time of 5 s based on an input time of 0.5 s, has an MSE of 13.89 m2, an MAE of 1.84 m, and an MAPE of 0.29%, which is significantly more accurate than GRU model. In most cases, the S2S ATT-BiGRU model’s predictions are superior to GRU model. These findings suggest that the S2S ATT-BiGRU model has a stronger ability to store input trajectory sequence information and adaptively focus on important input trajectory information, providing a favorable reference for projectile trajectory prediction research.

Key wordstrajectory prediction; ballistic model; S2S ATT-BiGRU model; deep learning

收稿日期:2023-07-28;修回日期:2023-08-12;录用日期:2023-10-12

基金项目:国家自然科学基金项目(U2141246)

作者简介:彭晨洋(1997—),男,博士研究生,E-mail:pcy1997520@163.com。

通信作者:陈龙淼(1979—),男,博士,教授,博士生导师,E-mail:13913870745@139.com。

doi:10.11809/bqzbgcxb2024.07.008

本文引用格式:彭晨洋,陈龙淼,张鸣洋.基于Bahdanau注意力机制的大口径火炮双向GRU轨迹预测[J].兵器装备工程学报,2024,45(7):56-64.

Citation format:PENG Chenyang, CHEN Longmiao, ZHANG Mingyang.Bidirectional GRU trajectory prediction for large-caliber artillery based on bahdanau attention mechanism[J].Journal of Ordnance Equipment Engineering,2024,45(7):56-64.

中图分类号:TJ012.3

文献标识码:A

文章编号:2096-2304(2024)07-0056-09

科学编辑 刘智平 博士(西安工业大学 副教授)

责任编辑 胡君德