基于RBF神经网络与SLAM的全捷联导引头定位研究

王嘉楠,彭晓乐,王之昊

(西南技术物理研究所, 成都 610041)

摘要:针对全捷联导引头探测器和IMU传递函数的需要进行相位匹配的问题,利用在线学习的RBF神经网络进行相位匹配算法设计,利用Z变换进行离散化处理;针对全捷联单模和多模导引头的相位匹配算法进行了设计与分析,并通过Matlab/Simulink联合仿真实验验证了算法的效果。同时,结合SLAM系统进行同时定位矫正,提升导弹的定位精度与全捷联导引头的导引准确度。

关键词:全捷联导引头;相位匹配;RBF神经网络;在线学习;SLAM系统

0 引言

伴随现代战争智能化、信息化的发展,为了实现远距离、高精准的打击作战任务,精确制导武器的研究被各国军事专家广泛关注,它在现代战争中的应用也极为广泛。为了实现精确制导,导引头的地位自然不言而喻。

虽然传统的框架式导引头可以有更大的视场,且拥有伺服系统来实现导引头光轴的稳定,但存在体积大、结构复杂等不足,这对精确制导武器进行作战任务而言,是极为不利的因素。采用全捷联导引头是一种很好的解决方法,该类导引头采用数字平台,使得制导系统所需的弹体视线角速率信息通过导引头上的嵌入式芯片计算便可得到,省去了传统导引头的两轴/三轴框架和伺服电机等硬件装置,同时,其体积和质量也小了许多,还便于维护、成本也更加低廉。

但是,全捷联导引头也有存在不足。其探测器与弹体直接固联,导致其仅能直接测量弹体视线角信号[1-2],无法直接获取弹体姿态信息。为了获得弹体在俯仰、横滚和偏航方向上的姿态角信息,工程应用当中,常常选择在全捷联导引头内部加入惯性测量单元(IMU)来测量。

考虑到MEMS陀螺具有低成本、低功耗、小型化等优点,因此被广泛地应用于IMU当中[3-7];将其应用于全捷联导引头中,可以准确获得实时的弹体姿态角信息。

为了获得比例导引律(PNG)所需的惯性视线角速率信息,需要利用全捷联导引头探测器测得的信号和IMU测得的信号进行姿态解耦[8-10]。然而,由于IMU和全捷联导引头的频率相差较大[11],且延时不同,会产生寄生回路。在工程应用当中,需要设计相位匹配算法[12],使得导引头探测器和IMU的传递函数尽量相等。

在该模块的研究当中,科研工作者将导引头探测器和IMU的传递函数假设为一阶且恒定不变。在这种情况下,可以在其中一条回路当中加入校正环节使得导引头和陀螺的传递函数相同,从而达到匹配的效果。但是,在工程应用当中,由于传递函数复杂且难测,仅仅将其视为一阶较为理想。此外,由于陀螺和探测器均存在噪声,其系统的传递函数都会发生变化,陀螺还有零漂的存在,传递函数的变化则更为明显,使用该匹配滤波算法,则会造成很大的误差。为了证实这一观点,我们假设全捷联导引头的传递函数如式(1)所示,MEMS陀螺的传递函数如式(2)所示,采用匹配滤波器的形式如式(3)所示。在陀螺通路加入校正环节,使其传递函数与导引头探测器传递函数匹配,则有Gg1(sGm(s)=Gs(s)。我们可以取陀螺的频率fg1=150 Hz,则取导引头的频率 fs=5 Hz,则我们尽量将传递函数的变化理想化,将陀螺的传函改为式(4)。将经过相位匹配后的导引头探测器传递函数与真实的导引头探测器传递函数的幅值和相位如图1所示。

(1)

(2)

(3)

(4)

图1 相位匹配效果

Fig.1 Phase matching rendering

从图1中可以明显看出,在陀螺的传递函数发生了很微小的变化后,匹配所得幅值和相位均存在误差。在实际的工程系统当中,导引头和陀螺的传递函数往往都更加复杂,且变化也会更大。当传递函数变化更明显后,所匹配的传递函数与真实值会相差甚远。

如果采用固定的传递函数校正环节会带来更大的脱靶量,随着全捷联导引头未来朝着多模复合的方向发展,该类问题也会更加严重,基于此,本文才RBF神经网络相位匹配算法,以适应变化的传递函数以及多个传递函数的相位匹配。

1 原理分析

人工神经网络的基本处理单元是人工神经元,与生物原型对应,其主要结构是单元信号的输入、综合处理和输出,其输出信号强度反映该单元对相邻单元影响强弱。人工神经元通过一定的结构组织起来即构成人工神经网络,如本文将研究的RBF神经网络。

由于RBF神经网络还具有网络结构简单、泛化能力强、学习收敛速度快、逼近任意非线性函数能力较强等优点[13-15],因此在函数逼近的研究中应用极为广泛[13-19]

RBF神经网络结构如图2所示,具有3层结构的前馈神经网络。第1层为输入层,输入神经网络的信息经过该层处理后,送入隐含层,即第2层。该层神经元的个数根据需建模对象的复杂度而定。RBF即激活函数,一般为高斯核函数,发挥着限定输入影响范围的作用。第3层为输出层,该神经网络的权值调整即在隐含层与输出层之间完成[20]

图2 RBF神经网络结构

Fig.2 Structure diagram of RBF neural network

在图2中,x=[xi]T为网络的输入,h=[hj]T为隐含层的输出,w为神经网络权值,ym为神经网络的输出。

本次仿真实验,选用高斯核函数,其表达式为:

(5)

式(4)中, m代表隐含层节点的个数,该个数随着输入模型的改变而改变。

此外,本文设计在线学习的神经网络,即利用RBF神经网络实时采集数据,得到实际误差,并对误差进行在线拟合,以补偿导引头探测器传递函数的输出。在此过程中,需要实时修正该网络隐含层权值。因此,可以根据输入输出动态变化,通过构建实际输出和理想输出的误差,采用梯度下降法更新高斯核函数中心与隐含层到输出层的权重,已达到在线训练RBF神经网络的目的。由于导引头是一次性的消耗品,如果我们寻找大量的数据来训练神经网络,则会大大增加时间和试验成本。同时,由于弹载遥测的容量有限,要记录的弹上数据也很多,因此,很难通过遥测的数据来离线训练神经网络,这也是本文考虑使用在线学习的RBF神经网络的原因。

2 实验仿真模型

由于目前全捷联导引头的应用还是以单模为主,多模复合是未来的趋势。因此,本文通过Simulink搭建了单模和多模的仿真模型。此外,随着技术的发展,导引头的延时也越来越小,未来甚至可以忽略不计。但是目前,由于图像处理的实时性较低,导引头延时的问题依旧是在工程应用当中需要考虑的因素。因而,本课题在仿真当中,无论是单模还是多模复合,均用Simulink搭建了有无考虑延时的模型。

本课题中,在未考虑导引头延时的情况下,取导引头和陀螺的传递函数模型为

(6)

式(6)中,阻尼比ξ=0.707,取ωn=2πf。陀螺的频率为 fg=150 Hz。

在考虑导引头探测器传递函数存在延时的情况下,均考虑其延时为60 ms,则导引头探测器传递函数为

(7)

在Simulink中搭建好模型后,将匹配得到的结果通过To Workspace模块进行采集,输出到M文件中,先进行Z变换的离散化,再进行处理,使得仿真更加接近工程实际。

本次仿真实验,将采样时间设置为0.001 s,进行Matlab/Simulink联合仿真。

2.1 全捷联单模导引头

在没有考虑导引头通路的延时环节的模型如图3所示。匹配效果和误差如图4所示。

图3 不考虑延时环节的RBF神经网络相位匹配框图

Fig.3 The diagram for phase matching of RBF neural networks without considering delay components

图4 不考虑延时的匹配结果与误差

Fig.4 Matching effects and errors without considering delay

在单模导引头中,取导引头探测器的频率fs1=10 Hz,则ωn1=20π,代入式(6)即可得导引头探测器的传递函数。

将导引头探测器的延时环节加入后,将值代入式(7)即可得导引头探测器的传递函数,相位匹配模型如图5所示,拟合效果和误差如图6所示。

图5 考虑延时环节的相位匹配模型框图

Fig.5 The diagram for phase matching of RBF neural networks when considering delay components

图6 考虑延时的匹配结果与误差

Fig.6 Matching effects and errors when considering delay

2.2 全捷联多模复合导引头

由于全捷联导引头未来的发展趋势是实现双模/三模复合导引头,因此,本节分别针对2种导引头有无考虑延时环节的RBF神经网络相位匹配算法模型,进行了仿真实验。

图7是在未考虑延时环节的情况下,全捷联双模导引头的模型框图。

图7 不考虑延时环节的双模导引头相位匹配框图

Fig.7 The diagram for phase matching of dual-mode guidance head without considering delay

在全捷联双模导引头中,分别设导引头的频率为10、2 Hz,以此模拟全捷联红外和电视复合导引头。此时,fs1=10 Hz,则ωn1=20π; fs2=2 Hz,则ωn2=4π,拟合效果和误差如图8所示。

图8 不考虑延时的匹配结果与误差

Fig.8 Matching effects and errors without considering delay

在不考虑导引头探测器传递函数延时的情况下,将ωn1ωn2的值代入式(6)即可得导引头的传递函数。

图9是在考虑延时环节的情况下,全捷联双模导引头的模型框图,将ωn1ωn2的值代入式(7)即可得导引头的传递函数,拟合效果和误差如图10所示。

图9 考虑延时环节的双模导引头相位匹配框图

Fig.9 The diagram for phase matching of dual-mode composite seeker when considering delay

图10 考虑延时的匹配结果与误差

Fig.10 Matching effects and errors when considering delay

在全捷联三模导引头中,分别设导引头的频率为10、2、5 Hz,以此模拟全捷联红外、激光和雷达复合导引头。此时, fs1=10 Hz,则ωn1=20π; fs2=2 Hz,则ωn2=4π; fs3=5 Hz,则ωn3=10π。

图11是在未考虑延时环节的情况下,全捷联三模导引头的模型框图,将ωn1ωn2ωn3代入式(6)即可得导引头探测器的传递函数,拟合效果和误差如图12所示。

图11 不考虑延时环节的三模导引头相位匹配框图

Fig.11 The diagram for phase matching of dual-mode composite seeker without considering delay

图12 不考虑延时的匹配结果与误差

Fig.12 Matching effects and errors without considering delay

图13是在考虑延时环节的情况下,全捷联双模导引头的模型框图,将ωn1ωn2ωn3代入式(7)即可得导引头探测器的传递函数,拟合效果和误差如图14所示。

图13 考虑延时环节的三模导引头相位匹配框图

Fig.13 The diagram for phase matching of tri-mode composite seeker when considering delay

图14 考虑延时的匹配结果与误差

Fig.14 Matching effects and errors when considering delay

2.3 SLAM系统定位导引头

本节针对全捷联导引头采集的数据进行ICP算法匹配,进行算法改进和优化,提出随机一致性采样(random sample consensus,RANSAC)优化算法,对匹配之后的点对进行再次筛选。

定义齐次坐标下计算MS为:

(8)

(9)

我们计算误差来保留正确匹配和剔除错误匹配为改进的匹配如图15所示。

图15 RANSAC改进的匹配

Fig.15 Improved matching when using RANSAC

对ICP算法提出改进,在全局上描述两帧之间相机的运动:在使用RANSAC估计[7]的变换矩阵T进行变换之后,计算实际点集与估计点集误差,由其最小值计算出精确的相机运动参数。

我们定义该误差平均数e为:

(10)

每一次迭代中,使用变换矩阵Tn的估计值去新源数据集pn中的每一个点。

pn+1=TnPn

(11)

重新计算新的源数据集pn+1与目标数据集Q之间的误差en,当满足设定的阈值时,结束迭代,并将此时的Tn作为相机运动的最优解。最终把改进的SLAM的ICP算法应用到捷联导引头中用于终端制导和融合定位任务。导引头ICP改进流程算法如图16所示。

图16 导引头ICP改进流程算法

Fig.16 Improved process algorithm of ICP in Seeker

3 实验结果分析

表1和表2分别是在无延时和有延时情况下,利用RBF神经网络拟合误差大小的均值和均方根。表1和表2中第一列是不同传递函数拟合频率均取10 Hz的导引头传递函数。

表1 有延时的匹配效果

Table 1 Matching effects when considering delay

频率误差大小均值误差大小均方根fg1=150Hz0.01010.0024fs2=2Hz0.00241.9073×10-4fs3=5Hz0.00282.5115×10-4

表2 无延时的匹配效果

Table 2 Matching effects without considering delay

频率误差大小均值误差大小均方根fg1=150Hz0.01010.0024fs2=2Hz0.00241.9072×10-4fs3=5Hz0.00282.5114×10-4

从2.2节的仿真图和上面的表格中可以看出,利用RBF神经网络拟合不同的传递函数时,拟合效果较为相似。误差的均值均小于0.001 5,误差的均方根均小于0.002 5。因此,RBF神经网络可以针对变化的传递函数进行相位匹配。

在导引头探测器传递函数有无延时的情况下,误差也极为相似,在此可以体现,RBF神经网络逼近不同的非线性函数的能力较强,且逼近效果均较好。这也是该神经网络比传统的匹配算法最明显的优点。

融合SLAM系统ICP定位算法的全捷联导引头仿真实验,用TUM的数据集进行运行得到结果,并进行地面真实数据和实验结果进行位姿估计和误差分析,如图17和表3所示。

表3 加入ICP改进前后定位误差对比

Table 3 Comparison of positioning errors before and after ICP improvement

MEANRMSESSESTD改进前0.0600.0644.430.023改进后0.0210.0240.610.019

图17 误差分析

Fig.17 The chart of error analysising

通过运行TUM数据集,结合算法结果进行分析。加入该ICP算法的捷联导引头的定位轨迹误差结果,最大误差从0.134 m降至0.097 m,平均误差从0.076 m降至0.050 m,最小误差从0.018 m降至0.002 m。通过误差结果分析,加入ICP算法后的捷联导引头的导航定位效果误差降低,从而提升了武器的精确制导打击能力。

4 结论

全捷联导引头要想提高惯性视线角速率提取的精度,进行相位匹配必不可少。然而,该环节往往被众多的学者所忽视。本文利用RBF神经网络较强的拟合能力,以及适应被拟合的函数变化的能力也比较强,设计了相位匹配算法;同时也引入了SLAM系统下的ICP定位算法,并完成了对应的仿真实验验证。但是考虑到神经网络需要进行大量数据训练的问题,并且导引头是一次使用的消耗设备,本文设计了在线神经网络来克服这一问题;在导引头的工程应用中,嵌入式芯片仅能处理离散的信号,本文利用Z变换进行传递函数离散化处理,使其更适合于工程应用。最后,通过仿真实验证明了算法的可行性。

参考文献:

[1] TIAN J,XIONG N,ZHANG S,et al.Integratedguidance and control for missile with narrow field-of-view strapdown seeker[J].ISA transactions,2020,106:124-137.

[2] WANG Y,WANG J,HE S,et al.Optimal guidance with active observability enhancement for scale factor error estimation of strapdown seeker[J].IEEE Transactions on Aerospace and Electronic Systems,2021,57(6):4347-4362.

[3] ZHAO W,SUN X,RONG Y,et al.Optimization on the precision of the MEMS-redundant IMU based on adhesive joint assembly[J].Mathematical Problems in Engineering,2020(9):2020.

[4] MAHDI A E,AZOUZ A,ABDALLA A E,et al.A machine learning approach for an improved inertial navigation system solution[J].Sensors,2022,22(4):1687.

[5] WEI X,LI J,HAN D,et al.An in-flight alignment method for global positioning system-assisted low cost strapdown inertial navigation system in flight body with short-endurance and high-speed rotation[J].Remote Sensing,2023,15(3):711.

[6] ZHARKOV M,VEREMEENKO K,KUZNETSOV I,et al.Experimental results of attitude determination functional algorithms implementation in strapdown inertial navigation system[J].Sensors,2022,22(5):1849.

[7] CHEN H,TAHA T M,CHODAVARAPU V P.Towards improved inertial navigation by reducing errors using deep learning methodology[J].Applied Sciences,2022,12(7):3645.

[8] LI X,ZHAO B,ZHOU J,et al.Integrated guidance and control for missiles with strap-down seeker[C]//2017 36th Chinese Control Conference (CCC).IEEE,2017:6208-6212.

[9] WANG J,PENG X,WANG Z.Research on line of sight angular rate estimation of strapdown seeker[C]//Fifth International Conference on Mechatronics and Computer Technology Engineering (MCTE 2022).SPIE,2022,12500:576-583.

[10] NIE C,ZHANG K,WANG P,et al.A method for line of sight angle rate reconstruction based on strapdown seeker[C]//Proc. of the 2014 International Conference on Mechatronics,Electronic,Industrial and Control Engineering (MEIC-14).Atlantis Press,2014:658-662.

[11] 白瑞,夏群利,杜肖,鲁天宇.捷联导引头寄生回路分析及其品质测试研究[J].兵工学报,2017,38(3):490-500.BAI Rui,XIA Qunli,DU Xiao,et al.Test of parasitic loop quality of strapdown seeker[J].ACTA Armamentarii,2017,38(3):490-500.

[12] HONG J H,PARK S S,LEE C H,et al.Study on parasite effect with strapdown seeker in consideration of time delay[J].Journal of Guidance,Control,and Dynamics,2019,42(6):1383-1392.

[13] JIANG Q,ZHU L,SHU C,et al.An efficient multilayer RBF neural network and its application to regression problems[J].Neural Computing and Applications,2022,34(6):4133-4150.

[14] FENG H,SONG Q,MA S,et al.A new adaptive sliding mode controller based on the RBF neural network for an electro-hydraulic servo system[J].ISA transactions,2022.

[15] SHI X,CHENG Y,YIN C,et al.Design of adaptive backstepping dynamic surface control method with RBF neural network for uncertain nonlinear system[J].Neurocomputing,2019,330:490-503.

[16] SHI P,SUN W,YANG X.RBF neural network-based adaptive robust synchronization control of dual drive gantry stage with rotational coupling dynamics[J].IEEE Transactions on Automation Science and Engineering,2022(7):94-95.

[17] YUAN Xiaoliang,LIU Jun,XIE Shouyong.Design of the MVT RBF neural network robotic manipulator control system based on model block approximation[J].Transactions of the Institute of Measurement and Control,2022,4444(1212):2350-2357.

[18] LIU Q,LI D,GE S S,et al.Adaptive bias RBF neural network control for a robotic manipulator[J].Neurocomputing,2021,447:213-223.

[19] ZONG Q,WANG F,TIAN B,et al.Robust adaptive dynamic surface control design for a flexibleair-breathing hypersonic vehicle with input constraints and uncertainty[J].Nonlinear Dynamics,2014,78(1):289-315.

[20] 于蒙.基于数据驱动的间歇化工过程批次内和批次间复合优化控制策略研究[D].北京:军事科学院,2021.YU Meng.Research on compound optimization control strategy within batch and between batches of batch chemical process based on data-driven technique[D].Beijing:Academy of Military Sciences,2021.

Research on RBF neural network and SLAM system localization in the use of strapdown seeker

WANG Jianan, PENG Xiaole, WANG Zhihao

(Southwest Institute of Technical Physics, Chengdu 610041, China)

AbstractThis paper focuses on the problem of phase matching required for the detector of the strapdown seeker detector and IMU transfer function. An online learning RBF neural network is used to design the phase matching algorithm, and the Z transform is used for discretization processing;The phase matching algorithms for strapdown single mode and multimode seekers were designed and analyzed, and their effectiveness was verified through Matlab/Simulink joint simulation experiments.Besides, combined with the SLAM system for simultaneous positioning correction, the positioning accuracy of the missile and the guidance accuracy of the full strapdown seeker are improved.

Key wordsstrapdown seeker; phase matching; RBF neural network; online learning; SLAM system

收稿日期:2023-07-19;修回日期:2023-08-20;录用日期:2023-10-22

作者简介:王嘉楠(1997—),助理工程师,E-mail:1163923319@qq.com。

通信作者:彭晓乐(1964—),研究员。

doi:10.11809/bqzbgcxb2024.07.018

本文引用格式:王嘉楠,彭晓乐,王之昊.基于RBF神经网络与SLAM的全捷联导引头定位研究[J].兵器装备工程学报,2024,45(7):134-141.

Citation format:WANG Jianan, PENG Xiaole, WANG Zhihao.Research on RBF neural network and SLAM system localization in the use of strapdown seeker[J].Journal of Ordnance Equipment Engineering,2024,45(7):134-141.

中图分类号:TJ765.3

文献标识码:A

文章编号:2096-2304(2024)07-0134-08

科学编辑 李京华 博士(西北工业大学 教授)

责任编辑 唐定国