随着现代军事电子技术的快速发展,现代战争对信息化探测技术的需求也更加迫切[1]。雷达空间物体的智能识别一直是国内外学者的一个热点研究领域[2]。随着深度学习技术的迅猛发展,研究人员们不断尝试使用K近邻、支持向量机(support vector machine,SVM)和决策树分类器[3]等传统算法对雷达数据进行处理和识别。近年来,随着神经网络的蓬勃发展,深度学习在雷达空间物体智能识别领域正日益彰显其重要性[4]。
识别进入主权空域的黑色飞行空中物体的唯一方法是使用从雷达系统中提取的雷达截面特征[5]。为了更精确地分析这些截面特征,研究人员采用了被誉为“数学显微镜”[7]的小波变换方法,它可以在多个分辨率层面上深入分析局部特征[8]。为了更全面地理解雷达截面数据,使用傅里叶逆变换将数据从频域转换到时域[10]来重构原始的时域信号,为分析人员提供更原始和直观的数据。
卷积神经网络(convolutional neural networks,CNN)[11]在雷达RCS目标识别方面也有重要影响。虽然文献[12]中的方法在4类目标实验中,平均识别率达到了96.45%,但它仍然受到目标种类较少的限制。文献[13]所提到的长短时记忆网络(long short-term memory,LSTM)[14]方法,LSTM模型的识别准确率已经达到了94.5%,但这一准确率仍有待提高。尽管提出了许多针对空间目标RCS特征参数提取的算法,迄今为止,尚未形成完备的理论体系,并且这些算法在实际工程中的应用仍存在一定的挑战[15]。
本研究在现有研究的基础上,为提高识别的准确率与鲁棒性,将小波变换、傅里叶逆变换和对数处理结合作为预处理方法,从而产生雷达一维距离像,来更清晰地区分出目标物体与其他噪声或干扰信号之间的差异。为实现更高水平的识别精度,提出一个基于CNN-LSTM的混合神经网络,并对此方法进行消融实验、对比实验,以表明此方法的有效性。
本研究首先对2种不同极化宽带RCS数据Eh和Ev在三维空间的分布进行可视化分析,如图1所示。样本特征在展示区域内呈现出均匀的分布特性,这表明原始数据中的显著特征并不明显,需要采用特征工程技术以更好地适应机器学习模型的输入要求。
图1 变换前后示意图
Fig.1 Schematic diagram before and after transformation
为解决此问题,本研究对Eh与Ev采用图1所示的结合小波变换和傅里叶逆变换的方法,得到2种不同极化数据的一维距离像Converted_Eh和Converted_Ev。一维距离像可以展示目标在不同的时间或空间尺度上表现出的特性和细节。利用小波变换的局部多尺度特性与傅里叶逆变换的全局频域分析,我们能够精确地识别并呈现出信号在空间上的集中趋势以及在特定频率范围内的显著峰值和缺口。通过这种分析方法将数据的频域信息逆变换至时域,得到详尽的时域信号表征,从而为处理复杂、多周期性信号提供了一种高效的方法,为机器学习算法的性能优化提供了重要的理论依据。
进一步,对Converted_Eh和Converted_Ev通过图2所示的对数变换,对信号幅度进行动态范围压缩,从而形成了更为精确且清晰的数据。对数变换处理不仅增强了数据中的显著特征,而且使数据的分布更为集中和稳定,这种优化方法显著提高了其作为深度神经网络输入的适应性和稳定性,进而增强学习模型的整体性能。
图2 变换前后振幅分布
Fig.2 Amplitude distribution chart before and after transformation
在RCS目标识别中,Daubechies 4点小波作为一种低阶小波函数,能捕捉目标的重要信息并将较高的信号能量集中在低频近似系数中,分离信号和噪声,在特定的尺度和频率下进行去噪,有效保留目标特征并减少噪声影响。
在使用小波函数时,首先要进行小波分解。小波分解将信号X(t)分解为近似系数a和细节系数d。
使用Daubechies 4点小波进行1级小波分解的过程可表示为
(1)
(2)
其中,h[m]和g[m]分别是Daubechies 4点小波的低通滤波器和高通滤波器的系数。
之后,再根据最高级别的细节系数d计算阈值T,对细节系数进行阈值处理,可进行软阈值处理和硬阈值处理。
软阈值处理:
d′[k]= sign (d[k])·max(|d[k]|-T,0)
(3)
硬阈值处理:
(4)
式(4)中: d′[k]是处理后的细节系数; d[k]是原始细节系数; T是阈值。
最后,使用处理后的近似系数a和处理后的细节系数d′进行小波重构,得到去噪后的信号x*(t)。小波重构的公式如下:
(5)
式(5)中: h[k]和g[k]是Daubechies 4点小波的低通滤波器和高通滤波器的系数。
傅里叶逆变换是一种信号转换的数学工具,可以将信号表示为一系列复数的频谱分量。对于一个信号x*(t),其傅里叶逆变换可以用式(6)来表示。
(6)
式(6)中: f(x*(t))表示变换后的时域信号;x*(t)是经过小波变换处理后的频域信号;j是虚数单位;t是时间变量;ω是频率变量。通过对信号的积分运算,将一个信号从其频域表示恢复到其时域表示。
对数处理是信号处理中常用的一种非线性变换方法。经过小波变换和傅里叶逆变换后的时域信号Converted_Eh和Converted_Ev取绝对值,再将两者相加后进行对数处理。在信号处理领域,采集到的原始信号往往受到多种噪声源的影响,包括硬件设备内部的随机电子干扰、外部环境因素以及数据传输过程中的误差。这些随机干扰信号可能会掩盖或扰乱待分析信号中的有用信息。为解决这一问题,本研究使用对数处理方法使得信号中幅度较小的成分也能更容易观察,也可以降低噪音影响,使信号更突出。对数处理公式如下:
hrrp=log(1+|Converted_Eh|+|Converted_Ev|)
(7)
式(7)中:log表示自然对数运算;hrrp是对数据处理的结果。
在处理2种不同极化的宽带RCS数据的特征提取和序列分析问题时,本研究提出了一个结合CNN和LSTM的混合网络模型,如图3所示。该模型首先对预处理后的数据进行深入特征提取。CNN通过其深层结构捕捉一维距离图像中的复杂散射特征。在捕捉这些特征后,模型使用ReLU激活函数来强化这些特征的非线性表征。最后,池化层来进一步筛选和压缩这些特征,这种方法既保留了核心信息,又减少了冗余。接着,LSTM层接受这些压缩后的特征来系统地分析其序列关系,捕获RCS数据的序列连续性和动态模式,从而揭示数据中的依赖和内在动态。此混合网络模型能够深入理解2种不同极化宽带数据的散射特性,有效地捕获数据的局部特征和全局的序列动态,为高精度的特征提取和序列分析提供了一个有力的工具。
图3 基于CNN-LSTM模型的预测流程Fig.3 Prediction flow chart based on CNN-LSTM model
在决策解码阶段,全连接层整合并转换这些处理过的特征,确保其与预测目标相一致。最后结合Softmax函数来最小化预测误差并输出最优化的结果,从而提供一个更为全面和精确的RCS分析,为雷达系统提供更为准确的目标信息。
在特征提取部分,本研究使用多层卷积神经网络对雷达RCS的特征进行提取。卷积神经网络在深度学习技术中已成为众多学科领域的研究热点之一[16]。
一维卷积神经网络主要应用于处理序列数据,如时间序列分析、自然语言处理中的句子等。其网络结构如图4所示。特征提取主要由卷积层、ReLU函数和池化层组成。卷积层将经过数据预处理方法后的数据进行卷积运算,得到一个或多个特征映射,以提取输入数据中的局部特征和模式,进而捕捉到数据的重要信息;ReLU激活函数为神经网络添加非线性属性,使得网络能够学习从数据中提取更复杂的、非线性的特征;池化层可以通过降维和减少计算量,提取主要特征,增强模型的平移不变性。
图4 卷积神经网络结构
Fig.4 Convolutional neural network structure
本研究采用LSTM模型,对雷达序列数据进行分析。LSTM被广泛应用于序列数据处理任务中。与传统的RNN相比,LSTM更擅长抓取序列中的长时间信息[17]。LSTM引入了一个如图5所示的由输入门、遗忘门和输出门组成记忆单元,用来保存并传递信息。计算过程如式(8)—式(13):
ft=(Wf·[ht-1,xt]+bf)
(8)
it=σ(Wi·[ht-1,xt]+bi)
(9)
(10)
(11)
Ot=σ(Wo·[ht-1,xt]+bo)
(12)
ht=ot·tanh(Ct)
(13)
图5 长短时记忆网络结构
Fig.5 Long short-term memory network structure
其中,xt为输入特征,ht-1表示上一个时间步的隐藏状态,ft,it与ot分别表示遗忘门、输入门、输出门的输出。分别代表t-1时刻细胞状态、经过双曲正切激活函数tanh处理后的临时状态与时刻的新细胞状态。Wf、Wi、Wc、Wo用来对遗忘门、输入门、细胞状态、输出门的权重矩阵进行表示。为了表示LSTM中的遗忘门、输入门、细胞状态和输出门的偏置项,使用bf、bi、bc、bo分别作为他们的偏执标识。σ为sigmoid激活函数。
在处理雷达RCS的2种不同极化宽带数据的神经网络结构中,决策编码显得尤为关键。利用全连接层,可以将网络的高维输出转化为一个更为紧凑的形式。接着,通过Softmax层,这些输出被归一化为概率分布,为后续的决策提供了明确的编码。
2.3.1 全连接层
全连接层将前面层中的复杂高维特征信息综合并进行有针对性的权重分配,使得数据在高维特征空间到目标决策空间的映射过程中保持信息的完整性和连贯性。具体数学表达式如下:
Output=σ(W×Input+b)
(14)
式(14)中:Output表示全连接层的输出;W表示权重矩阵;Input表示输入特征;b表示偏置项;σ表示Sigmoid等激活函数。
2.3.2 Softmax函数
Softmax函数将网络的原始输出映射到概率分布上。其数学形式具有将大数值放大、小数值压缩的特性,确保了模型对不同类别的区分度明显。给定输入特征z之后,输出层的计算公式如下:
(15)
式(15)中:Outputi表示第i个类别的预测概率;zi表示对应类别的得分或输出;C表示总的类别数量。
为验证方法的有效性,本实验使用第十八届“挑战杯”比赛中提供的空间物体宽带RCS序列数据集,其包含10类不同目标,总计5 000个数据块,每个数据块包含Eh和Ev两种不同极化宽带RCS数据。宽带RCS数据频段为8~10 GHz,频段采样间隔为0.005 GHz,总计401个采样频点,每个采样频点有512个特征值。
将数据集采用本研究提出的数据预处理方法处理之后,可以得到雷达与目标的时域响应数据,该数据反映了在连续时间序列中,反射强度表现出的变化特征。通过利用CNN对这些雷达响应进行特征提取后,其输出进一步输入至LSTM来有效捕捉各时间序列的依赖关系。
将数据块按照不同比例划分训练集和测试集。之后,本研究对多种数据预处理方法进行消融实验验证。最后,分别建立CNN、SVM、多层感知机(multilayer perceptron,MLP)与CNN-LSTM模型进行多种效果对比分析,采用准确率和混淆矩阵这两个常用的评价指标来评估模型的性能。
本实验的硬件平台为12th Gen Intel(R) Core(TM) i5-12500H@2.50 GHz的处理器,并使用NVIDIAGeForce RTX 3060显卡加速训练。软件环境使用的Python版本号为3.9,CUDA版本号为12.1,Pytorch版本号为1.13.0。
在进行实验验证时,参数选择成为决定模型性能的关键因素。本研究首先依据机器学习和统计领域的常见实验设计原则,采用8∶2的比例对训练集和测试集进行划分以验证参数调整的效果。
首先,本研究进行双层卷积的卷积核数量进行配置。根据表1中不同卷积核配置的平均识别率可以发现,当第一层卷积的卷积核设置为64,第二层设置为128时,模型表现最佳,平均识别准确率达到89.20%。这样的配置促使网络更精细地识别数据中的特征。随后,本研究探讨了不同卷积步长对模型性能的影响。表2中采用步长为1时的卷积时,模型平均识别准确率能够达到85.60%,因为它提供了一个良好的平衡,既保证了特征的捕捉,又减少了计算负担。
表1 卷积核设置
Table 1 Convolution kernel settings
Conv1-KernelsConv2-Kernels平均准确率/%323273.80326480.80646478.006412889.20
表2 步长参数设置
Table 2 Step parameter setting
Stride平均准确率/%185.60279.10378.10
之后,本研究对LSTM部分参数配置进行优化。从表3中可以得到,当隐藏层节点个数为128且LSTM堆叠层数为1时,模型能够达到最佳性能,有效捕捉序列数据中的长期依赖关系而避免过拟合。
表3 LSTM参数设置
Table 3 LSTM parameter settings
隐藏层节点个数LSTM堆叠层数平均准确率/%32192.3064195.50128197.20128296.50
在优化策略方面,本研究采用交叉熵损失函数与Adam优化器进行参数更新。Adam作为一个融合梯度下降动量项与自适应学习率调整的先进算法,为训练流程带来了更高的稳定性和效率。通过其独特的数学机制确保了在大规模和复杂数据集上都能实现快速而稳定的收敛。
为避免模型陷入局部最优解,本研究采用学习率衰减策略,设定模型在每10次迭代之后,学习率将乘以衰减系数0.6,以更细粒度控制训练进程,从而保证模型训练的稳定性和可靠性。
通过前述系列实验,我们最终确定了网络模型的最优参数配置,具体如表4所示。该架构设计确保模型能够更加高效地捕获和整合有价值的信息,实现特征的深层融合,提升网络的表达能力,进一步优化了模型的泛化性能和运算效率。
表4 CNN-LSTM模型参数设置
Table 4 CNN-LSTM model parameter settings
参数数值参数数值学习率0.001迭代次数20batchsize512卷积核1个数64卷积核2个数128卷积步长2池化层尺寸2LSTM隐藏层128LSTM层数1优化器Adam学习率衰减步长10衰减系数0.6
3.2.1 样本比例对识别准确性的影响
为全面探讨训练样本比例对模型性能的影响,本研究设计了一系列实验来系统地测试不同训练样本比例的效果。具体而言,本研究分别选择了数据集的40%、50%、60%、70%和80%作为训练样本,其余数据则被用于测试模型的性能,以此来量化训练样本比例对模型的影响。通过逐步增加训练样本的比例,可以清晰地识别出哪些配置可以实现更优的性能。
从图6可以看出,随着训练样本数量的增加,模型的识别率逐步增强且趋于稳定。这表明更大的训练集可以更好地训练模型,使其能够更准确地识别测试集中的数据。
图6 不同epoch下的平均识别准确率
Fig.6 Average recognition accuracy under different epochs
从图6也可以发现,在训练集占比达到60%后,继续增加训练数据不再显著提升模型性能,标志着模型已进入“边际收益递减”的阶段,此时每增加一单位的训练数据所带来的性能提升将是有限的。
3.2.2 数据预处理策略的消融实验
为验证本研究提出的数据预处理方法对实验结果的影响,实验继续沿用8:2的训练集与测试集划分比例,在表4所示的CNN-LSTM模型的基础上进行了对数据预处理方法的效果进行消融实验。实验主要探讨了不对数据进行任何预处理、单独采用傅里叶逆变换(inverse fourier transform,IFT)、采用小波变换(wavelet transform,WT)+IFT与使用WT+IFT+log方法这4种情境下模型的识别准确率的差异。
表5清晰展示了各种预处理策略对模型准确率的影响,从表5中可明显看到,在不进行任何预处理时,模型的平均识别准确率相对较低,仅为84.50%,使用WT+IFT方法时,模型的识别率达到95.60%。而当采用WT+IFT+log方法进行预处理后,模型的平均识别准确率显著提高到97.50%。图7分别揭示了使用表5中的4种预处理方法后所得到的混淆矩阵。通过采用WT+IFT+log方法策略,相较于仅使用WT+IFT策略而言,模型的识别准确性和稳定性得到了显著增强。在如“1”,“5”,“7”,“10”等容易混淆的目标中,使用WT+IFT+log方法使模型具有更高的目标识别准确率和更低的误分类率,从而验证了该优化方法显著提高模型的适应性和稳定性,体现出这种预处理方法的有效性。
图7 不同预处理方法的混淆矩阵
Fig.7 Confusion matrix of different preprocessing methods
表5 不同预处理方法对准确率的影响
Table 5 The impact of different preprocessing methods on accuracy
预处理方法平均准确率/%无84.50IFT93.00WT+IFT95.60WT+IFT+log方法97.50
3.2.3 对比实验
在保持数据预处理策略一致的基础上,本研究经历多轮优化后选定了以下模型进行比较:
1) SVM分类器:采用RBF核函数、正则化参数C=1.0。
2) MLP:设计了一个包含两个隐藏层的结构,每个隐藏层包含200个神经元并配备ReLU激活函数。
3) CNN:依据表1和表2进行配置,具有两层卷积,其中卷积核的数量分别为64和128,步长均设置为1。
4) CNN-LSTM:采用表4所示的模型参数设置。
根据表6中的结果与图8中的混淆矩阵可以清晰地看到不同模型在目标识别任务中的效果差异。CNN模型的效果最差,识别率仅为89.20%。利用MLP模型所得到的平均识别率为92.40%,这个结果未能超越本实验采用的模型所显示出的性能。使用传统的SVM模型来进行训练预测时,除准确率不理想,耗费时间也远大于机器学习模型,不满足实际需求。而本研究提出的CNN-LSTM模型在4种模型之下显示出极高的性能,识别率高达97.50%。
表6 不同模型识别的平均准确率
Table 6 Average accuracy of recognition by different models
模型平均准确率/%CNN89.20SVM90.70MLP92.40CNN-LSTM97.50
图8 不同模型的混淆矩阵
Fig.8 Confusion matrices for different models
这种显著的差异表明在使用数据预处理方法并使用CNN-LSTM方法后,模型能够捕捉到数据中的深层特征和复杂模式,从而极大提高了识别的准确性。这不仅证明了深度学习模型在处理复杂数据问题上的强大能力,也验证了CNN与LSTM结合的方法在提取序列和空间特征方面的有效性。
1) 通过结合小波变换、傅里叶逆变换与log函数的预处理方法,本研究成功提取了雷达RCS数据更为丰富的特征信息的一维距离像,显著优化了雷达目标识别的准确率。
2) 设计的基于CNN-LSTM的模型,不仅捕捉到一维距离图像中的复杂散射特征,还实现了对雷达RCS数据特征的深度学习,提供了一个新的高效工具用于雷达数据分析。
3) 本研究提出的方法表现出极高的性能,数据的平均识别率达到了97.50%,成功在一定程度上解决了原始数据集特征提取困难的问题,提高了雷达目标识别的可靠性和效率。
[1] 卢中原,王中训,但波.基于雷达高分辨距离像序列识别的研究综述[J].兵工自动化,2022,41(9):65-71.LU Zhongyuan,WANG Zhongxun,DAN Bo.A review of research on high-resolution range image sequence recognition based on radar[J].Ordnance Industry Automation,2022,41(9):65-71.
[2] 乔良,王成龙,龚苹,等.识别定高起爆战斗部对舰船目标毁伤评估研究[J].兵器装备工程学报,2022,43(3):30-34.QIAO Liang, WANG Chenglong, GONG Ping, et al.Study on the damage assessment of ship target by identifying the fixed height initiating fragmentation warhead[J].Journal of Ordnance Equipment Engineering,2022,43(3):30-34.
[3] 李雄.基于窄带RCS数据的空间目标识别[D].成都:电子科技大学,2020.LI Xiong.Space Target Recognition Based on Narrowband RCS Data[D].Chengdu:University of Electronic Science and Technology of China,2020.
[4] WAN J,CHEN B,YUAN Y,et al.Radar HRRP recognition using attentional CNN with multi-resolution spectrograms[C]//2019 International Radar Conference (RADAR),2019:1-4.
[5] ZHANG Z,CHEN X,TIAN Z.A hybrid neural network framework and application to radar automatic target recognition[C]//2018 IEEE Global Conference on Signal and Information Processing (GlobalSIP),2018:246-250.
[6] SUMARI A D W,ASMARA R A,RISMAN H,et al.Black flight identification using radar cross section (RCS),speed,and altitude from RADAR data using supervised machine learning[C]//2022 International Conference on Electrical and Information Technology (IEIT),2022:377-382.
[7] 姜文超,刘海波,杨宇杰,等.一种融合小波变换与卷积神经网络的高相似度图像识别与分类算法[J].计算机工程与科学,2018,40(9):1646-1652.JIANG Wenchao,LIU Haibo,YANG Yujie,et al.A high similarity image recognition and classification algorithm combining wavelet transform and convolutional neural network[J].Computer Engineering and Science,2018,40(9):1646-1652.
[8] LI M.Electronic radar signal recognition based on wavelet transform and convolutional neural network[C]//2022 2nd Asia-Pacific Conference on Communications Technology and Computer Science (ACCTCS),2022:470-474.
[9] TANG Z,BAO Q,CHEN Z,et al.A new target detection method for noncooperative bistatic radar based on fractional Fourier transform and wavelet transform[C]//2018 2nd IEEE Advanced Information,Management,Communicates,Electronic and Automation Control Conference (IMCEC),2018:834-838.
[10] MEYER F J C,DAVIDSON D B.Time domain scattering from arbitrary 2D scatterers obtained from frequency domain data generated numerically[C]//Proceedings of IEEE Antennas and Propagation Society International Symposium.1993:1692-1695.
[11] GUO C,WANG H,JIAN T,et al.Radar target recognition based on feature Pyramid fusion lightweight CNN[J].IEEE Access,2019,7:51140-51149.
[12] 何松华,张润民,欧建平,等.基于卷积神经网络的高分辨率雷达目标识别[J].湖南大学学报(自然科学版),2019,46(8):141-148.HE Songhua,ZHANG Runmin,OU Jianping et al.High-resolution radar target recognition based on convolutional neural network[J].Journal of Hunan University (Natural Science Edition),2019,46(8):141-148.
[13] FAN Hanyang,FAN Hongming,GAO Ruiyuan.Research on air target maneuver recognition based on LSTM network[C].2020 International Workshop on Electronic Communication and Artificial Intelligence (IWECAI),2020:6-10.
[14] SUN L,LIU J,LIU Y,et al.HRRP target recognition based on soft-boundary deep SVDD with LSTM[C]//2021 International Conference on Control,Automation and Information Sciences (ICCAIS),2021:1047-1052.
[15] 李鑫.基于RCS序列的雷达目标特征辨识方法研究[D].北京:北京交通大学,2019.LI Xin.Research on radar target feature recognition method based on RCS sequence[D].Beijing:Beijing Jiaotong University,2019.
[16] 张松兰.基于卷积神经网络的图像识别综述[J].西安航空学院学报,2023,41(1):74-81.ZHANG Songlan.A review of image recognition based on convolutional neural network[J].Journal of Xi’an Aeronautical University,2023,41(1):74-81.
[17] JITHESH V,SAGAYARAJ M J,SRINIVASA K G.LSTM recurrent neural networks for high resolution range profile based radar target classification[C]//2017 3rd International Conference on Computational Intelligence &Communication Technology (CICT),2017:1-6.