基于置信学习的低标注率辐射源个体识别算法

王艺卉1,2,闫文君1,凌 青1,段可欣1,3,于楷泽1,3

(1.海军航空大学, 山东 烟台 264001; 2.中国人民解放军31401部队, 山东 烟台 264001;3.中国人民解放军91423部队, 山东 烟台 264001)

摘要:针对仅有少量标签数据的样本弱标注情况下辐射源个体识别难的问题,提出了一种基于置信学习的伪标签校正的辐射源个体识别方法。首先通过动态调整类内置信度,实现生成伪标签地及时校正;其次,分析样本价值,对影响模型性能的少量关键样本进行人工标注;然后利用联合交叉熵与中心损失函数,并叠加动态变化的伪标签置信度损失,同时关注类间、类内差异,最大化利用数据特征信息,实现的类内聚合和类间分离,最终实现了网络深度合理、精度与速度良好平衡的识别效果。实验结果表明:所提算法在有标记样本占比为5%、10%、20%、50%、100%等多种条件下,均可实现辐射源个体有效识别,尤其在有标签数据低占比的情况下优势明显,识别准确率分别突破70%与80%,有效减轻了有限标记样本的不足问题。

关键词:辐射源个体识别;伪标签校正;样本价值分析;伪标签损失函数

0 引言

特定辐射源识别(specific emitter identification,SEI)是指从接收信号中提取细微差异用于关联单个辐射源的技术[1],现已广泛应用于辅助作战指挥和打击决策、交通管理、设备监测与维护等多个领域。在人工智能技术快速发展的背景下,基于深度学习(deep learning,DL)的特定辐射源识别算法日趋成熟,以多维度特征提取、学习能力突出、模型泛化性强等优势极大地提升了识别准确率与识别速度,但此类方法大都依赖于大型的有标签样本数据集,而不适用于样本标注成本高、类别捕捉不全面的现实通信场景[2]

针对弱标注仅有少量标注数据和大量未标注数据样本特性的限制,半监督学习(semi-supervised learning,SSL)应运而生,在图像分类、目标检测、文本分类等领域应用广泛。其中,适用于多分类任务的有自训练算法[3]、生成式模型、图论方法、多视角算法及半监督支持向量机等。Zhu[4]提出未标注样本可以通过利用无监督学习进行自我学习或利用已有标注样本的结构信息进行模型训练的半监督学习(semi-supervised learning,SSL),包括自动编码器、生成式模型等典型方法。自训练(self-training)算法引入了在线对比学习思想,在自训练过程中优化模型的嵌入向量以增强模型鲁棒性[5];生成式半监督学习(generative semi-supervised learning)算法基于BERT模型的预训练和半监督指导掩蔽,可以提高在中文新闻分类等任务上的性能[6];协同训练(co-training)算法引入了分布式学习和对抗学习的思想,解决了分布偏移和数据鲁棒性问题[7];约束传播(constraint propagation)算法则结合了时空注意力机制和反传梯度以精确预测,提高分类准确性和泛化性能[8]

其中面向辐射源个体识别经典算法层出不穷,Wang[9]提出了一种基于复数神经网络(complex-valued neural network,CVNN)和网络压缩的高效SEI方法,该方法以复数卷积网络为主干网络,构建基于稀疏正则化、量化掩码和近端梯度的稀疏结构选择算法,并利用知识蒸馏技术在保持良好识别精度的同时,实现模型压缩至原来的10%~30%。Li[10]提出了在有限的监督下实现生成器、分类器和鉴别器一致性的Triple-GAN,通过三方博弈生成更为高质量的样本。Wang[11]提出残差连接得到高低分辨率的图像差异(deeply-recursive convolutional network,DRCN),通过递归学习修正细节得到更加精确的估计,在ZF-MIMO系统中通过迁移学习实现了半监督自动调制分类。Lin[12]提出了更为简单的掩码图像框架SimMIM,使用原始像素回归的方法在ImageNet-1K数据集上取得了83.8% 的 top-1微调精度。

这些文献为解决实际问题和推动半监督学习研究提供了新的思路和实验基础,但以上算法在标注数据占比较低的情况下,特征提取网络不能够充分提取目标特征,分选效果不佳。

基于此,本文提出了基于伪标签动态校正的特定辐射源识别方法。首先通过潜在正确伪标签确定类内置信度,对错误标记的伪标签进行重训练校正,进而筛选高质量伪标签样本扩充数据集,缓解标注数据不足导致的特征信息多类别遗漏的问题;其次通过引入伪标签的联合损失函数设计,关注类内和类间差异,避免信息损失,最大化利用数据特征信息,最终实现有效缓解有限标记样本的不足。

1 ADS-B实测数据集制作

1.1 数据采集与预处理

在直接序列扩频(DSSS)调制下ADS-B信号时域模型为

s(t)=∑[d(k,n)⊗c(t-nTcp(t)]

(1)

式(1)中:ADS-B码元的持续时间为Tc;nTc为码元时间偏移量;c(t-nTc)表示随时间变化的扩频码;d(k,n)为发送的码元;p(t)脉冲正弦波,实现扩频信号到载波高频传输。

n为信号采样点个数,Ts=1/fs为信号采样间隔, fs为采样频率。经过采样后的ADS-B信号模型可以描述为

s(nsT)=∑[d(k,n)⊗c(nsT-nTcp(nsT)]

(2)

在航班密集程度不同的时间段及地点架设USRP210软件无线电设备采集系统,接收1 090 MHz ADS-B S模式响应信号,可在0.07~6 GHz范围内提供连续的频率覆盖。信号采集场景如图1所示。

图1 数据采集场景
Fig.1 Data acquisition scenario

采集得到的1 090 MHz S模式扩展电文(1 090ES【extended squitter】)是基于广播技术经过特定的编码方式在ADS-B航空器与接收器间单向传播。信号转换流程如图2所示。由图2可知,经过在航班密集程度不同的时间段和地点累积采集ADS-B射频信号后进行抗混叠滤波和步进增益放大以增强信号幅值,再将信号解调分离载波与基带信号,通过解码、转换与取模实现将ADS-B信号转换为基带幅值数据。图3展示了部分接收的ADS-B信号样本的波形。

图2 信号转换流程图
Fig.2 Signal conversion flow chart

图3 部分ADS-B信号波形图
Fig.3 Part of the ADS-B signal waveform

1.2 实测 ADS-B信号数据集

对于采集到的ADS-B信号,对其进行数据预处理后,构建的数据集参数如表1所示。

表1 ADS-B数据集详细参数
Table 1 Detailed parameters of the ADS-B dataset

项目属性参数发射端设备型号FMS调制方式BASK/BPSK发射频点/MHz1 090发射带宽/ MHz1发射功率/dBm49接收端设备型号USRP 210采样频点/MHz1接收带宽/ MHz2采样速率/ MHz2接收增益/dB80

2 伪标签的制作

伪标签是为了充分利用未标注数据中大量且有用的信息而在无监督及半监督学习中常用的一种标签生成的方法。为了保证标注的准确性,常采用分析生成伪标签类别比例和真实标签类别比例的分布相似程度、分析不同模型生成标签的一致程度、统计伪标签的熵值[13]与校准数据的误差程度等方法,判断伪标签的正确与否,上述方法存在样本数据覆盖率要求高、标注密度需求大、受人为因素干扰和人工成本高等弊端。为兼顾成本和效率,本文提出 基于置信学习[14]的类内置信度动态估计来判断伪标签可信度与重训练的伪标签校正方法来提升伪标签的准确性,为标注成本高、标注数据稀缺的现实场景应用提供了可能。

2.1 基于置信学习的伪标签生成机理

基于置信学习的伪标签置信度估计的机理主要是通过训练有限的标注数据集构建一个基本模型,并利用其对未标注数据进行预测,根据预测结果的置信度筛选出高置信度的样本与原有标注数据合并作为新的标注数据集迭代训练模型,逐步提高模型识别性能与泛化能力。具体来讲,置信学习可以估计预测样本属于每个类别的概率,通过筛选可以有效避免质量较差伪标签干扰而导致的错误学习;在预测过程中生成的伪标签受模型本身的局限性和数据分布的影响会存在一定的误差,本文在利用类内置信度动态估计伪标签可信度的同时,通过重训练的伪标签校正方法提升伪标签的准确性。

另外,生成伪标签的方法还有自训练方法、协同训练方法、生成式模型方法等方法,其中自训练方法极易引入错误标签,影响模型调优方向和泛化能力的提升;协同训练方法需要使用多个相互独立的模型,增加了模型复杂度与计算存储资源需求,特别地,若模型间存在共同误差极易导致协同训练效果不佳;生成式模型方法需要通过更为复杂的模型深入挖掘数据的隐含分布特征,训练成本较高。综上,结合辐射源个体识别准确性和实时性的具体任务需求,本文选用基于置信学习的伪标签生成方法。

2.2 伪标签生成与可信度判断

在半监督学习中伪标签的正确性直接影响模型的建立方向、学习精度和优化过程,为提高伪标签样本的质量,本文采用置信学习的方法,对伪标签进行可信度判断。首先使用监督学习算法对有标注数据集进行训练,然后使用预训练好的模型对未标记的数据进行预测生成伪标签。

步骤1 筛选错误伪标签样本。

1) 样本x输入模型M,计算第i个样本xi属于类别j(即的概率并记为其中样本索引i∈[1,m],类别索引j∈[1,n]。

2) 在模型预测结果中选择概率最大的类别为预测结果记为yp,此过程通过公式可以表示为

yp=argmaxyp(y|xi)

(3)

3) 运用置信学习估计预测生成的伪标签yp和潜在正确标签yc的分布情况如表2所示。

表2 模型预测分类情况
Table 2 Classification of model predictions

xi^y=j12… nypycx10.9000.020…0.0031-x20.9200.030…0.02011x30.9100…0.01011︙︙︙︙︙︙xm-10.0300…0.930nnxm0.0700.001…0.910n-

表3 样本价值分析
Table 3 Sample value analysis

类别特征属性意义策略正样本含所属类别的特征和属性模型评估的关键最大保留负样本与正样本相异的特征和属性避免类别混淆保留错误率最大的样本与其他类别相似度高或模型难以区分的特征改进模型重点关注最具不确定性样本有多个类别的相关特征与属性正影响、负影响及模型鲁棒性选择性抑制

步骤2 确定可信伪标签置信度。

为筛选出错误伪标签样本,可通过查验该类别标签的所有样本总体集中趋势的样本中心点情况来设置每个类别的类内置信度,其计算公式为

(4)

式(4)中:表示所有预测标签记为j的样本在模型预测结果为j的概率之和;表示预测结果记为j的所有样本个数总和。

具体而言,将预测结果按顺序排序后如表2所示,以模型M输出预测结果yp=1为例,未标记数据集中出预测结果为yp=1的样本有x1,x2,x3。按照式(4)计算可得yp=1的伪标签置信度为x1属于其他类别标签的概率也低于各自的类内置信度,则模型输出x1的标签判定为无潜在正确标签,视为噪声标签;x2,x3为可信度高的合格训练样本是潜在正确的样本记为yc,将与原标注样本一同作为训练集进行后续训练。

步骤3 噪声标签的处理。

伪标签中低于置信度的标签被称为噪声标签,其对模型的训练产生负面影响,如果盲目地去除训练样本可能会导致样本不均衡、关键特征丢失等问题,因此,需要根据实际情况进行校正或选择性过滤。

算法 伪标签生成与可信度判断。

输入:无标注样本xi(i∈[1,m])

输出:潜在正确标签yc

1: //生成伪标签yp

2: 初始化模型M参数

3: for i←1 to m do

6: //求类内置信度tj

7: for j←1 to n do

9: if yp==j then

12: //判断伪标签正确性

13: for i←1 to m do

15: yc=j

2.3 伪标签校正与模型优化

将高于伪标签置信度的样本视为真实样本,将其与原始标注样本一同作为训练集,重新送入模型M进行训练优化产生模型M′。将原始未标注样本集重新放入模型M′进行识别标注,并重复2.2节中步骤1、步骤2。在动态确定可信度传播算法中,伪标签的置信区间是跟随模型预测结果动态变化的。根据新生成各类别类内置信度对伪标签进行新一轮的可信度判断,筛选出合格的伪标签样本与原始标注样本一起作为训练集,重复此步骤至模型效果不再提升。

伪标签生成与校正的具体流程如图4所示。为防止错误标签样本的误差在迭代训练中传播和积累,随机性地对模型进行开始初始化。

图4 伪标签生成与校正流程图
Fig.4 Flow chart of pseudo-label generation and correction

2.4 样本价值分析

对于错误标记的伪标签而言,改动一个样本的标签比删除的不利影响更大。为充分挖掘样本的价值,对能确定属于正确类别的正样本、确定不正确的负样本、错误率最高的样本、最大概率最小的和最具不确定性的样本作为特殊样本进行价值分析,在进行样本价值评估后再进行人工标注。通过扩充无标签数据在不同类别的在特征空间的分布最大化,使模型的具有更好的泛化性能。

通常负样本的数量要远大于正样本的数量且正样本含有类别的特征和属性,因此需要对正样本最大程度地保留;错误率最大的样本具有与其他样本相近的特征而难以区分,最具不确定性的样本增大了各类别的类内差异,易与多个类别混淆,包括不同类别边界附近的边界样本、为异常值的噪声样本、信息不足的不常见样本,这些不确定性样本都阻碍了信号识别模型的性能提升。

基于以上对样本的价值分析,对确定度较高的正负样本采取保留策略;识别错误率最大的样本常常指类间特征相似度高而难以区分的,对该样本需要重点关注,从而实现模型性能的有效提升;不同类别都具有的相关特征与属性是造成混淆的重点原因,可以对此类特征采取选择性抑制策略。

经过2.2节中伪标签校正和模型优化后,原始数据中未标样本已最大程度上进行伪标签标注,现在以错误率最大的样本及最具不确定性样本少量存在为前提进行讨论。

首先在经由伪标签置信度迭代筛选后,在剩余标签中基于熵的不确定性筛选出最具不确定性的一个样本,进行人工辅助标记,而后筛选下一个最具不确定性的一个样本,如此往复进行。如图5所示,距离分类面最近的黄点A即为此环境下最具不确定性的样本,人工将其标注后,即可知近邻B的样本类别,之后最具不确定性的样本是C。

图5 辅助标记不确定性样本场景
Fig.5 Sample scenario of assisted labeling uncertainty

本文通过人工标注少量对模型性能影响较大的难分样本来改善模型性能,关注数据分布特征,充分挖掘数据价值,实现有价值数据最大化利用。

3 半监督SEI框架

3.1 损失函数设计

假设数据集N中有标签数据为L,则未标记数据为N-L,当以全监督方法对SEI网络,通常用交叉熵损失来表示预测结果与目标函数间的损失。

(5)

式(5)将对每个类别的预测概率值的分布通过对数函数映射到损失范围上,通过最小化交叉熵损失使预测值尽可能接近真实标签。本文针对LCE忽略了占比较大的未标记样本的附加信息,而无法充分利用与样本间的相互关联性的问题,引入半监督交叉熵损失函数,叠加动态变化的伪标签置信度损失,防止信息损失。

(6)

式(6)中:为未标记样本j的伪标签;为样本j对每个类别预测概率值的分布;tj为2.1节中定义的类内置信度,用来表征伪标签的可信阈值。

同样地,将伪标签损失引入到度量学习中,从特征空间层面实现网络对标记样本和未标记进行更为全面的语义特征提取。

(7)

式(7)中:表示原始有标记的信号样本的语义特征;表示类别的可训练语义特征中心。中心损失学习各类别语义特征的中心,并最小化各自类别内样本的欧式距离,以最大程度实现类内聚合。

联合引入伪标签的交叉熵损失和中心损失,通过最小化交叉熵损失使模型获得更准确的分类边界;中心损失关注补充交叉熵损失忽略的类内样本的差异,二者结合使得特征空间中相同类别的样本更为紧密,不同类别的样本更为分散,更好地实现精准识别。

(8)

3.2 复数卷积神经网络结构

本文选用复数卷积神经网络结构(complex value convolutional neural network,CVCNN )[15],经前向传播和反向传播更新权重与参数,利用ADS-B信号经过USRP转换处理后为实部的I信号数据和虚部的Q信号数据特点,将I/Q 2路信号耦合构建复数网络,以消除复数信号分割的联结特征信息损失。复数卷积核会将实部与虚部联合操作。CVCNN网络结构示意图如图6所示。

图6 CVCNN网络结构示意图
Fig.6 CVCNN network structure diagram

F=(A*I-B*Q)+i(B*I+A*Q)

(9)

在神经网络训练阶段,其采用前向传播与反向传播结合的算法。CVCNN网络传播示意图如图7所示。

图7 CVCNN网络传播示意图
Fig.7 CVCNN network propagation diagram

根据损失函数,计算zi梯度为

(10)

式(10)中, 分别根据情况求值后相加得梯度值为

(11)

更新梯度反向传播验证损失函数是否为最小化。

4 实验分析

4.1 实验参数设置

网络模型的设计与训练过程采用Pycharm软件完成,使用的模型为基于TensorFlow的keras框架,硬件配置为Intel(R) Core(TM)i9-9900K CPU,主频3.6 GHz,运行内存16 GB,GPU为NVIDIA GeForce RTX 3080。

在预处理阶段,伪标签校正模型迭代2次后得到优化的模型;在识别过程中,优化后的模型采用Adam优化器进行权值优化,每次迭代样本数为64,训练次数设置为30,lr设置为0.001,LCE为0.001。

将在北京某地区不同时间段累积采集的ADS-B信号记为BJdata,其包含232个对象类别,样本容量为39 294。后续实验数据集根据需求指定的标记占比、对象类别、样本容量等从中随机抽取,其中每个训练集取20%设定为测试集。考虑到样本不均衡等影响,将训练集内各类别数据占比人为设置为均衡。

4.2 评价标准

本文根据准确率(accuracy)作为评价指标来评价模型的性能。若样本总数为n,ICAO航班号为m的样本数量为nm,分选算法将ICAO航班号为j的样本分选为样本数量为njk(j,k=1,2,…,N),则将类型为j的样本分类为类型k的概率为

(12)

jk相等时表示预测正确。则信号分选的准确率可表示为

(13)

相同条件下,模型的平均训练时间与模型复杂度呈正相关关系,其一般能够反映模型对所承载设备的性能要求,一般来说,相同条件下,平均训练时间短的模型对设备的内存及算力要求更低,更易于实时反馈。

4.3 实验结果分析

4.3.1 不同深度学习框架的性能对比

本文选取近期较为常见的半监督辐射源个体识别算法CVNN[9]、DRCN[11]、Triple-GAN[10]、SimMIM[12]为实验对比算法,分别设置标记样本占所有训练集样本的5%、10%、20%、50%、100%为5个数据集分组,将其分别送入实验对比算法网络中,辐射源个体识别性能情况如表4所示。

表4 不同模型识别准确率
Table 4 Recognition accuracy of different models

算法标记数据占比5%10%20%50%100%CVNN0.5980.7350.9230.9730.991DRCN0.5260.7890.9310.9690.988Triple-GAN0.4530.6030.9060.9680.989SimMIM0.6630.7760.9260.9710.987本文算法0.7100.8130.9590.9820.996

结果表明,在标记数据占比5%、10%和20%的较低标签标注情况下,本文算法识别效果明显均高于其他算法。纵向对比来看,相较于其他对比算法,本文算法低占比情况下优势明显。其中,5%占比时,其他对比算法识别准确率处于59.8%到66.3%之间,本文算法突破70%;10%占比时,本文算法突破70%左右的平均识别水平达到81.3%。横向对比来看,本文算法在不同的标签数据比例条件的训练集中,均有较高的识别准确率,说明本文算法普适于多种有标签占比下的情况。

由表4可知,随着有标签数据占比的提升,5种网络模型的识别性能均有明显提升,说明深度学习模型一定程度上受有标签训练样本的数量影响。训练数据的质量是模型识别准确率的重要因素,当有标签数据不足时,模型会过于关注训练集中的有限样本,造成模型过拟合,同时,不充分的特征学习将会限制模型的表达能力,随着有标签数据的占比增加,更加有效地学习数据特征优化识别网络。

4.3.2 伪标签校正效果分析

为检验伪标签校正效果,将标记数据占比10%、类别为50、样本容量为8 192的未经伪标签校正处理的原始数据集记为DATA(10%),经过2.2节中所提伪标签校正方法迭代2次得到的校正后DATA(10%+)分别送入识别网络进行识别,结果如图8所示。伪标签校正前后训练损失如图9所示。

图8 伪标签校正前后识别准确率
Fig.8 Recognition accuracy before and after false label correction

图9 伪标签校正前后训练损失
Fig.9 Training loss before and after false label correction

由图8可知,经过伪标签校正后的样本识别准确率由64.25%提升至81.3%,同样地,在图9中,损失率由1.5降低至0.199 3,收敛迅速。表明本文所提伪标签校正方法能有效地减轻了有限标记样本不足的限制,扩充了训练集样本的多样性和规模,确保伪标签对模型训练的正面影响超过负面影响。

4.3.3 算法鲁棒性分析

为分析训练集样本数量与类别数量对识别效果的影响,分别抽取BJdata设置样本类别为5,样本容量为512记为BJdata-5(512);类别为5,样本容量为8 192记为BJdata-5(8 192); 类别为50,样本容量为8 192 记为BJdata-50(8 192),以上各组训练集中有标签样本占比均为20%,对其识别正确率和损失率进行比较,如图10所示。不同训练集识别准确率对比如图11所示,不同训练集测试集表现如图12所示。

图10 不同训练集训练损失对比
Fig.10 Training losses in different training sets

图11 不同训练集识别准确率对比
Fig.11 Recognition accuracy of different training sets

图12 不同训练集测试集表现
Fig.12 Test set performance of different training sets

由图10、图11可知,在相同类别条件下,样本数量是更为充足的BJdata-5(8 192)初始识别准确率就高达85%,且收敛速度较快,在迭代初期识别准确率快速收敛至95%后稳步提升至99.59%;同时,初始损失仅为40%并快速收敛至2%以内。而BJdata-5(512)出现了较为明显的“波动”现象,由此可见训练集中的样本数量较少时,模型容易因过于关注局部特征或噪声而出现过拟合现象,在测试集上的表现更为逊色,而充足的训练样本可以提供更为丰富的数据特征和样本差异,有助于改善识别效果,提高模型的鲁棒性和泛化能力。

在样本容量相同的条件下,对象类别数量较少的BJdata-5(8 192)相较于BJdata-50(8 192)表现出更高的识别准确率,二者的识别准确率曲线相差2%左右,损失曲线相差1%左右,其走势是较为一致的。分析可知,随着类别数量的增加,伪标签的质量下降,较多对象类别的模型需要同时处理多个对象之间的差异性和相似性,增加了模型的学习难度。

4.3.4 网络模型复杂度比较

数据类型、模型的输入输出和中间层的大小与形状、batch size的大小都不同程度地影响内存访问量和浮点运算数,进而影响训练和推断的效率。现控制单一变量为算法模型,将有标签占比为10%,对象类别为50的样本BJdata-50(8 192)作为训练集分别送入本文算法与常见的半监督辐射源个体识别算法与CVNN[24]、DRCN[35]、Triple-GAN[31]、 SimMIM[33]进行平均运行时间的比较。在利用本文模型进行识别前,需要先进行2次标签校正的预处理。

由表5可知,在与其他算法识别准确率有提前的情况下,本文模型的每轮迭代平均训练时间与其他半监督算法相比并不具有优势,但本文算法的识别准确率在有不同占比条件下均有不同程度的提高,尤其在5%、10%等有标签占比较低的情况下识别能力更具有优势,总体而言,能较好地平衡识别准确率高与实时性的需求。

表5 不同检测模型的检测结果
Table 5 Detection results of different detection models

模型每轮迭代平均训练时间/s识别准确率CVNN0.390.735DRCN6.610.789TripleGAN4.590.603SimMIM1.290.776本文算法4.610.813

5 结论

本文中提出的基于置信学习的低标注率辐射源识别算法,能有效减轻样本标注率低的不利影响,提高不同比例的标记样本条件下特定辐射源识别的准确性,尤其在原有标注低占比条件下,识别准确率提升明显,为非协作通信或目标隐身性好等样本捕捉类别不全面、样本标注成本高等场景下辐射源个体识别提供了思路。

1) 定义了类内置信度,通过动态调整类内置信度,筛选出错误标记的伪标签进行重训练校正,高质量伪标签样本扩充数据集并更新优化模型,提高训练集质量和多样性,缓解标注数据不足引起的特征学习不充分的问题。

2) 分析样本价值,对关键少数的不确定性样本进行辅助标记,最大化扩充无标签数据在不同类别特征空间的分布,减轻有限标记样本的不利影响,增加了模型的泛化性能。

3) 建立引入动态变化的伪标签置信度损失的联合损失函数,通过最小化交叉熵损失获得更准确的分类边界,中心损失补充关注类内样本的差异,二者结合实现类间分离和类内聚合,提高识别准确率。

参考文献:

[1] 张立民,谭凯文,闫文君,等.基于持续学习和联合特征提取的特定辐射源识别[J].电子与信息学报,2023,45(1):308-316.ZHANG Limin,TAN Kaiwen,YAN Wenjun,et al.Specific radiation source recognition based on continuous learning and joint feature extraction[J].Journal of Electronics &Information Technology,2023,45(1):308-316.

[2] 张海燕,闫文君,张立民,等.通信信号调制识别综述[J].海军航空大学学报,2022,37(1):126-132.ZHANG Haiyan,YAN Wenjun,ZHANG Limin,et al.Review of communication signal modulation recognition[J].Journal of Naval Aeronautical University,2022,37(1):126-132.

[3] XIE Q,EDUARD H,MINH L,et al.Self-training with noisy student improves ImageNet classification[C]//Proc.of the Seattle:2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR),2020:10684-10695.

[4] ZHU X,GOLDBERG A,ZHU H,et al.Introduction to semi-supervised learning[M].Morgan &Claypool Publishers,2009:3-25.

[5] LIU Q,WANG Z,JIN X,et al.Self-training with online contrastive learning[C]//Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics,2021:5-23.

[6] LIANG C,YU Y,JIANG H,et al.BOND:BERT-assisted open-domain named entity recognition with distant supervision[C]//Proceedings of the 26th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD’20),2020.

[7] BLUM A,MITCHELL T.Combing labeled and unlabeled data with co-training[C]//Proceedings of the 11th Annual Conference on Computational Learning Theory,1998.

[8] SOHN Ki,BERTHELOT D,LI C,et al.Fixmatch:Simplifying semi-supervised learning with consistency and confidence[J].Advances in Neural Information Processing Systems,2020,33:596-608.

[9] WANG Y,GUI G,GACANIN H,et al.An efficient specific emitter identification method based on complex-valued neural networks and network compression[J].IEEE Journal on Selected Areas in Communications,2021,39(8):2305-2317.

[10] LI C X,XU K,ZHU J,et al.Triple generative adversarial nets[C]//Proc.of the Neural Information Processing Systems (NIPS),2017:1-15.

[11] WANG Y,GUI G,GACANIN H,et al.Transfer learning for semi-supervised automatic modulation classification in ZF-MIMO systems[J].Emerging Sel.Top.Circuits System,2020,10(2):231-239.

[12] XIE Z,ZHANG Z,CAO Y,et al.SimMIM:A simple framework for masked image modeling[C]//Proc.of the IEEE/CVF Conf.Comput.Vision and Pattern Recognit (CVPR),IEEE,2022:9643-9653.

[13] RADFORD A,METZ L,CHINTALA S.Unsupervised representation learning with deep convolutional generative adversarial networks[C]//Proceedings of the International Conference on Learning Representations.San Juan,Puerto Rico,2016:1-16.

[14] 郭伟,黄嘉晖,侯晨煜,等.融合抗噪和双重蒸馏的文本分类方法[J].计算机科学,2023,50(6):251-260.GUO Wei,HUANG Jiahui,HOU Chenyu,et al.Text classification method combining noise suppression and double distillation[J].Computer Science,2023,50(6):251-260.

[15] 陶梦圆,张茜茜,王禹,等.基于复数卷积神经网络的辐射源识别方法[J].移动通信,2022,46(7):34-39.TAO Mengyuan,ZHANG Xixi,WANG Yu,et al.Radiation source identification method based on complex convolutional neural network[J].Mobile Communications,2022,46(7):34-39.

Low labeling rate specific emitter identification algorithm based on confidence learning

WANG Yihui1,2, YAN Wenjun1, LING Qing1, DUAN Kexin1,3, YU Kaize1,3

(1.Naval Aviation University, Yantai 264001, China;2.Unit 31401 of the People’s Liberation Army, Yantai 264001, China;3.Unit 91423 of the People’s Liberation Army, Yantai 264001, China)

AbstractIn order to solve the problem of weak labeling of samples with only a small amount of labeled data, a false label correction method based on confidence learning is proposed to identify individual radiation sources. Firstly, by dynamically adjusting the in-class confidence, the generated false labels can be corrected in time. Secondly, the sample value is analyzed and a small number of key samples that affect the performance of the model are manually labeled. Then, by using the joint cross-entropy and center loss function, the dynamic pseudo-label confidence loss is superimposed, and the inter-class difference and intra-class difference are paid attention to, so as to maximize the intra-class aggregation and inter-class separation achieved by using the data feature information. Experimental results show that the proposed algorithm can achieve effective identification of individual radiation sources under various conditions, such as 5%, 10%, 20%, 50%, 100%, especially in the case of low proportion of labeled data, the advantages are obvious, and the recognition accuracy rate exceeds 70% and 80% respectively, effectively alleviating the shortage of limited labeled samples. The recognition effect of reasonable network depth, good balance between precision and speed is realized.

Key wordsspecific emitter identification; pseudo label correction; sample value analysis; loss function of pseudo label

本文引用格式:王艺卉,闫文君,凌青,等.基于置信学习的低标注率辐射源个体识别算法[J].兵器装备工程学报,2024,45(5):267-275.

Citation format:WANG Yihui, YAN Wenjun, LING Qing, et al.Low labeling rate specific emitter identification algorithm based on confidence learning[J].Journal of Ordnance Equipment Engineering,2024,45(5):267-275.

中图分类号:TN911.7

文献标识码:A

文章编号:2096-2304(2024)05-0267-09

收稿日期:2023-08-08;

修回日期:2023-08-16;

录用日期:2023-09-29

基金项目:国家自然科学基金面上项目(62271499);电磁空间安全全国重点实验室开放基金

作者简介:王艺卉(1992—),女,硕士研究生,助理工程师,E-mail:wyhmailbox@163.com。

通信作者:闫文君(1986—)男,博士,副教授,E-mail:249927911@qq.com。

doi:10.11809/bqzbgcxb2024.05.037

科学编辑 郭强 博士(烟台大学)

责任编辑 徐佳忆