集成学习在多源信息融合识别中的应用研究

周 钢1,瞿 洋2,张社国2

(1.海军工程大学, 武汉 430033; 2.中国人民解放军92682部队, 广东 湛江 524000)

摘要:针对基于博弈论、基于贝叶斯网络和基于证据理论的多源信息融合典型模型中历史数据利用不足和智能程度不高的问题,提出了一种基于集成学习的多源信息融合识别模型。该模型按照基学习器构建,信息融合模型构建,异源信息印证3个步骤完成多源信息融合与目标识别。利用单一雷达对某海域的历史探测数据,将构建基学习器,结合基学习器的多样性和不同错分问题的动态权重构建集成学习模型,最后,运用异类情报源对预测结果进行印证。以雷达情报数据的多源融合为典型案例展示集成学习多源信息融合识别模型应用,实证试点应用发现该模型能够有效提升目标识别准确率,提高战场情报处理与分析能力。

关键词:多源信息融合;目标识别;集成学习;雷达情报

多源信息融合是一种多层次、多方面的处理过程,包括对多源数据进行检测、相关、组合和估计,从而提高目标实体的状态和身份估计的精度,以及对战场态势和威胁的重要程度进行适时完整的评价[1]。随着信息采集手段和技术的发展,多源信息融合的信息源拓展到包括雷达、声纳、红外、航拍、遥感等传感设备和数据库、知识库、人工情报、互联网等多种来源。多源信息融合在战场情报综合处理、联合海情数据分析等领域具有广泛应用实践[2、3]。多源信息融合识别是利用各类情报资源,通过统一时空基准、区域协同,产生探测目标的一致性解释或描述[4]。本文中围绕多源信息融合典型模型中的历史数据利用不足和智能程度不高的问题,关注目标识别的类别判断问题,分析当前通用的多源融合模型,探析传统模型存在的问题,并针对性提出了一种基于集成学习的多源信息融合识别模型,进行了典型案例应用分析。

1 多源信息融合识别

在多源信息融合中,由于各类情报探测设备和情报收集源的差异性,为了更好的发挥各情报装备的性能,根据各情报探测装备在情报获取性能上的差异性、互补性,通过协调、集成、融合,进一步发挥情报体系的一体化、联合化、体系化作战能力,提升战场情报综合分析处理的效能。

1.1 战场多源信息融合多层架构

战场多源信息融合识别根据融合层次可以分为探测装备层融合、目标位置层融合、特征属性层融合、战场态势层融合和威胁评估层融合[5]。探测装备层融合是将探测装备上的大量原始情报数据,经过处理压缩后传输到情报处理中心进行融合;目标位置层融合也称目标轨迹、航迹追踪,是对各情报探测设备数据的对目标轨迹、航迹的单向融合;特征属性层融合,也称目标级别融合,主要完成目标属性分类和类别判决,主要包括三类目标,即民用目标(渔船、邮轮等)、军用目标(我方、敌方)和不明目标;战场态势层融合是综合作战区域(海域、空域、电磁域)的各类情报信息,形成全面综合的战场态势;威胁评估层融合是基于战场态势,结合作战意图和战略战役目标,辅助首长决策,估计敌方目标威胁。战场多源信息融合多层架构如图1所示。

图1 战场多源信息融合的多层结构框图

其中,目标位置融合和特征属性融合是最重要的中间层,为后续态势评估和威胁估计提供基础。本文关注的多源信息融合识别主要是探测目标属性层的融合,关注目标的属性识别。

1.2 多源信息融合典型模型

常见的多源融合识别模型包括:基于博弈论的多源信息融合、基于贝叶斯网络的多源信息融合[6]和基于证据理论的多源信息融合[7]等模型方法。

1) 基于博弈论的多源信息融合,是将信息融合过程抽象为多个局中人在冲突环境下的策略交互过程,融合目标在于各局中人在融合系统中的支付效用最大化,按照局中人提取、策略提取、支付提取、态势评估、过程提取5个模块完成博弈融合。

2) 贝叶斯网络的多源信息融合,是将多源情报作为博弈参与者,将情报源之间的协同、合作、冲突、互补作为策略集,考虑多个情报源在时空上的动态相关性,在融合中采用贝叶斯网络推理和决策树,构建最优融合策略。

3) 证据理论的证据合成方法能融合多个证据源证据,根据支持证据冲突的概率分配各个证据命题。在多源信息融合中,将情报源作为证据源,将情报源构建局部决策作为证据对应的命题,情报源之间的冲突转为证据冲突概率。考虑情报源信息获取的连续性、时序性,结合当前节拍数据和历史节拍数据,来进行多源信息融合。

1.3 多源信息融合模型现状分析

根据1.2节所述的多源信息融合模型研究,3种常见模型均关注目标位置和特征属性层的融合,基于证据理论的多源信息融合是数据层面融合,基于博弈论和基于贝叶斯网络方法则是决策层面融合。随着大数据、人工智能技术发展,开展多域战场多源信息融合识别中的多传感器协同控制,多源情报特征级一致化,情报大数据的重构、压缩技术研究[8-10],从而进一步加强一体化情报系统建设,网络化情报信息收集,智能化情报融合识别,是当前战场多源信息融合的研究热点和发展趋势。

传统多源信息融合模型存在两方面问题,一是历史数据利用不充分,缺乏对情报源历史情报数据和情报收集精度的使用;二是融合模式方法不智能,简单按照大数原则或权重赋值进行结合,缺乏先进人工智能技术在其中的融合应用。据此,提出一种新的基于集成学习方法的多源信息融合识别模型。

2 集成学习的多源信息融合识别模型

集成学习利用多个学习器的集成来解决复杂问题,从而可显著提高学习系统的预测精度[11],集成学习的多样性是提升集成学习泛化能力的重要手段之一[12]。集成学习模型与多源信息融合识别在模型结构、组成架构上具有内在切合性,因此,构建基于集成学习的多源信息融合识别模型来实现多源情报融合,识别目标类别。

开展集成学习在多源信息融合识别中的应用研究,构建基于集成学习的多源信息融合识别模型,按照基学习器构建,信息融合模型构建,异源信息印证3个步骤完成,并以雷达情报数据的多源融合为典型案例展现集成学习多源信息融合识别模型应用。

基于集成学习的多源信息融合识别模型构建过程如图2所示。

图2 基于集成学习的多源信息融合识别模型
构建过程框图

2.1 基学习器构建

雷达是情报收集系统的主要情报获取设备,它是利用目标对电磁波的反射现象来发现目标并测定其位置的[13]。雷达目标自动识别有主动识别和被动识别两种,其中,主动识别主要使用敌我识别器,根据目标的应答信号是否符合预定密码,识别器输出相应的属性信号,被动识别是利用所获取目标的信息特征,与目标数据库所存的有关数据进行比较,以确定目标的敌我属性。

这里主要研究运用雷达自动被动识别某一区域海上目标,将单个的雷达情报源作为基学习器构建,利用该雷达对某海域的历史探测数据,构建基学习器。根据雷达特性,确定采集的情报数据格式如表1所示。

表1 雷达情报格式

特征批号方位距离面积格式整数浮点数浮点数浮点数说明4位0~360海里平方米特征航向航速机动性目标判别格式浮点数浮点数浮点数整数说明0~360节节/分4类

对于海上目标类别的探测识别,除了表1中所列的目标方位、距离、速度等基础信息,还有由此衍生的宏观动态信息,如航向、航速,以及微观动态信息,如机动性能、外形特征等,完成从雷达测量空间向特征空间的转变,建立并提取与探测目标类别密切相关的特征及数据,主要包括方位、距离、航速、面积、航向、机动性,判决的目标属性为海上目标类别。

根据已有特征数据判别舰船类别,由于舰船类别有限,是典型多分类问题,应当使用分类算法构建基学习器;由于涉及军事决策问题,应当确保分类算法具有高可靠性和可解释性,因此决策树算法是优良选择;根据特征数据的离散性和取值有限性,避免决策树倾向于多取值属性,应选用信息增益作为属性选择度量。综合上述三点,选用C4.5算法[14]构建决策分类树作为基学习器。据此,雷达装备情报源基学习器的构建过程如图3所示。

图3 雷达情报源的基学习器构建框图

2.2 信息融合模型构建

运用各雷达情报源构建的基学习器来建立集成学习模型,完成多源信息融合与目标识别。由于各个观通站、岸基雷达站装备的差异性,以及针对某一区域海上目标的相对距离、位置以及目标特性的不同,各雷达情报源构建的基学习器虽然针对同一区域海上目标,但是在特征数据上存在差异性,从而形成了多样性的基学习器。

假设存在某区域海上目标S,存在五部不同性能、距离、方位的雷达R1,R2,R3,R4,R5对S进行探测,示意图如图4。

图4 多雷达探测示意图

各雷达均通过敌我识别器和AIS等异类情报源印证消除了为我方舰船1和民用船舶2的可能,敌方舰船在抵近侦察会采用各种欺骗、伪装手段,因此,一般将海上目标类别判决问题退化为二分类问题,即敌方舰船0和不明目标3的判决。

对于R1、R2、R3、R4、R5的历史情报数据构建决策树,如图5所示。

对于R1~R5雷达探测情报,通过数值离散化、特征空间转化提取得到雷达特征数据,结合图5的各雷达构建的决策树,并按照75%准确率标准进行决策树预裁剪,可以得到预测结果如表2,其中目标类别括号中为分类准确率。

图5 雷达R1~R5构建的基决策树示意图

表2 多雷达情报数据及预测结果

雷达方位距离面积航向航速机动性类别R14331340(81%)R24232343(76%)R34422230(92%)R41431333(83%)R51524243(82%)

按照学习器结构多样性的判别方法[15],对于R1~R5构建的基学习器C1~C5,多样性判断后选取C1、C3、C4集成学习泛化能力最好,后续增加顺序为C2、C5。

那么,对于敌方目标(0)和不明目标(3)在错报时候的代价不一样,因此应用错分容忍度和对于分类结果的多样性构建方法,参照混淆矩阵模式,为不同错分问题构建动态权重,具体如表3所示。

表3 海情判别错分问题权重表

真实分类情况预测分类情况敌方目标不明目标敌方目标0.60.1不明目标0.20.1

基于表2和表3,假设实际对于该海上目标为敌方目标和不明目标的概率均为50%,此时,构建具体军事应用中海上目标类别判断的综合精度如表4所示。

表4 海上目标类别判断的综合精度

真实分类情况分类惩罚C1C2C3C4C5敌方目标0.5050.2200.5600.1850.190不明目标0.1190.1240.1080.1170.118综合精度0.6240.3440.6680.3020.375

因此,结合海上目标类别判决的应用背景,构建综合精度排序为C3、C1、C5、C2、C4。根据多样性对泛化能力的贡献和基学习器对预测精度的作用在最终分类结果中的贡献相同,那么最终选取的多样性基分类器为C1、C3和C4,其中C1、C3均判断为敌方舰船,因此,可以预测该海上目标为敌方舰船。

2.3 异源信息印证

对于多个雷达情报源的探测结果采用多样化集成学习后的预测结果,还可以继续使用异类情报源进行印证。如继续使用敌我识别器、AIS判别、电子对抗侦察设备,根据返回的敌我信息、属性信息或电子装备特性,判断目标类别属性,或从而进一步提高预测目标类别的准确率。

3 结论

基于集成学习的多源信息融合识别模型,按照基学习器构建,信息融合模型构建,异源信息印证3个步骤完成多源信息融合识别,并以雷达情报数据的多源融合为典型案例展示了基于集成学习的多源信息融合识别模型应用,实证应用发现该模型能够有效提升目标识别准确率,对提高战场情报处理与分析能力具有重要意义。

参考文献:

[1] 杨露婧,余华.多源信息融合理论 与应用[M].2版.北京:北京邮电大学出版社,2011.

[2] 杨露菁,郝威,刘志坤,等.战场情报信息综合处理技术[M].北京:国防工业出版社,2017.

[3] 杨荣芳.面向海量数据的海情分析技术研究[J].兵器装备工程学报,2018,39(04):97-100,142.

[4] 邱志明.多源信息融合和目标综合识别技术[J].指挥控制与仿真,2010,32(04):71-75.

[5] 邵明敏,张秦.信息反馈融合方法综述[J].飞航导弹,2017(01):55-58.

[6] 全吉成,袁昱纬.多源军事情报资源在作战决策中的应用研究[M].北京:国防大学出版社,2015.

[7] 安春莲,黄静,吴耀云.基于证据理论的多源信息融合模型[J].电子信息对抗技术,2017,32(01):23-26.

[8] 严永锋.海战场侦察监视系统中大数据技术研究[J].兵器装备工程学报,2018,39(04):14-18.

[9] 胡玉兰,郝博,王东明.智能信息融合与目标识别方法[J].北京:机械工业出版社,2018.

[10] 刘斌.基于本体的多源信息融合空间目标识别方法研究[D].长沙:国防科技大学,2018.

[11] ZHOU Z H.Ensemble Methods-Foundations and Algorithms[M].Taylor & Francis,2012.

[12] OEHMCKE S,HEINERMANN J,KRAMER O.Analysis of Diversity Methods for Evolutionary Multi-objective Ensemble Classifiers[M].Applications of Evolutionary Computation,2015.

[13] RICHARD G C.杨勇 译.雷达基础知识:雷达设计与性能分析手册[M].北京:科学出版社,2017.

[14] 周钢,吴克明.基于改进型C4.5算法的关系数据库零水印模型研究[J].计算机应用与软件,2015,32(01):64-67.

[15] SUN T,ZHOU Z H.Structural Diversity for Decision Tree Ensemble Learning[J].Frontiers of Computer Science,2018(03):1-11.

Application of Ensemble Learning in Multi-Source Information Fusion and Target Identification

ZHOU Gang1, QU Yang2, ZHANG Sheguo2

(1.Naval Engineering University, Wuhan 430033, China; 2.Navy 92682, Zhanjiang 524000, China)

Abstract: Aiming at the problems of insufficient utilization of historical data and low intelligence in typical models of multi-source information fusion based on game theory, Bayesian network and evidence theory, a multi-source information fusion and target identification model based on ensemble learning was proposed. The model completes the multi-source information fusion and target recognition according to three steps: the construction of base learner, the construction of information fusion and target recognition model, and the verification of different source information. Firstly, the historical data of a certain sea area from a single radar were used to construct a base learner. Secondly, an integrated learning model was constructed by combining the diversity of base learners and the dynamic weights of different misclassification problems. Finally, the prediction results were verified by using different intelligence sources. Taking multi-source fusion of radar intelligence data as a typical case, the application of ensemble learning multi-source information fusion and target identification model was demonstrated. The experimental application shows that the model can effectively improve the accuracy of object identification and the capability of battlefield intelligence processing and analysis.

Key words multi-source information fusion; target identification; ensemble learning; radar intelligence

收稿日期:2020-09-03;修回日期: 2020-11-09

作者简介:周钢(1984—),男,博士,讲师,E-mail:18672923066@163.com。

doi: 10.11809/bqzbgcxb2021.09.026

本文引用格式:周钢,瞿洋,张社国.集成学习在多源信息融合识别中的应用研究[J].兵器装备工程学报,2021,42(09):166-169,254.

Citation format:ZHOU Gang,QU Yang,ZHANG Sheguo.Application of Ensemble Learning in Multi-Source Information Fusion and Target Identification[J].Journal of Ordnance Equipment Engineering,2021,42(09):166-169,254.

中图分类号:TP181

文献标识码:A

文章编号:2096-2304(2021)09-0166-04

科学编辑 王进达 博士(中航工业空空导弹研究院)责任编辑 杨梅梅