兵器装备工程学报

文章详情

稿件标题: 基于DL-MCTS的超视距空战战术智能决策方法研究
稿件作者: 宋祺,左家亮,张滢,闫孟达,吴傲,李乐言
DOI: 10.11809/bqzbgcxb2025.02.020
科学编辑: 杨继森 博士(重庆理工大学 教授、博导)
栏目名称: 基础理论与应用研究
关键词: 超视距空战;战术决策;智能决策;深度学习;蒙特卡洛树搜索
文章摘要: 现有超视距空战智能决策研究多侧重于机动决策,而战术决策研究较少。针对机动决策难理解、战术决策难生成的问题,提出了一种融合深度学习(DL)和蒙特卡洛搜索(MCTS)的算法,通过构建空战智能体自主学习和决策框架,融合智能体的离线战术学习和在线战术决策,实现了一种基于DL-MCTS的超视距空战战术决策方法。在离线学习阶段,利用神经网络学习先验战术规划数据集,包含感知数据集、策略数据集和评估数据集,并为智能体构建感知器、规划器和评估器3种功能模块。在实时对抗阶段,提出战术感知和决策双线并行处理模式,建立对抗博弈树。利用蒙特卡洛搜索方法融合智能体3种网络,在每个博弈节点上实现选择、扩展、仿真和信息回溯,实时搜索当前态势的最优策略。在迎头攻击任务实验中,离线训练后的智能体具备基本的决策能力,经过50次循环迭代搜索后,智能体能够消除对手的首发导弹优势,并逐步获取自身导弹发射条件。实验结果表明该战术决策方法的决策结果可解释性强、决策速度较满意。
引用本文格式: 宋祺,左家亮,张滢,等.基于DL-MCTS的超视距空战战术智能决策方法研究[J].兵器装备工程学报,2025,46(2):145-156.
SONG Qi, ZUO Jialiang, ZHANG Ying, et al.Research on intelligent tactical decision-making method of beyond-visual-range air combat based on DL-MCTS[J].Journal of Ordnance Equipment Engineering,2025,46(2):145-156.
刊期名称: 2025年02期
出版时间: 2025年2月
收稿日期: 2024-03-11
修回日期: 2024-06-05
录用日期: 2024-07-02
上线时间: 2025年2月28日
浏览次数: 210
下载次数: 19
免费阅读PDF 下载本期目录 下载本期封面