稿件标题: | 基于DL-MCTS的超视距空战战术智能决策方法研究 |
稿件作者: | 宋祺,左家亮,张滢,闫孟达,吴傲,李乐言 |
DOI: | 10.11809/bqzbgcxb2025.02.020 |
科学编辑: | 杨继森 博士(重庆理工大学 教授、博导) |
栏目名称: | 基础理论与应用研究 |
关键词: | 超视距空战;战术决策;智能决策;深度学习;蒙特卡洛树搜索 |
文章摘要: | 现有超视距空战智能决策研究多侧重于机动决策,而战术决策研究较少。针对机动决策难理解、战术决策难生成的问题,提出了一种融合深度学习(DL)和蒙特卡洛搜索(MCTS)的算法,通过构建空战智能体自主学习和决策框架,融合智能体的离线战术学习和在线战术决策,实现了一种基于DL-MCTS的超视距空战战术决策方法。在离线学习阶段,利用神经网络学习先验战术规划数据集,包含感知数据集、策略数据集和评估数据集,并为智能体构建感知器、规划器和评估器3种功能模块。在实时对抗阶段,提出战术感知和决策双线并行处理模式,建立对抗博弈树。利用蒙特卡洛搜索方法融合智能体3种网络,在每个博弈节点上实现选择、扩展、仿真和信息回溯,实时搜索当前态势的最优策略。在迎头攻击任务实验中,离线训练后的智能体具备基本的决策能力,经过50次循环迭代搜索后,智能体能够消除对手的首发导弹优势,并逐步获取自身导弹发射条件。实验结果表明该战术决策方法的决策结果可解释性强、决策速度较满意。 |
引用本文格式: | 宋祺,左家亮,张滢,等.基于DL-MCTS的超视距空战战术智能决策方法研究[J].兵器装备工程学报,2025,46(2):145-156. SONG Qi, ZUO Jialiang, ZHANG Ying, et al.Research on intelligent tactical decision-making method of beyond-visual-range air combat based on DL-MCTS[J].Journal of Ordnance Equipment Engineering,2025,46(2):145-156. |
刊期名称: | 2025年02期 |
出版时间: | 2025年2月 |
收稿日期: | 2024-03-11 |
修回日期: | 2024-06-05 |
录用日期: | 2024-07-02 |
上线时间: | 2025年2月28日 |
浏览次数: | 210 |
下载次数: | 19 |
免费阅读PDF 下载本期目录 下载本期封面 |