兵器装备工程学报

文章详情

稿件标题: 基于强化学习的多智能体协同电子对抗方法
稿件作者: 杨洋1,2,王烨1,2,康大勇3,陈嘉玉1,李姜1,2,赵华栋1,2
DOI: 10.11809/bqzbgcxb2024.07.001
科学编辑: 李波 博士(西北工业大学 教授)
栏目名称: 无人自主系统及智能决策专栏
关键词: 协同决策;强化学习;策略梯度;电子对抗仿真
文章摘要: 传统电子战正逐步向融合人工智能技术的智能电子战演变,基于强化学习的多无人机电子协同对抗为主要场景,针对复杂高维的状态动作空间下多智能体强化学习算法不容易收敛问题,提出了一种基于优先经验回放的多智能体双对抗策略梯度算法。该算法通过引入优先经验回放机制,并提出对抗Critic网络和双Critic网络来平衡动作及价值间的关系和减小单一Critic网络估计不确定性的问题。仿真实验结果表明:在同一仿真场景下相较于其他强化学习算法,PerMaD4算法具有更好的收敛效果且任务完成度提高了8.9%。
稿件基金: 国家自然科学基金项目(61977059)
引用本文格式: 杨洋,王烨,康大勇,等.基于强化学习的多智能体协同电子对抗方法[J].兵器装备工程学报,2024,45(7):1-10. 
YANG Yang, WANG Ye, KANG Dayong, et al.Multiagent cooperative electronic countermeasure method based on reinforcement learning[J].Journal of Ordnance Equipment Engineering,2024,45(7):1-10. 
刊期名称: 2024年07期
出版时间: 2024年7月
收稿日期: 2023-10-18
修回日期: 2023-11-09
录用日期: 2023-12-12
上线时间: 2024年7月26日
浏览次数: 1287
下载次数: 161
免费阅读PDF 在线阅读 下载本期目录 下载本期封面