稿件标题: | 基于改进强化学习的多无人机协同对抗算法研究 |
稿件作者: | 张磊1,2,李姜1,2,侯进永3,高远1,2,王烨1 |
DOI: | 10.11809/bqzbgcxb2023.05.033 |
科学编辑: | 甄子洋 博士(南京航空航天大学教授、博导) |
栏目名称: | 信息科学与控制工程 |
关键词: | 无人机集群;强化学习;协同控制;群智能;攻防对抗 |
文章摘要: | 多无人机的作战协同研究内容主要包含飞行协同、侦察协同及干扰协同,随着无人机数量及协同决策内容的增加,多智能体强化学习模型的状态空间及动作空间维度呈指数增长,多智能体强化学习算法在训练中不易收敛,协同决策水平难以得到显著提升。采用并对多智能体深度确定性策略梯度(MADDPG)算法原理进行模型构建,在此基础上提出了一种选择性经验存储策略的多智能体深度确定性策略梯度(SESMADDPG)算法。该算法通过设置回收存储标准以及选择性因子,对进入经验池的经验进行选择性存储,以缓解奖励稀疏的问题。仿真实验表明,在保证算法时间复杂度的前提下,SESMADDPG算法比其他强化学习算法有了更好的收敛效果,相较于MADDPG算法,任务完成率提高了25.427%。 |
稿件基金: | 国家自然科学基金项目(61977059) |
引用本文格式: | 张磊,李姜,侯进永,等.基于改进强化学习的多无人机协同对抗算法研究[J].兵器装备工程学报,2023,44(5):230-238. ZHANG Lei, LI Jiang, HOU Jinyong, et al.Research on multiUAV cooperative confrontation algorithm based on improved reinforcement learning[J].Journal of Ordnance Equipment Engineering,2023,44(5):230-238. |
刊期名称: | 2023年05期 |
出版时间: | 2023年5月 |
上线时间: | 2023年5月28日 |
浏览次数: | 1979 |
下载次数: | 82 |
免费阅读PDF 在线阅读 下载本期目录 下载本期封面 |