兵器装备工程学报

文章详情

稿件标题: 基于改进SARSA算法的直升机CGF路径规划
稿件作者: 姚江毅,张阳,李雄伟,王艳超
DOI: 10.11809/bqzbgcxb2022.05.035
科学编辑: 李龙跃 博士(空军工程大学副教授、硕导)
栏目名称: 信息科学与控制工程
关键词: 路径规划;计算机生成兵力;强化学习;人工势场;动态奖赏
文章摘要: 结合人工势场算法原理,引入奖赏生成机构对传统SARSA学习算法的奖赏生成机制进行改进,改进后的SARSA学习算法通过判断执行动作的有效性进一步结合环境信息实时生成动态奖赏,继承了人工势场算法良好的控制性能,能够根据连续预估的代价场信息进行优化搜索,使奖赏累积过程更为平滑。基于直升机CGF突袭雷达阵地模型进行仿真实验,分别对比算法收敛所需迭代次数和完成任务成功率,改进SARSA学习算法收敛时所需迭代次数是传统SARSA学习算法的一半,经过1 000次迭代,改进SARSA学习算法完成任务成功率平均比传统SARSA学习算法提升12%。仿真实验表明:改进SARSA算法相对传统SARSA算法有着更优异的性能,算法收敛速度以及完成任务成功率都有明显提升,改进SARSA算法能够为直升机CGF规划安全路径。
稿件基金: 国家自然科学基金项目(61602505)
引用本文格式: 姚江毅,张阳,李雄伟,等.基于改进SARSA算法的直升机CGF路径规划[J].兵器装备工程学报,2022,43(05):220-225.
YAO Jiangyi, ZHANG Yang, LI Xiongwei, et al.Helicopter CGF path planning based on improved SARSA algorithm[J].Journal of Ordnance Equipment Engineering,2022,43(05):220-225.
刊期名称: 2022年05期
出版时间: 2022年5月
上线时间: 2022年5月28日
浏览次数: 2460
下载次数: 504
免费阅读PDF 在线阅读 下载本期目录 下载本期封面