兵器装备工程学报

文章详情

稿件标题: 基于PPO的球形机器人目标跟随研究
稿件作者: 靳一聪1,应展烽2,刘春政1,葛昊1,陈志华1
DOI: 10.11809/bqzbgcxb2024.03.036
科学编辑: 李声飞 博士( 中国西南电子技术研究所 研究员)
栏目名称: 信息科学与控制工程
关键词: 球形机器人;目标跟随;强化学习;PPO算法;人工势场
文章摘要: 球形机器人由于其优异的运动性能、出色的地形适应能力和防侧翻的特性,被广泛应用于水下探测、岸滩巡检等需要适应复杂环境的场景。然而球形机器人系统模型具有欠驱动、非线性的特点,运动控制问题复杂,在复杂应用环境下难以可靠跟随目标。为此,提出了一种基于近端策略优化(PPO)算法的球形机器人目标跟随方法。该方法基于深度强化学习理论,在球形机器人动力学模型的基础上,设计了简单高效的动作空间和表征完善的状态空间。并且为提高目标跟随方法的鲁棒性,该方法在奖励函数中引入人工势场,以使目标始终保持在机器人视野中心。仿真结果表明,所提方法能够满足既定场景的跟随需求,球形机器人使用该方法可以对随机运动目标进行可靠跟随。
稿件基金: 江苏省自然资源厅科技计划项目(JSZRHKJ202219)
引用本文格式: 靳一聪,应展烽,刘春政,等.基于PPO的球形机器人目标跟随研究[J].兵器装备工程学报,2024,45(3):280-285.
JIN Yicong, YING Zhanfeng, LIU Chunzheng, et al.Research on target following of spherical robot based on PPO[J].Journal of Ordnance Equipment Engineering,2024,45(3):280-285.
刊期名称: 2024年03期
出版时间: 2024年3月
收稿日期: 2023年4月27日
修回日期: 2023年5月29日
录用日期: 2023年6月29日
上线时间: 2024年3月28日
浏览次数: 1426
下载次数: 54
免费阅读PDF 在线阅读 下载本期目录 下载本期封面