本发明公开了一种安全强化学习的狭窄空间机器人作业规划方法,包括:在机械臂运动之前,设置规划任务以及目标点;根据机械臂当前的状态信息以及相关运动学约束,计算出期望的加速度,同时计算制动加速度;对关节的期望加速度进行测试,若执行该动作后机械臂未发生碰撞且未违反关节的运动学约束,则期望加速度是可行的,将期望加速度作为替代动作进行执行;否则将计算的制动加速度作为替代动作进行执行;由机械臂每个关节的替代动作组成了机械臂可行的动作空间;利用深度强化学习算法在所述动作空间下为机械臂规划运动轨迹并获得最优策略。本发明结合了替代动作的思想,重新设计了用于强化学习训练的动作空间,进一步保证了规划结果的安全性。
声明:
“安全强化学习的狭窄空间机器人作业规划方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)