本发明能够提供基于深度强化学习的机器人导航方法及系统、设备、介质。该方法包括:获取实时观测数据,以构建环境地图和确定机器人的当前位置和目标点相对位置。生成导航动作信息,依据导航动作信息控制机器人从当前位置向目标点相对位置移动。经过第一设定时长后判断机器人是否到达目标点相对位置。根据未到达目标点生成新导航路径,并控制机器人沿着新导航路径移动,以及再经过第二设定时长后返回获取实时观测数据步骤;或根据到达目标点结束导航。本发明能够在没有初始地图的环境下控制机器人在导航过程中灵活地避开静态和动态障碍物,计算量较小。本发明创新地结合了全局信息和局部信息,有效避免了常规机器人在局部区域徘徊的问题。
声明:
“基于深度强化学习的机器人导航方法及系统、设备、介质” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)