本发明中提出的一种基于无地图运动规划器的移动机器人连续控制方法,其主要内容包括:无地图运动规划器、异步深度确定策略梯度、强化学习、评估网络和奖励函数,其过程为,利用无地图运动规划器进行端对端训练,为无地图运动规划器找到转换函数来控制频率;修改原始深度确定策略梯度,成为异步深度确定策略梯度;进行强化学习,使训练和样本收集能够并行执行;利用评估网络对运动规划器进行评估,定义奖励函数检查到达目标。本发明使用高精度激光测距传感器,能够准确计算出路径,效率更高;同时无需任何手动设计和提前演示,能够高效地搜索出可行的优化路径,将机器人导航到目标位置,并且不会与环境中的障碍物发生碰撞。
声明:
“基于无地图运动规划器的移动机器人连续控制方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)