本发明公开了一种基于深度强化学习的服务机器人行人感知避障方法,涉及深度学习和服务机器人避障领域。该方法在训练阶段:首先,使用ORCA算法生成训练数据。然后,随机生成实验场景,使用初始化后的强化学习模型与环境交互生成新的训练数据,并融合进原有训练数据。最后,在新的训练数据上利用SGD算法训练网络,得到最终的网络模型。该方法在执行阶段:通过激光雷达获取周围行人的状态,根据训练好的模型和奖励函数计算预测状态,选择获得最大奖励的动作作为输出并执行。本发明具有很强的实时性和适应性,在行人环境下,可以使机器人遵守行人的右行规则,规划出高效、安全、自然的路径,提升了服务机器人的智能性和社交性。
声明:
“基于深度强化学习的服务机器人行人感知避障方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)