本发明提供一种基于DRL的四足机器人路径规划方法,首先通过四足机器人自带的RGB‑D相机对环境进行预扫描,基于栅格法对运动环境进行建模得到环境地图,进而分解为一系列具有二值信息的栅格单元,得到初始状态,将其作为深度卷积神经网络的输入,引入注意力机制优化网络结构以解决深度强化学习DQN算法未能很好利用关键局部信息的问题;通过端对端训练,结合四足机器人的运动特点设置奖励函数,利用置信区间上界探索策略对神经网络进行训练,得到四足机器人所能够执行的八个动作的Q值;最后运用人工势场算法不断探测环境中的动态障碍物并进行实时避碍,实现有效的四足机器人路径规划。
声明:
“基于DRL的四足机器人路径规划方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)