本发明公开一种基于分层强化学习的四足机器人运动规划方法,该方法通过构建基于深度强化学习的上层行为决策控制器以及基于模型预测控制的下层运动执行控制器;对于上层的深度强化学习网络,基于SAC算法设计四足机器人的状态更新网络、动作执行网络以及奖励函数等,结合机器人周围的环境高度图信息输出对应的行为控制参数;对于下层执行控制器中的模型预测控制器,通过求解基于上层输入的控制参数二次规划方程组来获取对应的控制指令。该分层控制框架结合了深度强化学习与模型预测控制的优势,使四足机器人能够根据当前机身状态以及地形环境做出更安全可靠的行为模式,保持机身姿态平稳,从而有效规避风险,实现在复杂地形下的有效运动轨迹规划。
声明:
“基于分层强化学习的四足机器人运动规划方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)