本发明提供了一种基于深度强化学习的六足机器人实时步态规划方法,步骤包括:由六足机器人获取环境路况信息并制定整体的运动轨迹;通过摄像头获取环境的照片,再根据照片利用双目测距方法计算出目标轨迹的路况信息,并将计算出的轨迹路况信息用于机器人质心运动轨迹导航;在机器人腿的足端摆动空间范围内,拍摄路况环境的照片,并通过预先训练过的基于深度确定性策略梯度(DDPG)的深度强化学习网络对照片进行数据降维和特征提取;根据特征提取结果得出六足机器人的控制策略,六足机器人根据控制策略来控制机器人的落足,实现六足机器人的实时行走。该步态规划的方法能够对路况复杂的非结构环境进行实时规划,对提高六足机器人的环境适应能力具有重要意义。
声明:
“基于深度强化学习的六足机器人实时步态规划方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)