一种基于强化学习的AUV行为规划及动作控制方法,属于水下机器人技术领域。为了解决AUV规划复杂任务时过于依靠人工经验,以及基于智能算法设计的控制方法需要精确的环境模型,从而导致训练经验局限,在现实环境中应用困难的问题。本发明将AUV探测隧洞定义为总任务;完成任务对应的行为包括:趋向目标、墙壁跟踪和避障;将机器人在水下需要完成所规划的行为而产生的控制指令定义为动作;AUV在执行隧洞探测任务时,使用深度强化学习DQN算法进行实时行为规划,构建对应的深度学习的行为网络,完成隧洞探测任务的规划。通过DDPG方法训练AUV的动作网络,将AUV视为环境模型,得到力到状态的映射,从而实现AUV的动作控制。
声明:
“基于强化学习的AUV行为规划及动作控制方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)