本发明公开了一种基于深度强化学习的智能移动平台无地图自主导航方法,在AI2‑THOR仿真框架中选取导航场景;构建基于Actor‑Critic框架的深度强化学习模型;根据动作概率分布进行移动平台与导航场景的动作交互,更新奖励值和当前观测信息,若当前观测信息与目标图像信息匹配,或达到最大移动步数,或连续采取动作数达到设定步数,则更新模型参数,否则继续动作交互;构建Actor‑Critic网络的损失函数,采用异步优势算法A3C训练更新深度强化学习模型;重复训练,直至训练步数达到设定阈值;获取实际导航场景的初始观测信息与目标图像,利用训练好的模型进行导航,规划智能移动平台的导航路径。本发明无需提前构建环境模型,即可实现显示环境的导航。
声明:
“基于深度强化学习的智能移动平台无地图自主导航方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)