本发明公开了一种连通性保持的多机导航方法、系统及介质,方法包括:根据强化学习框架确定导航策略元素;导航策略元素包括观测数据、共享策略数据、速度控制信号、奖励信号和全局连通性信号;根据导航策略元素,构建导航策略学习模型;获取专家策略数据,结合模仿学习对导航策略学习模型进行策略去最小化处理;根据策略去最小化处理的结果,完成策略优化。本发明针对未知复杂的导航环境,提出以原始距离测量的环境感知数据作为输入的多机导航策略。通过强化学习方法,机器人在训练过程中自主学习导航多机的策略,并在连通性约束下避免个体机器人脱离队伍,可广泛应用于移动机器人技术领域。
声明:
“连通性保持的多机导航方法、系统及介质” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)