本发明公开了一种基于模仿与强化学习的医药机器人自主避障方法及系统,该方法包括:步骤1:设置医药机器人医药搬运场景;步骤2:获取专家演示二元组数据;步骤3:构建基于模仿学习和强化学习的医药机器人移动控制模型;步骤4:模型训练;步骤5:对医药机器人进行自主控制。本发明在医药机器人移动控制模型中将图注意模块引入价值网络中,使能够适应智能体和障碍物数量不确定的不同环境,同时,区分了医药机器人可观测范围内不同智能体和障碍物对移医药机器人的影响,使其能够更好地做出决策。只需一组网络参数就可以适用于处理各种情况,即网络具有较好的泛化性。
声明:
“基于模仿与强化学习的医药机器人自主避障方法及系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)