本发明公开了一种面向动态噪声环境的全覆盖任务分配方法。先构建由机器人节点和中心控制节点构成的多机器人环境;机器人节点装有感知信息获取模块、输入状态估值模块、位置关系判定模块、交互权重估计模块和动作估计模块;中心控制节点装有环境状态监测模块、经验采集模块和网络更新模块;感知信息获取模块获取局部视图,输入状态估值模块得到输入状态估值向量和编号独热编码向量,位置关系判定模块计算邻接特征矩阵集合,交互权重估值模块计算邻接加权向量,动作估计模块挑选估值最大动作作为决策;中心控制节点采用强化学习方法对各模块中网络进行优化;本发明边执行边优化,不但任务分配准确高效,且机器人下次执行任务时间更短。
声明:
“面向动态噪声环境的全覆盖任务分配方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)