本发明提供一种基于强化学习的机器人多目标搜索路径规划方法和装置。方法包括:对机器人进行目标搜索的地图信息和状态信息进行初始化;指示机器人按照第一搜索模式开始目标搜索,并同时启动搜索计时;第一搜索模式包括规则搜索模式、随机搜索模式;判断机器人是否在其当前探测范围区域搜索到目标;若为否,则指示机器人继续按照第一搜索模式执行目标搜索;若为是,则指示机器人按照第二搜索模式执行目标搜索;第二搜索模式为:先根据机器人的环境状态,基于强化学习算法获得机器人的状态‑动作对的评价值,再根据获得的机器人的状态‑动作对的评价值确定机器人执行的下一个动作。本发明提供的技术方案可以有效提高机器人对多目标搜索的速度和精度。
声明:
“基于强化学习的机器人多目标搜索路径规划方法和装置” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)