一种基于强化学习和好奇心的迷宫机器人路径规划方法,属于移动机器人技术领域。该模型以强化学习为基础,包括Q‑learning算法,好奇心算法,以及回溯强化。其中,好奇心算法包括一个BP网络,联想记忆网络和内部奖励三部分。算法首先感知所在节点以及状态;随后根据好奇心算法进行好奇心奖励计算,而后根据Q‑learning算法更新公式计算Q值;选择动作;发生状态转移;到达目的地后进行回溯强化;重复以上过程直至学习到最短路径。本发明引入基于预测误差的好奇机制,使得算法对未知环境有更好的探索能力,同时也降低了重复探索的次数,减少了学习过程中的寻路时间。使得机器人在迷宫中能更好更快地寻得最优解。
声明:
“基于强化学习和好奇心的迷宫机器人路径规划方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)