本发明公开了一种应用于危化品环境下多机器人路径规划方法,属于机器人路径规划技术领域。此方法应用于智能机器人,可以在动态性强的复杂危化品环境下进行多机的全地图巡检,并对特殊事件实时编队反应。该方法的核心算法是好奇心驱使算法与深度确定性策略梯度相结合的深度强化学习算法,该算法避免了同类算法中人工设计环境奖励这一复杂繁琐的步骤,而是通过智能体自身内在奖励与稀疏的环境奖励对未知复杂环境进行探索、适应;同时,多机器人之间采用多Agent协作学习算法获得最优的协同工作策略。
声明:
“应用于危化品环境下多机器人路径规划方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)