本发明公开了一种考虑累积误差的AUV强化学习路径规划方法,首先计算AUV运行的累积误差,再计算累计误差的期望和方差,最后采用Q‑Learning强化学习路径规划方法,并更改奖励策略,对AUV沿着直线运动的动作进行奖励,对AUV的转弯动作不作奖励惩罚;在每次迭代过程中生成每条路径的累积误差统计分析,选择累积误差最小的路径作为规划结果,生成最佳路径。本发明使AUV在路径规划中定性和定量分析生成路径的累积误差统计,实现在规划和控制的整个过程中有效减小定位误差累积。
声明:
“考虑累积误差的AUV强化学习路径规划方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)