本发明涉及一种基于强化学习的无人艇混合感知自主避障方法及系统,该方法包括以下步骤:1)搭建海洋环境;2)根据无人艇推进器情况设置动作空间,根据静态海图提供的全局规划信息与雷达系统探测半径范围内的障碍物信息学习得到强化学习状态编码;3)设置奖励目标权重,获得综合奖励函数;4)搭建并训练评价网络与策略网络;5)将强化学习状态编码分别输入至评价网络与策略网络,将综合奖励函数输入至评价网络,根据学习到的策略网络的均值对应的动作,决定控制器的输出。与现有技术相比,本发明具有高度自我学习的能力,可以经过简单的部署训练适应不同大规模复杂环境,进而实现自主感知、自主导航、自主避障。
声明:
“基于强化学习的无人艇混合感知自主避障方法及系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)