本发明公开一种规则约束下基于深度强化学习的船舶避碰决策方法。该方法考虑船舶操纵特性,引入MMG模型,通过该模型推断船舶实时的航行信息。然后设计了分场景、考虑驾驶经验的状态空间和动作空间定义方法,并提出了避碰决策网络构建和训练框架。此外,为了充分考虑规则,设计了一套分层的奖励函数组合,并将其用于后期决策网络的训练。随后通过引入DQN算法,构建了避碰决策网络训练模型,并经过大量的训练获得了可适用于不同场景的避碰决策网络。最后,为了验证所提方法的适用性,设计了多种仿真测试场景进行了综合性能评价。该方法能够使船舶在复杂环境下安全避碰,同时保证其符合规则和良好船艺的要求。
声明:
“规则约束下基于深度强化学习的船舶避碰决策方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)