潜航器对于国家海洋资源的勘探和保护具有重要作用,但是因为海洋环境的特殊性,潜航器在水下工作时无法与外界进行通信,因此设计具有自主控制能力的潜航器路径规划算法是其正常工作的重要保障。本发明针对复杂海洋环境中的路径规划任务,在python仿真环境中使用decisiontransformer算法控制潜航器的运动。因为decision transformer使用轨迹序列进行动作的预测和控制,因此摆脱了传统强化学习算法对输入状态马尔可夫性的要求,可以在洋流未知的部分可观测环境中得到一个收敛的最优策略,完成既定的路径规划任务,最终得到了一种基于序列模型的海洋环境下的强化学习路径规划算法。
声明:
“基于序列模型的海洋环境下的强化学习路径规划算法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)