本发明公开了一种数据驱动的无人船强化学习控制器结构及设计方法,所述的控制器结构包括未知信息提取模块、预测模型生成模块、奖励函数模块和滚动时域优化模块。本发明是基于数据驱动的,无需对被控无人船进行精确数学建模。控制器仅利用未知信息提取模块收集无人船的控制输入与输出状态数据信息并提取到动力学未知函数,通过预测模型生成模块对提取信息进行重构得到预测模型,控制器不依赖于精确无人船人工建模。本发明不需要针对运动学与动力学两级分别设计不同的控制器。通过预测模型和设定的奖励函数,对控制输入进行滚动时域优化达到最优的控制效果。本发明同时适用于全驱动无人船与欠驱动无人船。
声明:
“数据驱动的无人船强化学习控制器结构及设计方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)