本发明公开了一种基于高斯强化学习的信号源遍历方法。首先离散化任务环境,并在离散化的环境中,确定每一个方格的中心位置;然后,根据当前检测到的信号强度信息和历史检测到的信号强度信息,采用高斯过程方法预测区域内每一个方格中心位置的信号强度信息,并将该信号强度信息作为强化学习中对应的奖励函数;根据奖励函数,计算每一个方格的状态值函数,并依据状态值函数,采用滚动优化思想,得到最优方格序列,并将第一个方格作为四旋翼无人机下一步的目标位置;开发了预测控制方法,能够根据目标位置,控制四旋翼无人机沿着光滑的轨迹到达目标位置,最后完成信号源遍历任务。本发明采用的方法可以有效提高信号源遍历速度,缩短飞行路径。
声明:
“基于高斯强化学习的信号源遍历方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)