本发明公开一种最小化信息年龄的无人机路径动态规划方法,包括以下步骤:首先将无人机动态轨迹规划问题描述为具有非均匀时间步长的部分可观测马尔可夫决策过程,其中有效动作集与智能体的观测是耦合的,然后设计了一种深度递归强化学习算法来寻找最小化加权平均信息年龄期望值的策略,其中,利用改进的折现机制处理来自非均匀时间步长的挑战,并引入动作剔除机制来解决有效动作与观测之间的耦合问题;本发明设计了一种基于深度递归强化学习的轨迹规划算法,从而最小化基站处的加权平均信息年龄期望,通过使无人机学习到环境的动态变化并基于此做出明智的决策,通过对比,我们提出的算法的性能明显优于基准策略。
声明:
“最小化信息年龄的无人机路径动态规划方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)