本发明提供了一种基于联邦强化学习的卫星资源调度优化方法,将对地观测卫星资源调度优化问题抽象为一个离散马尔可夫决策问题,应用联邦强化学习算法求解对地观测卫星资源调度最优解,本发明利用联邦学习和强化学习技术,挖掘对地观测任务与卫星资源之间隐含的内在关联关系,充分挖掘各个智能体在训练过程中各种有关联的特征指标,形成了高效高质量的全局调度优化模型,最终生成最优无冲突的对地观测卫星资源调度优化方案,且该优化方法有效的降低了卫星资源调度优化中对调度启发式规则和人工历史分配经验的依赖,提高资源调度方法的有效性和准确性,可显著提高对地观测卫星资源调度的智能化管控水平。
声明:
“基于联邦强化学习的卫星资源调度优化方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)