本发明公开了一种基于多智能体强化学习的卫星观测分布式在线规划方法,所述方法包括:步骤1)为卫星观测网络中的每个卫星建立星上执行网络;步骤2)建立集中训练网络,通过多次地面仿真对所有星上执行网络进行集中训练;步骤3)通过星地通信将训练好的星上执行网络分别上传到对应的卫星,或者在发射前将训练好的星上执行网络注入对应的卫星;步骤4)当地面或者在轨卫星发现机遇观测目标时,向卫星观测网络广播观测任务;步骤5)各卫星分别使用星上决策模型对是否接受该观测任务进行决策;根据各自的决策结果,控制卫星实施观测任务。本发明提出了考虑时间覆盖度的自注意力网络决策方法,提升了卫星间的决策协同性和训练时策略梯度传递效率。
声明:
“基于多智能体强化学习的卫星观测分布式在线规划方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)