本发明提出一种基于强化学习的跨域异构集群路径规划方法,通过添加集群的特征作为个体观测输入,并通过面向集群路径规划而设定的奖励函数,使得跨域的集群个体能够在保持安全距离的前提下,进行路径规划。本发明构建了跨域异构集群机动的马尔科夫决策过程和奖励函数,利用MADDPG算法求解集群个体机动策略,从而实现跨域异构集群的路径规划。只要集群个体具备相关的传感器,即能通过本发明的方法实现路径规划。该方法下,来自空域、海域、陆域等域的不同航行器可以共同地进行路径规划,从而实现“跨域异构路径规划”。
声明:
“基于强化学习的跨域异构集群路径规划方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)