本发明提出了一种基于拟合强化学习的空战行为建模方法,解决了虚拟空战仿真中战术动作的智能决策问题。本方法包含:对飞机作战过程的轨迹进行采样;在状态空间中对效用函数进行拟合,通过贝尔曼迭代和最小二乘法拟合对效用函数进行近似计算;作战决策,通过前瞻测试,在预测过程中采用所拟合的效用函数进行动作决策,根据预测的执行结果确定最终执行的动作。本发明方法可有效提高效用函数的拟合效率以及获取效率,相对传统方法,本发明方法能更快地获取最优行动策略。
声明:
“基于拟合强化学习的空战行为建模方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)