本发明公开了一种基于课程强化学习的游戏跟随方法和系统,包括:获取游戏接口,建立训练环境并定义课程导航任务;采用策略梯度的强化学习算法训练策略;将地图上所有可到达的点分别作为起点和目标点对策略进行测试。本发明通过对课程导航任务的训练,建立一种根据环境状态直接给出动作指令的跟随策略,解决了现有技术中跟随灵活性差,对复杂地形适应性差的问题。
声明:
“基于课程强化学习的游戏跟随方法和系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)