本发明提供了一种基于深度强化学习的无人矿卡循迹控制系统及方法,在学习阶段下,通过仿真平台接收环境状态信息、控制动作信息模拟无人矿卡的循迹过程,采集无人矿卡在预设路线上各个时刻的状态,将各个时刻的状态作为输入量,各个时刻控制动作信息作为输出量进行深度强化学习训练,得到算法内核;在应用阶段下,获取无人矿卡当前时刻的状态和下一时刻的目标状态至算法内核;基于算法内核预测出当前时刻的控制动作信息。本发明能够实现无人矿卡运动轨迹的精确控制,可在不同工况、不同工作环境和状态下按照深度强化学习训练出来的算法进行自动循迹,具有高度智能化、自我学习、自我适应的特性;提高了矿卡循迹控制的效率,且可以减少燃油消耗量。
声明:
“基于深度强化学习的无人矿卡循迹控制系统及方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)