本申请提供一种列车追踪控制方法、设备、存储介质,该方法构建强化学习模型,强化学习模型包括数据预测模型和目标函数;获取当前策略序列,策略序列与动作对应;根据数据预测模型,预测当前策略序列对应的动作在下一时刻的状态;根据下一时刻的状态,生成对应的下一时刻策略序列;根据目标函数,从下一时刻策略序列中选择目标策略序列;基于目标策略序列进行列车追踪控制。本申请的方法基于数据预测模型和目标函数进行列车追踪控制,可以有效解决现有控制算法针对复杂系统精确建模困难、参数整定不易以及动态参数调整等问题。
声明:
“列车追踪控制方法、设备、存储介质” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)