本发明属于工程机械及车辆工程领域,具体涉及一种基于深度强化学习的换挡策略动态优化方法。包括如下步骤:(1):确定换挡策略状态输入变量和动作输出变量;(2):根据状态输入变量和动作输出变量,确定换挡策略马尔科夫决策过程;(3):根据换挡策略目标建立强化学习换挡策略奖励函数;(4):根据马尔科夫决策过程和奖励函数,求解深度强化学习换挡策略;(5):将步骤(4)计算出的预测Q网络放入换挡策略控制器,工程机械及车辆在行驶过程中,工程机械及车辆根据换挡策略控制器选择挡位;(6):在行驶过程中定期更新预测Q网络。本发明通过深度强化学习方法对换挡策略进行更新,实现换挡策略的动态优化。
声明:
“基于深度强化学习的换挡策略动态优化方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)