本发明涉及一种基于深度强化学习的拟人化自动驾驶跟驰模型,应用于自动驾驶跟驰控制领域。基于上海自然驾驶实验数据,将选取的快速路跟驰数据集分为训练数据和验证数据。使用深度确定性策略梯度(DDPG)深度强化学习方法,通过构建仿真环境以使强化学习(RL)智能体通过一系列状态、行动和奖励值与环境交互,选取评价指标,设置奖励函数,选择神经网络结构,设置神经网络更新策略及超参数,设置探索策略,构建深度强化学习的拟人化跟驰模型。通过训练并测试模型,进一步优化模型。本发明模型在轨迹复现和泛化能力方面超越了传统跟驰模型和近期数据驱动跟驰模型,在模仿人类跟驰行为方面具有更高的优越性。
声明:
“基于深度强化学习的拟人化自动驾驶跟驰模型” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)