本发明公开了一种自动驾驶汽车强化学习方法、系统、装置及存储介质。自动驾驶汽车强化学习方法包括:根据真实交通场景数据构建仿真交通场景;根据仿真交通场景生成第一行为;根据仿真交通场景生成第二行为;设置偏差;根据第一行为、第二行为和偏差,采用数字孪生技术训练自动驾驶汽车的强化学习模型。本发明通过构建符合真实交通场景数据的仿真交通场景,并根据仿真交通场景设置第一行为和第二行为,使得交通场景中各车辆的行为考虑到了真实交通场景中的驾驶习惯和随机事件;通过设置偏差,并采用数字孪生技术进行训练测试,避免了真实环境中自车执行器控制延迟带来的性能影响,进一步提高了仿真交通场景的真实性和强化学习模型的可靠性。
声明:
“自动驾驶汽车强化学习方法、系统、装置及存储介质” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)