本发明涉及一种强化学习自动驾驶测试方法及系统,本发明首先由驾驶员驾驶自动驾驶车辆在特定场景下进行失效场景驾驶测试,车辆的自动驾驶系统进行环境数据和自车数据采集,然后根据采集的环境数据和自车数据构建虚拟环境用以模拟真实环境下的车辆行驶信息与环境信息,最后通过强化学习模块与虚拟环境的交互反馈学习,得到自动驾驶系统失效场景下的自动驾驶参考控制数据。本发明利用真实的失效场景,构建成虚拟环境,将虚拟失效场景数据输入到强化学习框架,逐渐训练出针对特定场景的安全策略,最终改善该事故场景下自动驾驶车辆的安全性,达到减少自动驾驶车辆事故的目的。
声明:
“强化学习自动驾驶测试方法及系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)