本发明公开了一种基于场景区分的深度强化学习训练方法及系统,包括以下步骤,将测试车辆接入仿真环境中并随意行驶;数据采集模块收集所述仿真环境中不同位置的街道图像数据集;利用U‑net网络模块对进行语义分割的训练;识别模块在线识别不同的道路情况;在不同的场景中分别设定符合各个场景的Reward值,分别进行针对性的训练;训练完成后模型部署使用。本发明的有益效果:通过减少算法模型学习如何区分各个场景的时间,来减少基于车辆行驶仿真软件中数据进行算法训练时间,可以快速验证车辆辅助驾驶/自动驾驶,能够明显降低算法模型在低效率探索上花费的时间,从而大大降低开发时间,提高训练性能。
声明:
“基于场景区分的深度强化学习训练方法及系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)