本发明公开了一种基于深度强化学习的目标检测方法、装置和存储介质,客户端获取到采样视频后,从采样视频中获取采样图像,并将采用图像输入至预先训练好的深度Q网络中,并且在深度Q网络中引入了折扣因子,所述学习率随折扣因子的增大而减小,能够使得折扣因子在训练的过程中逐渐逼近其终值,从而加快模型的收敛,降低了过拟合的现象,提高了系统的稳定性。
声明:
“基于深度强化学习的道路目标检测方法、装置及存储介质” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)