本发明是基于强化学习而在自动驾驶时优化资源分配的方法及装置。本发明涉及用于自动驾驶车辆的优化资源分配所需的方法及装置。更详细而言,其特征在于,包括:(a)步骤,计算装置获得至少一个注意力传感器数据后,使注意力网络计算一个以上的注意力分值;(b)步骤,所述计算装置使探测网络至少一个视频数据,并参照所述视频数据,生成至少一个自动驾驶用判断数据;(c)步骤,所述计算装置使驱动网络获得表示行驶中的所述自动驾驶车辆周边情况变化的至少一个情况数据,并参照所述情况数据,生成至少一个奖励;(d)步骤,所述计算装置使所述注意力网络,以所述奖励为参照,调整所述神经网络运算中使用的一个以上参数的至少一部分。
声明:
“基于强化学习而在自动驾驶时优化资源分配的方法及装置” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)