本发明提供了一种无人车的自主避障方法及装置、电子设备、可读存储介质,包括:获取当前状态信息;根据当前状态信息和历史状态信息,避障网络产生预测评价高的动作信息;执行该前动作信息,重复上述过程,直至到达目的地;其中,避障网络包括动作生成网络和策略评价网络;前者根据当前状态信息和历史状态信息,得到融合状态信息;再根据融合状态信息预测当前动作信息;后者根据回报值、融合状态信息和当前动作信息,得到当前动作信息的预测评价;根据该预测评价调整后续的动作产生策略。本发明通过在强化学习中引入循环神经网络和注意力机制对过去的异常状态给予更高的关注度,使无人车凭借对以往异常状态的记忆,作出有效避障。
声明:
“无人车的自主避障方法及装置、电子设备、可读存储介质” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)