本发明涉及行人轨迹预测与分析技术领域,尤其涉及一种基于融合逆强化学习的轨迹预测方法,包括S1、基于输入的观测轨迹和场景图生成路径奖励地图和终点奖励地图;S2、利用逆强化学习算法对策略采样得到路径;S3、利用全卷积网络进行路径位置编码,融合双向门控循环单元对场景路径编码,融合场景路径和行人观测轨迹。本发明通过引入轻量化的特征提取ENet网络,减少了算法参数量,提升了算法理解场景的泛化能力;利用场景的注意力机制模块,更好的融合场景信息和行人观测轨迹,场景导向的行人轨迹预测网络S2Tirl相较于主流算法在公共数据集和实际数据上都取得了更好的效果。
声明:
“基于融合逆强化学习的轨迹预测方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)