本发明公开了一种基于图像隐变量概率模型的分布式强化学习社交导航方法。本发明通过引入图像隐变量概率预测模型替代传统的决定性预测模型,一方面增强模型的合理性,使得预测更逼近于存在随机性的行人运动模型,另一方面通过增强模型的探索能力来进一步加强策略性能,避免过拟合。同时,本发明通过图像序列解耦移动机器人自身运动来实现动态障碍物的判别,省去了存在不稳定性的高层行人检测模块,可以实现效果良好的迁移。另外,本发明设计了策略共享的多智能体仿真环境来模拟行人动态环境,增强仿真与真实人群交互的相似程度。环境中多智能体同步进行数据采集,因此训练时间可以得到进一步缩减。
声明:
“基于图像隐变量概率模型的分布式强化学习社交导航方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)