本发明涉及视频监控技术,具体涉及一种目标跟踪的方法。本发明主要是基于强化学习算法实现一种单目标跟踪方案,将每个目标的每个跟踪作为策略问题对待。通过跟踪的状态(reward)来优化控制策略(policy),进而对深度学习网络进行训练。本发明结合Siamese网络结构和RL方案,相较于一般的RL方案直接基于扣取图像进行目标预测,使用目标模板与图像进行相关特征进行预测,能够使用目标的周边信息,提高目标的语义背景区分能力,提高跟踪的鲁棒性。本发明本发明同时使用DQN进行跟踪,对价值函数的估计及策略的优化没有解藕,容易训练不收敛或者过拟合。
声明:
“目标跟踪的方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)