本发明公开了一种深度强化学习指导下基于连续移动的视觉跟踪方法及装置,其中,方法包括:预训练预测网络;根据预测网络生成多个动作并得到相应的奖励;获取多个动作的每个动作的Q值,同时更新预测和生成动作的网络。该方法可以将连续地并且累积地调整物体的目标框,同时动态地调整目标物体的外观特征和模型,大大提高鲁棒性。
声明:
“深度强化学习指导下基于连续移动的视觉跟踪方法及装置” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)