视觉关系通常表示为一个三元组<subject,predicate,object>,其中包含两个物体subject和object及它们之间的交互动作predicate。视觉关系学习是连通低水平的图像感知任务和高水平的图像认知任务之间的一道桥梁,属于中等水平的图像理解任务。视觉关系实例学习是在给定图像及对应的视觉关系集合的情况下,确定每个视觉关系中涉及到的两个物体实例的问题。本发明将该问题建模成两个智能体关于subject和object的两个实例搜索框在图像上进行搜索时的序列决策过程,从而提出了一种基于深度强化学习的视觉关系实例学习方法。对于给定的测试图像及关联的视觉关系集合,能够快速准确地找到每个视觉关系中subject和object物体所对应的实例框。
声明:
“基于强化学习的视觉关系实例学习方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)