本发明提供一种基于强化学习的对抗性视频时刻检索方法、装置、计算机设备和存储介质,输入完整视频和查询语句作为强化学习代理的环境信息;提取所述环境信息的查询语句特征、全局视频特征、位置特征和局部视频特征构成当前的视频时刻片段的状态;所述强化学习代理根据所述状态作出在所述时序边界移动的动作,获取执行所述动作的奖励以及根据所述奖励输出若干个更新的时序边界和局部视频特征,所述时序边界为更新后当前的视频时刻候选片段;通过贝叶斯个性化排序方法对所述时序边界和所述查询语句进行匹配,输出匹配分值,并将所述匹配分值作为奖励返回所述强化学习代理;通过对抗学习相互增强,直到收敛,得到对应所述查询语句的视频时刻片段。
声明:
“基于强化学习的对抗性视频时刻检索方法、装置、计算机设备和存储介质” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)