本发明通过网络安全领域的方法,实现了一种基于双注意力模型的图像描述方法。采用“编码器‑解码器”框架结构完成图像描述研究任务,将卷积神经网络+长短期记忆网络+注意力机制结合的框架;首先构建编码器,借助ResNeXt‑101网络和目标检测器Faster R‑CNN来构建新的编码器模型以此获取待测图像的目标区域并进行特征提取;之后构建解码器,使双注意力机制和双层LSTM构建新的解码器来生成图像的描述语句;最后对模型进行优化,采用REINFORCE强化学习算法对模型进行优化。本发明提供的方法能够有效的提高图像描述模型的准确率以及图像描述内容的丰富度,提高图像描述模型的整体性能。
声明:
“基于双注意力模型的图像描述方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)