本发明公开了一种基于强化学习的声呐图像目标识别方法,包括:(1)将卷积神经网络的层选择过程建模为马尔科夫决策过程;(2)定义强化学习Agent的状态空间和动作空间;(3)使用强化学习Q‑Learn i ng算法让Agent自动构建出一系列的卷积神经网络;(4)从自动生成的卷积神经网络中选出表现较好的网络模型,调整参数并迁移到目标检测网络中,如摘要附图所示;(5)用声呐图像数据集对整个目标检测网络进行监督式训练,完成声呐图像的目标识别工作,基于强化学习的Q‑Learn i ng算法来自动化卷积神经网络的构建过程,省去了大量手工调参投入,得到性能良好的卷积神经网络,提高声呐图像识别的工作效率。
声明:
“基于强化学习的声呐图像目标识别方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)