本发明提供了一种基于主动强化学习的装备目标识别方法及人机智能体,通过获取目标单元的时间态势,并进行特征向量编码,输入神经网络模型进行训练,在每个时间点模型自动推断是否需要引入人类经验指导进行学习训练,并得到每个目标单元在各时间步的目标预测结果及一个时间片段的目标分类结果,最后根据奖赏值对网络模型进行更新。本发明通过将人类经验指导引入机器的目标分类学习中,根据训练数据的模型输出结果自动推断出如何识别目标类别,经实验验证,在引入人类经验指导的模型训练后,可以实现更精确的目标分类,大大减少了人力消耗。
声明:
“基于主动强化学习的装备目标识别方法及人机智能体” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)