本申请提供的基于强化学习的检测模型训练方法及相关装置中,模型训练设备利用强化学习的思想,基于当前构建策略为多个初始模型构建不同的损失函数,用于训练出多个候选模型;然后,从多个候选模型中确定出训练效果最好的作为目标模型;并根据目标模型对病灶的识别精度更新构建策略;以及将目标模型复制多份作为下一轮迭代周期的多个初始模型。如此,经过至少一轮的迭代,获得满足预设条件的病灶检测模型。因此,在以上训练过程中,自动最优地选择损失函数,从而能够避免人为选择损失函数所引入的主观影响,从而在一定程度上提升所训练病灶检测模型的泛化能力。
声明:
“基于强化学习的检测模型训练方法及相关装置” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)