本发明公开了一种对抗样本生成方法、装置、终端及可读存储介质,所述方法包括:基于对抗样本生成策略确定本次采样对应的目标教师模型以及目标攻击算法,基于目标教师模型以及目标攻击算法进行强化学习,得到中间对抗样本,并基于所述中间对抗样本优化对抗样本生成策略,基于中间对抗样本确定参与学生模型训练的对抗样本,基于优化后的对抗样本生成策略进行迭代强化学习训练,直到检测到迭代停止条件,迭代强化学习训练结束。通过强化学习算法针对当前学生模型动态地找到攻击强度最大的一种或几种攻击算法以及对应的参数,进而高效生成包含难样本的对抗样本用来训练学生模型,在加速模型训练的同时,显著提升了模型面对攻击的鲁棒性。
声明:
“对抗样本生成方法、装置、终端及可读存储介质” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)