本发明公开了一种深度强化学习模型对抗攻击的防御方法,通过训练样本观测数据内部统计规律,基于所得的概率分布模型,产生与原始样本同分布的样本,使模型能抵御不同类型的对抗攻击,较之其他防御算法,本发明提供的防御方法在保证防御效果的基础上,具有更强的泛化能力和鲁棒性。此外,本发明的对抗样本是在原始样本基础上加入扰动后生成,再将对抗样本中的扰动去除重构为原始样本,因此本发明提供的防御方法更具可解释性。样本数据形成了一个从对抗攻击到防御的闭环,满足循环一致性的原则。
声明:
“深度强化学习模型对抗攻击的防御方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)