本发明公开了一种基于深度强化学习的恶意PDF文件对抗样本生成方法,涉及信息系统安全技术领域。本发明基于强化学习的PDF对抗样本生成方法使用强化学习模型从已有的探索经验中形成快速寻找下一个最佳修改动作的策略,根据检测器返回的分类结果选择合适的修改动作执行黑盒攻击,而不依赖于对检测器特征集合的先验知识,克服了启发式算法的缺陷并在实际情景下具有可行性。同时,通过自动寻找最优修改动作修改给定的PDF文件,生成可逃逸检测器检测的对抗样本,并采用离线训练与在线微调的方式轻量化更新生成模型,使得模型保持对不断进化的PDF恶意软件和检测器的有效性,从而暴露检测器缺陷、提高机器学习检测器的鲁棒性。
声明:
“基于深度强化学习的恶意PDF文件对抗样本生成方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)