本发明公开了一种基于模仿学习的深度强化学习智能渗透测试方法及装置,该方法包括:(1)获取专家样本数据,其中专家样本数据为后渗透成功时的状态动作对;(2)利用A3C算法对智能体进行训练,其中所述智能体作为渗透测试中的模拟攻击者;(3)将智能体训练过程中由A3C算法中actor网络生成的第一状态动作对与专家样本数据中的第二状态动作对放入GAIL的discriminator网络中,进行discriminator网络的训练;(4)根据discriminator网络训练后自身输出的折扣奖励与critic网络输出的value,构造优势函数并利用所述优势函数更新A3C算法中的actor网络;(5)重复步骤(2)‑(4),直至训练回合结束;(6)将训练后的智能体设置在需要进行渗透测试的网络环境中,以进行渗透测试。
声明:
“基于模仿学习的深度强化学习智能渗透测试方法及装置” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)