本发明提供一种基于深度强化学习的自动化网络安全检测方法,所述方法包括:构建环境信息获取模块,所述环境信息获取模块用于从待测网络和待测主机中扫描环境信息;基于所述环境信息获取模块,获取从环境中扫描到的基本信息,构建能够被智能体理解的待测环境状态矩阵;构建智能体;基于获取的所述待测环境状态矩阵及奖励模块的奖励信息,确定智能体的行为策略;基于智能体的行为策略,采取行为,确定行为在待测环境中的执行结果和影响,更新所述奖励模块的奖励信息,指导智能体更新神经网络参数。根据本发明的方案,实现有效的对网络环境进行自动化网络安全检测,以解决人工网络安全检测成本高,专业技术要求高的问题。
声明:
“基于深度强化学习的自动化网络安全检测方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)