本发明公开了一种基于强化学习的入侵检测方法,包括对入侵检测环境进行建模,在入侵检测环境内模拟出一个马尔科夫过程,将强化学习模型用于入侵检测的分类检测环境当中,通过强化学习学习出最优的分类策略,将分类正确率作为强化学习模型中的奖赏函数,建立基于入侵检测马尔科夫过程的Bellman方程,采用基于γ折扣累计奖赏的策略评估算法计算最优解,可以确定入侵检测中正常行为和非正常行为的阈值,有利于不断地使得正常行为序列得以补充,最终提高入侵检测的检测率,降低误报率和漏报率,最终提升整个入侵检测系统的性能。
声明:
“基于强化学习的入侵检测方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)