本发明公开一种基于强化学习的智能模糊测试方法、装置及系统,所述方法包括:收集到模糊测试中不同种子的程序运行状态后,使用聚类算法对各个程序运行状态进行分类,得到分类结果,并根据所述分类结果得到各个种子状态,所述种子状态为类别标签;收集模糊测试中的历史变异数据;根据所述历史变异数据和所述种子状态进行强化学习,得到变异策略,所述变异策略包括种子状态与变异动作的选择概率分布的映射关系。通过学习,在需要进行动作选择时,将种子输入到变异策略构建的策略网络中,输出变异动作选择策略,使用智能的变异动作对种子进行变异,能够提高能够覆盖更多的程序运行状态的种子的权重,充分探索测试用例,发现更多的安全漏洞。
声明:
“基于强化学习的智能模糊测试方法、装置及系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)