本申请涉及航空机器学习领域,为一种免模型强化学习的软件测试方法,包括根据要测试的功能集,构建测试条件集C,构建被测软件的观测空间O,构建测试动作空间A,形成测试模拟环境;构建对动作序列执行效果进行奖赏的奖赏函数;构建能够作用于软件本身的动作执行驱动接口;构建能够自我学习的测试策略网络;构建免模型的强化学习损失函数;驱动测试策略网络实时生成软件操作动作并通过动作执行驱动接口作用于软件,进行计算并记录数据元组,存入数据集;所述强化学习损失函数利用数据集优化测试策略网络参数。具有测试效率高、测试时间短、准确性高的技术效果。
声明:
“基于免模型强化学习的软件测试方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)