本发明公开了一种自动化测试的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:采集测试人员在进行测试时的决策轨迹数据,将所述决策轨迹数据作为专家策略;创建奖励函数的模型;将所述专家策略作为逆强化学习算法的输入,以求出使所述奖励函数的值最大的回报系数;根据所述最大回报系数对应的奖励函数,计算出最大的累积奖励函数值所对应的策略,以按照所述策略进行自动化测试。该实施方式通过逆强化学习算法设计出了奖励函数,进而得出对应专家策略的策略,按照该策略进行自动化测试,一方面节省了测试资源,另一方面在测试深度和覆盖广度上可以跟测试人员的测试效果相接近。
声明:
“自动化测试的方法和装置” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)