本公开提供了一种基于强化学习的测试数据生成方法,可以应用于人工智能技术领域。该方法包括:根据预设数据规则生成输入数据,所述预设数据规则为银行金融系统数据规则;将所述输入数据输入预设强化学习模型进行训练直至测试覆盖率达到预设阈值;确定测试覆盖率达到预设阈值时的最大Q值,所述Q值为预设强化学习模型的状态动作网络参数,所述状态动作网络参数用于表征按照指定策略执行目标操作后得到的奖惩值之和;输出所述最大Q值对应的目标操作链;以及根据所述目标操作链确定目标测试数据。本公开还提供了一种基于强化学习的测试数据生成装置、设备、存储介质和程序产品。
声明:
“基于强化学习的测试数据生成方法及装置” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)