本发明为一种基于联邦强化学习的异构软件缺陷预测方法;该方法首先使用主成分分析法(Principal Component Analysis,PCA)进行数据降维。中心服务器初始化全局参数发送给所有参与方,参与方将该全局参数作为本地强化学习dueling Deep Q Network(dueling DQN)模型的初始参数。所有参与方使用降维数据和上轮全局参数来更新本地dueling DQN模型,中心服务器随机选择参与方,选中的参与方将本地模型参数加入高斯噪声进行差分隐私加密。使用K‑means对选中的参与方进行聚类,通过本地聚合与全局聚合形成全局模型发送给所有参与方。当通信次数到达最大通信轮次或本地dueling DQN模型已经收敛,输出预测结果。本发明在保证数据隐私安全前提下通过结合多方数据模型,有效的提高了异构软件缺陷的预测效果。
声明:
“基于联邦强化学习的异构软件缺陷预测算法研究” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)