本发明涉及人工智能技术领域,提供一种基于强化学习的业务分配方法、装置、设备及存储介质,用于提高业务分配的准确性。基于强化学习的业务分配方法包括:对基于多个参与端的机构私密数据的特征向量信息进行选择概率预测得到选择概率;通过选择概率对特征向量信息进行采样得到采样梯度信息;根据采样梯度信息,对预置业务评估联邦模型的模型参数进行更新,得到更新联邦评估模型,并通过更新联邦评估模型计算奖励值;通过预置评估器和奖励值,对特征向量信息进行价值评估,得到参与者贡献度;根据参与者贡献度,对多个参与端进行业务分配,得到参与者业务分配信息。此外,本发明还涉及区块链技术,机构私密数据可存储于区块链中。
声明:
“基于强化学习的业务分配方法、装置、设备及存储介质” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)