本申请属于人工智能技术领域,具体涉及一种信息处理方法、信息处理装置、计算机可读介质以及电子设备。该方法包括:根据信息展示请求获取由多个候选信息组成的候选信息集合,候选信息包括根据资源付出量竞争展示机会的竞争展示信息以及具有约定展示数量要求的约定展示信息;根据资源付出量确定各个竞争展示信息的信息排序分数,信息排序分数用于表示候选信息的展示优先级;通过策略网络模型对约定展示信息进行分数预测处理,得到各个约定展示信息的信息排序分数;策略网络模型是基于多个并行的模型训练进程训练得到的强化学习模型;根据信息排序分数在候选信息集合中选取待展示的目标信息。该方法可以提高信息处理效率和网络资源利用率。
声明:
“信息处理方法、装置、计算机可读介质及电子设备” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)