本发明实施例公开了一种报价的确定方法、装置、设备及存储介质。该方法包括:获取目标资源的被测状态参数和被测资源参数,其中,所述被测资源参数包括至少一个被测报价系数;将所述被测状态参数和被测资源参数输入到预先训练完成的目标报价模型中,得到输出的目标报价系数和与所述目标报价系数对应的目标收益,其中,所述目标报价模型基于深度强化学习算法训练得到。本发明实施例通过基于深度强化学习算法训练目标报价模型,解决了不完全信息影响报价准确度的问题,为目标资源的供应商提供最优的报价决策,以使得供应商的市场收益最大化。
声明:
“报价的确定方法、装置、设备及存储介质” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)