合肥金星智控科技股份有限公司
宣传

位置:中冶有色 >

有色技术频道 >

> 化学分析技术

> 基于Q学习模型的结果推送方法和系统

基于Q学习模型的结果推送方法和系统

933   编辑:管理员   来源:中冶有色技术网  
2023-03-19 08:56:59
本发明涉及一种基于Q学习模型的结果推送方法和系统,包括以下步骤:将状态st、推送结果at,下一状态st+1和奖励值rt+1组成一个数据组,并将其存储至经验池D中;从经验池D中提取若干数据组,计算网络参数下的全梯度均值,此时的网络参数为锚点网络参数;随机提取上一步骤中的数据组,并计算其在当前网络参数下和锚点网络参数下的目标Q值和梯度值,将梯度值和全梯度均值带入方差缩减公式实现梯度更新;重复上述步骤直至训练结束,获得最终的Q学习模型,将待测状态输入最终的Q学习模型获得最佳推送结果。其通过将方差缩减技术引入到随机梯度下降的Q学习模型中,提高了强化学习的训练过程的稳定性。
声明:
“基于Q学习模型的结果推送方法和系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)
分享 0
         
举报 0
收藏 0
反对 0
点赞 0
标签:
化学分析
全国热门有色金属技术推荐
展开更多 +

 

中冶有色技术平台微信公众号
了解更多信息请您扫码关注官方微信
中冶有色技术平台微信公众号中冶有色技术平台

最新更新技术

报名参会
更多+

报告下载

第二届关键基础材料模拟、制备与评价技术交流会
推广

热门技术
更多+

衡水宏运压滤机有限公司
宣传
环磨科技控股(集团)有限公司
宣传

发布

在线客服

公众号

电话

顶部
咨询电话:
010-88793500-807
专利人/作者信息登记