基础金属	铜电解铜铜精矿铜管铜棒废铜铜排铜合金精铜杆再生铜杆铜板带铝铝土矿氧化铝电解铝铝辅料铝棒铝合金锭废铝铝杆铝型材铝板卷铅铅精矿铅锭铅蓄电池再生精铅还原铅废铅蓄电池铅合金锌锌精矿电解锌锌合金氧化锌锌粉锡锡精矿锡锭锡材镁兰炭硅铁镁锭
稀有金属	稀土稀土矿稀土氧化物稀土金属钕铁硼稀散金属锑铋铟锗镓硒钽铌锆贵金属白银钨钨精矿 APT(仲钨酸铵)钨粉碳化钨钨酸钠钨条钨铁钨材钼钼精矿工业氧化钼钼铁钼化工高纯三氧化钼钼金属钛钛精矿钛渣四氯化钛海绵钛钛金属钛白粉
新能源	锂锂矿锂化合物金属锂镍镍矿镍铁精炼镍镍盐高冰镍 MHP 钴电解钴钴粉氯化钴四氧化三钴硫酸钴钴中间品氧化钴碳酸钴钴酸锂锰锰矿电解锰电池级硫酸锰锂电正负极三元前驱体磷酸铁正极材料石油焦针状焦包覆沥青人造石墨硅碳负极硅氧负极电解液隔膜隔膜电解液电芯硅硅石有机硅硅粉三氯氢硅工业硅再生硅光伏多晶硅硅片电池片组件组件成本指数海外组件废旧组件

基础金属

铜电解铜铜精矿铜管铜棒废铜铜排铜合金精铜杆再生铜杆铜板带铝铝土矿氧化铝电解铝铝辅料铝棒铝合金锭废铝铝杆铝型材铝板卷铅铅精矿铅锭铅蓄电池再生精铅还原铅废铅蓄电池铅合金锌锌精矿电解锌锌合金氧化锌锌粉锡锡精矿锡锭锡材镁兰炭硅铁镁锭

稀有金属

稀土稀土矿稀土氧化物稀土金属钕铁硼 稀散金属锑铋铟锗镓硒钽铌锆 贵金属白银钨钨精矿 APT(仲钨酸铵)钨粉碳化钨钨酸钠钨条钨铁钨材钼钼精矿工业氧化钼钼铁钼化工高纯三氧化钼钼金属钛钛精矿钛渣四氯化钛海绵钛钛金属钛白粉

新能源

锂锂矿锂化合物金属锂镍镍矿镍铁精炼镍镍盐高冰镍 MHP 钴电解钴钴粉氯化钴四氧化三钴硫酸钴钴中间品氧化钴碳酸钴钴酸锂锰锰矿电解锰电池级硫酸锰 锂电正负极三元前驱体磷酸铁正极材料石油焦针状焦包覆沥青人造石墨硅碳负极硅氧负极 电解液隔膜隔膜电解液电芯硅硅石有机硅硅粉三氯氢硅工业硅再生硅光伏多晶硅硅片电池片组件组件成本指数海外组件废旧组件

基于事后回顾和渐进式扩展的持续强化学习非完全信息博弈方法及装置

1041 编辑：管理员来源：北方有色网

2023-03-19 07:00:51

本发明公开了一种基于事后回顾和渐进式扩展的持续强化学习非完全信息博弈方法及装置，包括下述步骤：获取非完全博弈环境，确定任务目标；构建第一神经网络和基于未来值预测的强化学习方法；构建事后经验回顾池；对第一神经网络进行训练，直至第一神经网络收敛；构建渐进式神经网络，实现网络模型的渐进式扩展；选择下一个任务作为任务目标，利用基于未来值预测的强化学习方法持续训练，直至所有的任务都训练完成。本发明通过使用非完全信息博弈场景中丰富的智能体状态变化作为监督信号，解决该环境下的奖励稀疏问题，同时引入持续学习框架渐进式神经网络对未来值预测网络结构进行动态扩展，解决了在该环境下的多任务场景中的灾难性遗忘的问题。

登录解锁全文

声明：

“基于事后回顾和渐进式扩展的持续强化学习非完全信息博弈方法及装置” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究，如用于商业用途，请联系该技术所有人。

我是此专利(论文)的发明人(作者)